Kaj so sintetični podatki
Sintetični podatki so sestavljeni iz izdelave novega in umetnega nabora podatkov iz izvirnega nabora podatkov, pri čemer se ohranijo statistične porazdelitve izvirnega nabora podatkov.
Članek je bil objavljen 12.2.2022
EDPS je na portalu TechSonar razložil pomen in primere uporabe sintetičnih podatkov.
Sintetični podatki se uporabljajo za:
razvoj modelov umetne inteligence, kjer je dostopnost podatkov redka ali jih je težko pridobiti. Na primer, za avtonomno vožnjo je mogoče umetno ustvariti cestne in prometne znake za boljše usposabljanje modelov umetne inteligence;
zlasti za raziskave, kjer je uporaba resničnih podatkov velika obremenitev skladnosti (na primer v zdravstvu);
sintetični podatki bi se lahko uporabili kot dopolnilni ukrep za mednarodne prenose podatkov, saj gre za tehnologijo, ki izboljšuje zasebnost.
Opozoriti velja, da je potrebno pri uporabi sintetičnih podatkov pomisliti tudi na možne slabosti.
Zakaj?
Prvič, organizacije morajo upoštevati predpise o varstvu podatkov v zvezi z izvirnim naborom podatkov. To pomeni, da se morajo upravljavci zanašati na ustrezno pravno podlago za obdelavo osebnih podatkov za prvotni namen kot tudi za sekundarni namen (ustvarjanje sintetičnih podatkov). To je lahko privolitev ali zakoniti interes ali drug pravni temelj; odvisno od primera.
Drugič, ni popolnoma zagotovljeno, da bo sintetični nabor podatkov izven področja uporabe določb o varstvu podatkov. Odvisno bo od stopnje določljivosti osebnih podatkov. In tukaj je bistvo zadeve, kajti bolj ko je sekundarni nabor podatkov podoben izvirniku (ohranjanje statističnih lastnosti in uporabnosti podatkov), večja je verjetnost, da bi bilo te podatke mogoče prepoznati in obratno; manj kot je sekundarni nabor podatkov podoben izvirniku (slabša uporabnost), manj verjetno je, da bo sintetični nabor podatkov vseboval določljive podatke.
Dostop do celotnega članka tukaj
Vir: EDPS
Naslovna fotografija: ShutterStock