EDPS: Federated learning

EDPS: Federated learning
19. 06. 2025 objavil/a Info Hiša

EDPS je v zadnjem obvestilu o novih tehnologijah (TechDispatch) izpostavil Federated learning, ki predstavlja nov pristop k strojnemu učenju, ki omogoča učenje skupnega modela na različnih virih podatkov.

Poročilo je bilo objavljeno 10.6.2025

TechDispatches poročila vsebujejo opise, predhodne ocene vpliva na zasebnost in priporočeno branje za posamezno tehnologijo. Nekatere vsebine TechDipatch se lahko dotikajo tehnologij, vključenih v TechSonar (npr. digitalna valuta centralne banke), druge pa morda ne (npr. prepoznavanje obraznih čustev). TechDispatches se, kolikor je mogoče, izogibajo tehničnemu ali pravnemu žargonu, vendar vključujejo premisleke o vplivu tehnologij na uporabo načel GDPR in pravice posameznikov.

Federated učenje (FL) predstavlja obetaven pristop k strojnemu učenju (ML), saj omogoča, da več virov podatkov (naprav ali entitet) skupaj uči skupni model, hkrati pa ohranja decentralizacijo podatkov. Ta pristop zmanjšuje tveganja za zasebnost, saj surovi podatki ostanejo na lokalnih virih, kar je še posebej koristno v primerih, ko občutljivost podatkov ali regulativne zahteve ne dovolijo centralizacije podatkov. Uporaba FL je raznolika in zajema personalizirana priporočila, analizo zdravstvenih podatkov in avtonomne transportne sisteme, kjer je zagotavljanje zasebnosti in varstva podatkov najpomembnejše.

Z vidika varstva osebnih podatkov FL ponuja znatne prednosti z zmanjšanjem deljenja osebnih podatkov. Ta decentraliziran pristop je usklajen s temeljnimi načeli varstva podatkov, kot sta minimizacija podatkov in omejitev namena, saj zagotavlja, da osebni podatki ostanejo pod nadzorom upravljavca in niso izpostavljeni zunanjim deležnikom. Poleg tega FL izboljšuje odgovornost in preglednost, saj imajo upravljavci podatkov jasnejši nadzor nad obdelavo osebnih podatkov. Poleg tega lahko FL s shranjevanjem surovih podatkov na lokalnih napravah/strežnikih in deljenjem le modelov ali posodobitev modelov izboljša zaupnost osebnih podatkov, kar omejuje potrebo po centralizaciji in zmanjšuje vpliv morebitnih obsežnih kršitev podatkov.

Kljub svojim prednostim FL prinaša nekatere izzive, ki še vedno niso v celoti rešeni. Ena glavnih skrbi je možnost uhajanja podatkov prek posodobitev modelov, saj bi napadalec lahko tudi brez neposrednega dostopa do surovih podatkov sklepal na občutljive informacije z analizo gradientov ali uteži, ki si jih delijo naprave (in centralni strežnik, kjer ta obstaja). Ta ranljivost odpira vrata napadom sklepanja, kjer lahko nasprotniki ugotovijo, ali so bile določene podatkovne točke del učnega nabora. Poleg tega je treba varnost izvajati v celotnem ekosistemu, sicer bi imeli napadalci možnost napasti najšibkejšo povezavo in tako ogroziti celoten sistem. Poleg tega mora FL vzpostaviti posebne ukrepe za zagotavljanje kakovosti porazdeljenih učnih podatkov in biti nepristranski, ko se podatki obdelujejo za predvideni namen. V primerjavi z arhitekturami, ki ne uporabljajo FL, ima FL drugačne vektorje groženj, ki lahko vplivajo na integriteto podatkov, zato je treba zasnovati in izvesti ustrezne ukrepe.

Podatki, izmenjani med odjemalskimi napravami, in nastali modeli strojnega učenja se ne morejo obravnavati kot anonimni podatki; opraviti je treba skrbno tehnično in pravno analizo, da se analizira narava podatkov, tveganja, povezana s posodobitvami modelov, in ukrepi, ki jih je treba uporabiti za ublažitev teh tveganj.

Da bi v celoti izkoristili prednosti FL in hkrati obravnavali njegove izzive, je bistvenega pomena celosten pristop k dejanski obdelavi osebnih podatkov. To vključuje izvajanje sistemskih arhitektur, ki dajejo prednost privzetem in vgrajenem varstvu podatkov, ter zagotavljajo, da se dostop do podatkov med različnimi deležniki izvaja ob uravnoteženju stopnje tveganja obdelave, natančnosti in uporabnosti nastalega modela.

Z osredotočanjem na zasebnost in varstvo osebnih podatkov se lahko FL učinkovito uporablja za razvoj sistemov umetne inteligence, ki so hkrati zmogljivi in spoštujejo pravice in svoboščine uporabnikov.

Celotno poročilo je dostopno tukaj

Vir: EDPS

Naslovna slika: RawPixel