Nezakoniti data scraping

Nezakoniti data scraping
29. 10. 2024 objavil/a Info Hiša

Norveški nadzorni organ je v sodelovanju z Global Privacy Assembly objavil dodatno izjavo na temo praks nezakonitega strganja podatkov na internetu.

Novica je bila objavljena 28.10.2024

Strganje podatkov pomeni, da programska oprema preišče platforme in spletna mesta, da tako lahko zbere velike količine informacij, kar lahko predstavlja izziv glede zasebnosti, še posebej če se zbirajo in na škodljive načine uporabljajo tudi osebni podatki. Hkrati je strganje podatkov postalo izrazito pomembna tema, ker se številni modeli UI usposabljajo na tako pridobljenih podatkih.

Skupina nadzornih organov je poleti 2023 pripravila skupno izjavo o strganju podatkov, s katero so pozvali glavne platforme družabnih omrežij, naj zaščitijo javne objave uporabnikov pred strganjem. Od takrat je skupina začela dialog z več največjimi družabnimi platformami. Namen je bil izvedeti več o njihovih izkušnjah s strganjem podatkov, izzivih, s katerimi se soočajo, in o tem, kaj počnejo, da bi se jim zoperstavili.

V središču nove izjave so zahteve, ki morajo biti izpolnjene, kadar želijo podjetja dovoliti strganje podatkov za zakonite namene. Pravila o zasebnosti je še vedno treba upoštevati in obstajajo številni ukrepi, ki jih je treba izvesti. V izjavi je tudi zapisano, da pravila na področju zasebnosti določajo, ali in v kakšnem obsegu je mogoče tako zbrane podatke uporabiti za usposabljanje modelov umetne inteligence, na primer velikih jezikovnih modelov (LLM). Strganje osebnih podatkov in njihova uporaba za razvoj umetne inteligence tako ni samoumevna.

Sodelovanje izhaja iz delovne skupine v Global Privacy Assembly (globalprivacyassembly.org) in je privedlo do globljega razumevanja izzivov, s katerimi se soočajo podjetja pri zaščiti pred nezakonitim strganjem, vključno z vedno bolj izpopolnjenimi orodji strganja, nenehnim napredkom v tehnologiji strganja in težavami pri razlikovanju med avtomatiziranimi skriptami in pravimi uporabniki. Nova izjava ponuja pregled ukrepov, kako lahko podjetja pristopijo k različnim izpostavljenim vprašanjem.

Izpostavljeni so naslednji ukrepi:

  • Uvedba kombinacije zaščitnih ukrepov, ki jih je treba redno pregledovati in posodabljati, da bodo v koraku z napredkom v tehnikah in tehnologijah strganja.

  • UI lahko predstavlja del rešitve, ki služi za izboljšanje zaščite pred nezakonitim strganjem.

  • Obveznost zaščite pred nezakonitim strganjem velja tako za velike korporacije kot za mala in srednja podjetja.

  • Pogodbeni pogoji o strganju podatkov ne morejo zagotoviti, da je strganje zakonito; lahko pa so pomembna varovalka.

  • Vsi, ki strganje dovolijo, morajo nedvoumno zagotoviti, da imajo za to pravno podlago, ter da je obdelava transparentna, hkrati pa morajo pridobiti soglasje, kjer to obvezno.

  • Organizacije bi morale izvajati tudi ustrezne ukrepe, za zagotavljanje, da je pogodbeno dovoljena uporaba postrganih osebnih podatkov tudi zakonita.

  • Dostop za strganje z uporabo aplikacijskega programskega vmesnika (API) lahko omogoči organizaciji večji nadzor nad podatki ter olajša odkrivanje in preprečevanje nepooblaščenega strganja.

  • Socialna omrežja in druge organizacije, ki uporabljajo postrgane nabore podatkov in/ali uporabljajo podatke iz lastnih platform za usposabljanje umetne inteligence, kot so veliki jezikovni modeli, morajo upoštevati veljavno zakonodajo in smernice.

Izjavo je podpisalo 18 članov skupine International Enforcement Cooperation Working Group (“IEWG”); nadzorni organi Španije, Velike Britanskim, Švice, Monaka, Norveške, Avstralije, Kanade, Hong Konga, Nove Zelandije, Kolumbije, Jerseyja, Maroka, Argentine, Izraela in Mehike.

Celotna izjava je dostopna tukaj

Vir: Datatilsynet

Naslovna slika: Shutterstock