Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában
description
Transcript of Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában
![Page 1: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/1.jpg)
1
Anonimizálási és adathozzáférési eljárások a hivatalos statisztika
gyakorlatában
Szép Katalin – Gadácsi Katalin KSHFényes Elek Műhely
2010. május 26.
![Page 2: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/2.jpg)
2
Vázlat
1. Alapok: statisztikai cél
2. Adatkiadás, kockázatok, csatornák
3. Alapelvek
4. Dilemmák
5. Eurostat gyakorlat, fejlesztési irányok
6. Záró gondolatok
![Page 3: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/3.jpg)
3
Milyen adatok vannak?
„ 2008-ban XYZ Kft. nettó árbevétele 345678 ezer Ft ”
• Adóbevallás – adminisztratív adat
• KSH kérdőív – statisztikai adat
• …
![Page 4: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/4.jpg)
4
Mitől függ?
Minden esetben adott egységre vonatkozik, de a cél különbözik:
• Igazgatási/adminisztratív –felhasználása közvetlenül az adott egységet érinti, adott egységre vonatkozó intézkedések alapja
• Statisztikai – sokaságot akarjuk jellemezni.
![Page 5: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/5.jpg)
5
Adatgyűjtés – feldolgozás - használat
Adminisztratív célAdatgyűjtés Ellenőrzés, Egységet
érintő
nyilvántartás intézkedés
Statisztikai célAdatgyűjtés Adatellenőrzés,ösz- Sokaságot
szesítés, becslés jellemző adat
![Page 6: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/6.jpg)
6
Adatgyűjtés – feldolgozás - használat
Adminisztratív célAdatgyűjtés Ellenőrzés, Egységet
érintő
nyilvántartás intézkedés
Statisztikai célAdatgyűjtés Adatellenőrzés,ösz- Sokaságot
szesítés, becslés jellemző adat
![Page 7: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/7.jpg)
7
Egy speciális kérdés: adat-összekapcsolás
• Célok– Költségcsökkentés– Adatszolgáltatói terheket ne növeljük– Meglévő adatokból max információ kinyerése
• Megoldás: adatösszekapcsolás– Kapcsolás a lehető legpontosabb adatokból– Összekapcsolt állomány gondos anonimizálása
(kapcsolás előtti anonimizálás rontja a kapcsolás minőségét, és nem biztos, hogy anonim kapcsolt állományt eredményez)
![Page 8: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/8.jpg)
8
EU Statisztikai Rendszer jövőképeCél: adatszolgáltatói terhek mérséklése, minőség javítása
Különböző adatforrások
Statisztikai elemzések
Feldolgozás
Forrás: Communication from the Commission to the European Parliament and the Council …COM(2009)404. 8. August 2009
![Page 9: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/9.jpg)
9
Statisztikai célból gyűjtött/kezelt adat csak statisztikai célra használható, azaz a sokaság jellemzésére.
Adatkiadáskor adminisztratív célra alkalmatlanná kell tenni, azaz ne legyen alkalmas egyedek azonosítására, egyedekre vonatkozó információ felfedésére.
![Page 10: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/10.jpg)
10
Milyen információ felfedését akadályozzuk meg?
• Ország kultúrájától függ.
• Magyarországon: – különleges adat (jogi alap)– érzékeny adat (vállalati, lakossági kultúra)
![Page 11: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/11.jpg)
11
Felfedés elleni védelem
• Felfedés kockázata függ:– Adat jellege (érzékeny, különleges+közvetlen és
közvetett azonosítást lehetővé tevő)– Adathasználat közvetlen célja, adathasználó
rendelkezésére álló egyéb információ, eszközök, nyilvántartás, adathasználó háttérintézményének feladata
– Jogi védelem lehetősége• Adatvédelem: felfedés elleni logikai, jogi, fizikai
védelem• Tökéletes védelem nincs, cél, hogy szokásos idő
és eszközráfordítással ne legyen felfedhető
![Page 12: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/12.jpg)
12
Felfedés tipikus esetei - Táblázatból
• Ha az érzékeny kategóriába túl kevés adatszolgáltató esik pl. személygépkocsi-gyártás megyei adatai
• Ha az érzékeny kategóriába túl sok/összes adatszolgáltató esik pl. „B régióban minden hajótulajdonos környezetszennyező”
Védelem: aggregálás, cellaelnyomás, kerekítés
![Page 13: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/13.jpg)
13
Felfedés tipikus esetei - Mikroadatokból
• Közvetlen azonosítókból (név, telephely, adószám)
• Ritka értékkombinációkból (főtevékenység, régió, létszámkategória)
Védelem: közvetlen azonosítók törlése, csonkolás, cellaelnyomás, átkódolás-kerekítés, összekeverés
![Page 14: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/14.jpg)
14
Főbb adatkiadási csatornák a KSH-ban
Kutatók a Hivatal kutató-szobájában
Jogi védelem
Eurostat Statisztikai Hivatal
Kutatók az Eurostat kutató-
szobájában
EU-s mikroadatot használó kutatók
Hazai mikroadatot használó kutatók
Nyilvánosság
c)
b)
a) a)
b)
c)
Felfed
és elleni
védelem
a) aggregált és mikroadatok nyilvánosságra hozása b) anonimizált mikroadatkiadás (kutatási célra) c) mikroadat-hozzáférés
![Page 15: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/15.jpg)
15
Adatkiadási/hozzáférési csatornák
• Táblázatos– Kész táblázatok (kiadványok, Stadat vagy
egyedi)– Adatbázisokból lekérdezéssel
• Mikroadat– Távoli hozzáférés– Kutatószoba– Adatállomány kiadása (kutatónak, v. publikus)– Adatállomány átadása kutatói adatbázisba
![Page 16: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/16.jpg)
16
• Maximális biztonság – minimális kockázat• Minimális információveszteség• Hatékonyság, összehangoltság• Megalapozottság
Különböző formában, különböző csatornákon
Egyenkockázat elve
Felfedés elleni védelem alapelvei
![Page 17: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/17.jpg)
17
Dilemmák az adatkiadásban
• Felhasználók megkülönböztetése – egyenkockázat elve
• Egyedi igényeknek megfelelő anonimizálás – kockázatnövekedés - erőforrásigény - ingyenesség
![Page 18: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/18.jpg)
18
EU: bizalmas adatokhoz való tudományos célú hozzáférés
Bizottság 831/2002/EK rendelete
Bizalmas adatok – statisztikai egység közvetlen azonosíthatóság nélkül
Bizalmas adatokhoz való hozzáférés – hivatali helységben, vagy anonimizált mikroadat kiadása
Kérelem: • Intézmény (egyetem, tudományos kutatóintézet,
statisztikai intézet, EKB, jegybankok) Bizottság 2004/452/EK határozata a szervezetek jegyzékéről
• Kutatók• Kutatási cél• Adatállomány
![Page 19: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/19.jpg)
19
![Page 20: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/20.jpg)
20
Fejlesztési irányok a világban
• Nemzetközi összehasonlítási igény, lehetőség • Új technikai lehetőségek (távoli hozzáférés,
adatbázisok mérete, hozzáférési eszközök, adatelemzési eszközök)
• Speciális kérések, kérdések
Válaszok: kutatás, fejlesztés a felfedés elleni logikai védelemben, informatikai, jogi eszközökben
![Page 21: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/21.jpg)
21
Adatvédelmi fejlesztések az EU-ban
• Adatvédelmi kézikönyv felülvizsgálata– érthetőség
• Hozzáférés mikroadatokhoz EU szinten (Eurostaton keresztül)– Intézményi engedélyeztetés egyszerűsítése– Adatállományok bővítése
• Hozzáférés kutatószobák hálózatán keresztül– Kutatószobák standardja– Anonimizálás, felhasználók minősítése,
dokumentáció, szerződés standardja– Szabályozás standardizálása
![Page 22: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/22.jpg)
22
Fejlesztések a KSH-ban
• Részvétel EU grantokban/fejlesztésekben
• Adathozzáférési csatornák bővítése
• Adatvédelmi szempontok egységesítése
Csökkenő pénzügyi erőforrások, igen korlátozott emberi kapacitások mellett.
![Page 23: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/23.jpg)
23
Összegzés (1)
Statisztikai célokat szolgáló adat csak úgy adható ki (statisztikai szolgálaton kívülre), hogy ne szolgálhasson közvetlenül adminisztratív intézkedés alapjául.
Eszköz: felfedés elleni logikai, technikai, jogi védelem
Kiadható anonimizált mikroadat, biztonságos táblázat.
![Page 24: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában](https://reader036.fdocuments.net/reader036/viewer/2022062323/56815931550346895dc66692/html5/thumbnails/24.jpg)
24
Összegzés (2)
• Statisztikai célnak való megfelelés– Befogadhat egyedi adatot– Kiad csak anonimizált adatot
• Mikroadatkiadáshoz– Termelési folyamat átalakítása– Módszertani felkészülés– Költség és emberi erőforrásigény
• Jogi környezet (koncepcionális összhang, EU konformitás)