Mikroagregācija
Mikroagregācija grupē līdzīgus ierakstus un aizstāj oriģinālās individuālās vērtības ar grupas vidējo vērtību. Visbiežāk šo metodi lieto skaitliskiem parametriem, bet pastāv arī metodes, kas ļauj mikroagregāciju izmantot kategoriskiem datiem.
Piemērs
Aplūkojot pēc datu dzēšanas iegūto tabulu, redzams, ka šoreiz lietota mikroagregācija, lai pārveidotu attiecīgo kolonnu datus. Šajā piemērā mikroagregācija izmantota parametram “vecums”.
Oriģinālie dati
ID | Vecums | Pilsēta | Diagnoze |
---|---|---|---|
101 | 35 | Sigulda | Hipertensija |
102 | 28 | Ape | Diabēts |
103 | 40 | Dobele | Migrēna |
104 | 32 | Suntaži | Multiplā skleroze |
105 | 22 | Rīga | Astma |
106 | 44 | Liepāja | Hipertensija |
Datu kopā vecums apvienots grupās 20—29, 30—39 un 40—49, un katrā grupā tiek aprēķināta vidējā vērtība, kura aizstāj oriģinālo ierakstu.
Anonimizēta datu kopa pēc vecuma mikroagregācijas
ID | Vecums | Pilsēta | Diagnoze |
---|---|---|---|
101 | 34 | Sigulda | Hipertensija |
102 | 25 | Ape | Diabēts |
103 | 42 | Dobele | Migrēna |
104 | 34 | Suntaži | Multiplā skleroze |
105 | 25 | Rīga | Astma |
106 | 42 | Liepāja | Hipertensija |
Protams, arī pirms datu mikroagregācijas rūpīgi jāapsver, vai šādi apstrādāta informācija ļaus veikt iecerēto datu analīzi.
Mikroagregācija
Mikroagregācija grupē līdzīgus ierakstus un aizstāj oriģinālās individuālās vērtības ar grupas vidējo vērtību. Visbiežāk šo metodi lieto skaitliskiem parametriem, bet pastāv arī metodes, kas ļauj mikroagregāciju izmantot kategoriskiem datiem.
Piemērs
Aplūkojot pēc datu dzēšanas iegūto tabulu, redzams, ka šoreiz lietota mikroagregācija, lai pārveidotu attiecīgo kolonnu datus. Šajā piemērā mikroagregācija izmantota parametram “vecums”.
Oriģinālie dati
ID | Vecums | Pilsēta | Diagnoze |
---|---|---|---|
101 | 35 | Sigulda | Hipertensija |
102 | 28 | Ape | Diabēts |
103 | 40 | Dobele | Migrēna |
104 | 32 | Suntaži | Multiplā skleroze |
105 | 22 | Rīga | Astma |
106 | 44 | Liepāja | Hipertensija |
Datu kopā vecums apvienots grupās 20—29, 30—39 un 40—49, un katrā grupā tiek aprēķināta vidējā vērtība, kura aizstāj oriģinālo ierakstu.
Anonimizēta datu kopa pēc vecuma mikroagregācijas
ID | Vecums | Pilsēta | Diagnoze |
---|---|---|---|
101 | 34 | Sigulda | Hipertensija |
102 | 25 | Ape | Diabēts |
103 | 42 | Dobele | Migrēna |
104 | 34 | Suntaži | Multiplā skleroze |
105 | 25 | Rīga | Astma |
106 | 42 | Liepāja | Hipertensija |