Mikroagregācija

Mikroagregācija grupē līdzīgus ierakstus un aizstāj oriģinālās individuālās vērtības ar grupas vidējo vērtību. Visbiežāk šo metodi lieto skaitliskiem parametriem, bet pastāv arī metodes, kas ļauj mikroagregāciju izmantot kategoriskiem datiem.  

Piemērs 

Aplūkojot pēc datu dzēšanas iegūto tabulu, redzams, ka šoreiz lietota mikroagregācija, lai pārveidotu attiecīgo kolonnu datus. Šajā piemērā mikroagregācija izmantota parametram “vecums”.  
Oriģinālie dati 
ID Vecums Pilsēta Diagnoze
101 35 Sigulda Hipertensija
102 28  Ape Diabēts
103 40 Dobele Migrēna
104 32 Suntaži Multiplā skleroze 
105 22 Rīga  Astma 
106 44 Liepāja  Hipertensija 
Datu kopā vecums apvienots grupās 2029, 30—39 un 40—49, un katrā grupā tiek aprēķināta vidējā vērtība, kura aizstāj oriģinālo ierakstu. 
Anonimizēta datu kopa pēc vecuma mikroagregācijas 
ID Vecums Pilsēta Diagnoze
101 34 Sigulda Hipertensija
102 25  Ape Diabēts
103 42 Dobele Migrēna
104 34 Suntaži Multiplā skleroze 
105 25 Rīga  Astma 
106 42 Liepāja  Hipertensija 
Protams, arī pirms datu mikroagregācijas rūpīgi jāapsver, vai šādi apstrādāta informācija ļaus veikt iecerēto datu analīzi. 

Mikroagregācija

Mikroagregācija grupē līdzīgus ierakstus un aizstāj oriģinālās individuālās vērtības ar grupas vidējo vērtību. Visbiežāk šo metodi lieto skaitliskiem parametriem, bet pastāv arī metodes, kas ļauj mikroagregāciju izmantot kategoriskiem datiem.  

Piemērs 

Aplūkojot pēc datu dzēšanas iegūto tabulu, redzams, ka šoreiz lietota mikroagregācija, lai pārveidotu attiecīgo kolonnu datus. Šajā piemērā mikroagregācija izmantota parametram “vecums”.  
Oriģinālie dati 
ID Vecums Pilsēta Diagnoze
101 35 Sigulda Hipertensija
102 28  Ape Diabēts
103 40 Dobele Migrēna
104 32 Suntaži Multiplā skleroze 
105 22 Rīga  Astma 
106 44 Liepāja  Hipertensija 
Datu kopā vecums apvienots grupās 2029, 30—39 un 40—49, un katrā grupā tiek aprēķināta vidējā vērtība, kura aizstāj oriģinālo ierakstu. 
Anonimizēta datu kopa pēc vecuma mikroagregācijas 
ID Vecums Pilsēta Diagnoze
101 34 Sigulda Hipertensija
102 25  Ape Diabēts
103 42 Dobele Migrēna
104 34 Suntaži Multiplā skleroze 
105 25 Rīga  Astma 
106 42 Liepāja  Hipertensija 
Protams, arī pirms datu mikroagregācijas rūpīgi jāapsver, vai šādi apstrādāta informācija ļaus veikt iecerēto datu analīzi.