Datu dzēšana
Datu dzēšana ir viena no visvienkāršākajām anonimizācijas metodēm. Tā ir sensitīvo datu dzēšana no datu kopas. Tas var tikt darīts gadījumos, kad sensitīvie dati vairs nav nepieciešami, tos nav vajadzības papildināt un turpmāk tie netiks izmantoti datu analīzē. Šo metodi var ērti izmantot tiešajiem identifikatoriem, savukārt netiešajiem identifikatoriem, iespējams, jālieto citas anonimizācijas metodes.
Piemērs
Oriģinālie dati satur tiešos identifikatorus (vārds, uzvārds, personas kods, telefona numurs un studenta apliecības numurs) un netiešos identifikatorus (vecums, pilsēta, diagnoze). Šajā piemērā dzēšanu var piemērot tikai tiešajiem identifikatoriem, jo tie netiks izmantoti datu analīzē; pretējā gadījumā nāktos dzēst gandrīz visu datu kopu.
Oriģinālie dati
ID | Vārds, uzvārds | Vecums | Pilsēta | Personas kods | Telefons | Diagnoze |
---|---|---|---|---|---|---|
101 | Jānis Bērziņš | 35 | Sigulda | 120390-***** | 29123456 | Hipertensija |
102 | Anna Kalniņa | 28 | Ape | 040795-***** | 26789012 | Diabēts |
103 | Pēteris Ozols | 40 | Dobele | 3150882-***** | 22334455 | Migrēna |
104 | Laura Liepa | 32 | Suntaži | 080188-***** | 26543218 | Multiplā skleroze |
Dzēš kolonnas, kas satur tiešos personas identifikatorus.
Anonimizēti dati (pēc tiešo identifikatoru dzēšanas)
ID | Vecums | Pilsēta | Diagnoze |
---|---|---|---|
101 | 35 | Sigulda | Hipertensija |
102 | 28 | Ape | Diabēts |
103 | 40 | Dobele | Migrēna |
104 | 32 | Suntaži | Multiplā skleroze |