Datu dzēšana

Datu dzēšana ir viena no visvienkāršākajām anonimizācijas metodēm. Tā ir sensitīvo datu dzēšana no datu kopas. Tas var tikt darīts gadījumos, kad sensitīvie dati vairs nav nepieciešami, tos nav vajadzības papildināt un turpmāk tie netiks izmantoti datu analīzē. Šo metodi var ērti izmantot tiešajiem identifikatoriem, savukārt netiešajiem identifikatoriem, iespējams, jālieto citas anonimizācijas metodes. 

Piemērs 

Oriģinālie dati satur tiešos identifikatorus (vārds, uzvārds, personas kods, telefona numurs un studenta apliecības numurs) un netiešos identifikatorus (vecums, pilsēta, diagnoze). Šajā piemērā dzēšanu var piemērot tikai tiešajiem identifikatoriem, jo tie netiks izmantoti datu analīzē; pretējā gadījumā nāktos dzēst gandrīz visu datu kopu.  
Oriģinālie dati 

 

ID Vārds, uzvārds  Vecums  Pilsēta  Personas kods  Telefons  Diagnoze 
101 Jānis Bērziņš  35 Sigulda  120390-*****  29123456  Hipertensija 
102 Anna Kalniņa  28 Ape  040795-*****  26789012  Diabēts 
103 Pēteris Ozols  40 Dobele  3150882-***** 22334455  Migrēna 
104 Laura Liepa  32 Suntaži  080188-*****  26543218  Multiplā skleroze 
Dzēš kolonnas, kas satur tiešos personas identifikatorus.  
Anonimizēti dati (pēc tiešo identifikatoru dzēšanas) 

 

ID Vecums Pilsēta Diagnoze 
101 35 Sigulda Hipertensija
102 28 Ape Diabēts
103 40  Dobele Migrēna
104 32 Suntaži Multiplā skleroze 
Reizēm arī pēc tiešo identifikatoru dzēšanas ir iespējams identificēt personu, piemēram, pēc citām unikālām pazīmēm vai to kombinācijas. Šādos gadījumos jāapsver vēl kādas citas anonimizācijas metodes izmantošana vai kāda mainīgā unikālās vērtības dzēšana.