Jaucējfunkcijas (angliski: hash functions)
Jaucējfunkcijas ir matemātiski algoritmi, kas sistēmiski un neatgriezeniski pārveido oriģinālos datus neatpazīstamā formā. Jebkura izmēra ievaddati (piemēram, vārds vai personas kods) tiek pārveidots par fiksēta garuma virkni, ko sauc par jaucējvērtību jeb kontrolsummu.
Šī ir viena virziena funkcija — no jaucējvērtības gandrīz nav iespējams atjaunot oriģinālo vērtību. Izmantojot jaucējfunkciju, tā pati ievadvērtība vienmēr radīs to pašu jaucējvērtību, līdz ar to pat nelielas izmaiņas ievaddatos radīs pilnīgi atšķirīgu jaucējvērtību.
Izmantojot jaucējfunkcijas, nav nepieciešams veidot atslēgas datni. Tomēr atsevišķā tabulā jānoglabā oriģinālās vērtības, kas tiks izmantotas personu identificēšanai, kā arī jāpiefiksē jaucējvērtības pārrēķināšanai.
Oriģinālo vērtību tabulu nepieciešams glabāt atsevišķi no pseidonimizētajiem pētniecības datiem vietā, kur tiek nodrošināta piekļuves kontrole, šifrēšana un drošības pasākumi sensitīvu datu glabāšanai. Tā ir pieejama tikai pētniekam, kuram nepieciešams zināt personu īstās identitātes (piemēram, vadošajam pētniekam), bet nav pieejama citiem. Izmantojot jaucējfunkcijas pseidonimizācijai, ieteicams lietot plaši izplatītus algoritmus, piemēram, SHA-2, SHA-3 vai SHA-256). Jaucējfunkcijas ir pieejamas gan Python (piemēram, hashlib bibliotēkā), gan R (piemēram, digest pakotnē).
Piemērs
Jaucējfunkcijas izmantošana pseidonimizācijā soli pa solim:
-
Izvēlas piemērotu jaucējalgoritmu (piemēram, SHA-256)
-
Atlasa identifikatoru, ko nepieciešams pseidonimizēt (piemēram, “Jānis Bērziņš”, “Līga Ozola”, “Kārlis Priedītis”)
-
Jaucējalgoritms pārveido šo tekstu fiksēta garuma ciparu un burtu virknē (piemēram, “5d41402abc4b2a76b9719d911017c592”)
-
Šī jaucējvērtība aizstāj oriģinālo identifikatoru viscaur datu kopā
Oriģinālie dati
Vārds, uzvārds |
Fakultāte |
Fiziskās aktivitātes līmenis |
Jānis Bērziņš |
Datorzinātņu |
Zems |
Līga Ozola |
Medicīnas |
Vidējs |
Kārlis Priedītis |
Sociālo zinātņu |
Vidējs |
Pseidonimizētajā datu kopā, izmantojot jaucējfunkciju SHA-256, vārdu un uzvārdu aizstāj jaucējvērtība.
Pseidonimizētā datu kopa (piemērs)
Jaucējvērtība |
Fakultāte |
Fiziskās aktivitātes līmenis |
7b9d67f94873e2d4c7874bc5742227c7b0d44fad343e29e9686dd2608b489985 |
Datorzinātņu |
Zems |
9f9dda4086fb4a6430ea3518aa5f724dc9d1c134d0eee44580edca19b62e0d3f |
Medicīnas |
Vidējs |
f3cf16d99e4e05d5ec35528bcbbe9d4fa40d86e7a19bba202d8f07b9a9b0d663 |
Sociālo zinātņu |
Vidējs |
Oriģinālo vērtību tabula (satur personas datus; tiek glabāta atsevišķi, drošā vietā)
Vārds, uzvārds |
Jānis Bērziņš |
Līga Ozola |
Kārlis Priedītis |