2026. gada 26. janvārī Latvijas datu kuratoru tīkla un Vienotā pakalpojumu centra (VPC) pārstāvji Mikus Melderis un Artūrs Svarinskis piedalījās profesionālās pilnveides darbseminārā Anonymization and Synthetic Data – Methods, Tools, and Applications, kas norisinājās Oltenā, Šveicē. Pasākuma programmā tika aplūkoti datu anonimizācijas metodoloģijas jautājumi, sintētisko datu ģenerēšana, kā arī šo procesu tehniskie un juridiskie aspekti.

Norises laikā tika uzsvērts, ka, lai gan atvērto datu politika ir fundamentāls mūsdienu pētniecības aspekts, vienlaikus ir būtiski nodrošināt privāto un sensitīvo datu aizsardzību atilstoši Eiropas Savienības Vispārīgajai datu aizsardzības regulai (VDAR). Uz risku analīzi balstīta datu anonimizācija ir efektīvs risinājums, kas sniedz iespēju publiskot pētniecības datus, vienlaikus garantējot dalībnieku konfidencialitāti un ievērojot sabiedrības intereses.

Semināra gaitā tika analizēts anonimizācijas un pseidonimizācijas juridiskais pamatojums Eiropas Savienības, Šveices, Lielbritānijas un ASV tiesiskajā regulējumā. Eksperti uzsvēra, ka pielietoto metožu efektivitāte ir tieši atkarīga no pētījuma specifikas un datu rakstura. Galvenie anonimizācijas kvalitātes kritēriji ir reidentifikācijas riska mazināšana un datu lietderības (utility) saglabāšana turpmākai pētniecībai.

Darbsemināra praktiskajā daļā dalībniekiem bija iespēja izmēģināt R/RStudio izstrādes vides izmēģināšanai, izmantojot sdcMicro pakotni. Šis rīks piedāvā plašas iespējas tiešo un netiešo identifikatoru transformēšanai, tostarp datu agregācijai, informācijas slēpšanai un statistiskā trokšņa pievienošanai, vienlaikus saglabājot datu kopas statistisko reprezentativitāti.

Iegūtās zināšanas, metodiskie materiāli un praktiskie R skriptu paraugi kalpos par pamatu datu kuratoru kompetenču stiprināšanai sensitīvu datu pārvaldībā. Plānots, ka šīs zināšanas tiks integrētas datu kuratoru tīkla darbībā un nodotas Latvijas pētnieku kopienai, veicinot drošu un kvalitatīvu pētniecības datu apriti.