Datu sajaukšana – DataverseLV

Datu sajaukšananauris_b23k2025-07-21T14:57:00+02:00

Datu sajaukšana

Datu sajaukšana (angliski: randomization) ir paņēmienu kopums, kas maina datu patiesumu, lai novērstu ciešo saikni starp datiem un personu. Tā pamatā ir pētījuma datu vērtību secības samainīšana tabulas kolonnās tā, lai vairs nebūtu izsekojama reālā saistība starp konkrētiem rādītājiem. Kopējais priekšstats par datiem nemainās.

Piemērs

Attēlotajā piemērā tiks sajaukti dati kolonnā "Pilsēta". Jāatceras, ka, lietojot datu sajaukšanu, vairs nebūs iespējams noteikt saistību starp parametriem, aprēķināt korelācijas un regresijas, tāpēc šo metodi ieteicams izmantot tiem datiem, kas tikai vispārīgi raksturo pētījuma populāciju.

Oriģinālie dati

ID	Vecums	Pilsēta	Diagnoze
101	35	Sigulda	Hipertensija
102	28	Ape	Diabēts
103	40	Dobele	Migrēna
104	32	Suntaži	Multiplā skleroze
105	22	Rīga	Astma
106	44	Liepāja	Hipertensija

Anonimizētā datu kopa pēc pilsētu datu sajaukšanas

ID	Vecums	Pilsēta	Diagnoze
101	35	Suntaži	Hipertensija
102	28	Sigulda	Diabēts
103	40	Dobele	Migrēna
104	32	Ape	Multiplā skleroze
105	22	Liepāja	Astma
106	44	Rīga	Hipertensija

Mikroagregācija

Trokšņa pievienošana

Datu sajaukšana

Datu sajaukšana (angliski: randomization) ir paņēmienu kopums, kas maina datu patiesumu, lai novērstu ciešo saikni starp datiem un personu. Tā pamatā ir pētījuma datu vērtību secības samainīšana tabulas kolonnās tā, lai vairs nebūtu izsekojama reālā saistība starp konkrētiem rādītājiem. Kopējais priekšstats par datiem nemainās.

Piemērs

Attēlotajā piemērā tiks sajaukti dati kolonnā "Pilsēta". Jāatceras, ka, lietojot datu sajaukšanu, vairs nebūs iespējams noteikt saistību starp parametriem, aprēķināt korelācijas un regresijas, tāpēc šo metodi ieteicams izmantot tiem datiem, kas tikai vispārīgi raksturo pētījuma populāciju.

Oriģinālie dati

ID	Vecums	Pilsēta	Diagnoze
101	35	Sigulda	Hipertensija
102	28	Ape	Diabēts
103	40	Dobele	Migrēna
104	32	Suntaži	Multiplā skleroze
105	22	Rīga	Astma
106	44	Liepāja	Hipertensija

Anonimizētā datu kopa pēc pilsētu datu sajaukšanas

ID	Vecums	Pilsēta	Diagnoze
101	35	Suntaži	Hipertensija
102	28	Sigulda	Diabēts
103	40	Dobele	Migrēna
104	32	Ape	Multiplā skleroze
105	22	Liepāja	Astma
106	44	Rīga	Hipertensija

Mikroagregācija

Trokšņa pievienošana

Finansējums

Mājaslapa izstrādāta projekta “Atbalsts atvērtās zinātnes ieviešanai praksē, kā arī izveidoti risinājumi zinātnes datu koplietošanai un dalībai ES atvērtajā zinātnes mākonī” ietvaros (ANM projekta Nr. 2.1.3.1.i) ar Eiropas Savienības Atveseļošanas fonda un Latvijas valsts finansiālo atbalstu.

Asset 3

Privātuma politika

Lietošanas noteikumi

Vienošanās par datu deponēšanu

Piekļūstamības paziņojums

Finansējums

Mājaslapa izstrādāta projekta “Atbalsts atvērtās zinātnes ieviešanai praksē, kā arī izveidoti risinājumi zinātnes datu koplietošanai un dalībai ES atvērtajā zinātnes mākonī” ietvaros (ANM projekta Nr. 2.1.3.1.i) ar Eiropas Savienības Atveseļošanas fonda un Latvijas valsts finansiālo atbalstu.

Asset 3

Privātuma politika

Lietošanas noteikumi

Vienošanās par datu deponēšanu

Piekļūstamības paziņojums

Finansējums

Mājaslapa izstrādāta projekta “Atbalsts atvērtās zinātnes ieviešanai praksē, kā arī izveidoti risinājumi zinātnes datu koplietošanai un dalībai ES atvērtajā zinātnes mākonī” ietvaros (ANM projekta Nr. 2.1.3.1.i) ar Eiropas Savienības Atveseļošanas fonda un Latvijas valsts finansiālo atbalstu.

Asset 3

Privātuma politika

Lietošanas noteikumi

Vienošanās par datu deponēšanu

Piekļūstamības paziņojums