Kodu grāmata jeb datu vārdnīca

Kodu grāmata jeb datu vārdnīca ir strukturēts dokuments, kas apraksta datu kopas mainīgos un kā tie sakārtoti, tādējādi nodrošinot caurspīdīgumu, reproducējamību un efektīvu datu analīzi. Tā kalpo kā ceļvedis pētniekiem un citiem iesaistītajiem, atvieglojot datu pārvaldību un datu kopas atkalizmantošanu. 
Deponējot datu kopu repozitorijā, kodu grāmata ir jāiesniedz kopā ar datu kopām atsevišķi izveidotā dokumentā.  
Ja apraksts par datu kopas saturu, struktūru un mainīgajiem ir ietverts ReadMe datnē, tad atsevišķu kodu grāmatu nav nepieciešams sagatavot. 
Kodu grāmata parasti satur šādu informāciju: 
  • Mainīgo (variable) nosaukumi 
  • Mainīgo apraksti/skaidrojumi (label) (īss mainīgā apraksts vai tā pilns nosaukums) 
  • Datu veids/tips, piemēram, teksts (text), skaitliska vērtība (numeric), datums (date) 
  • Mērvienības/Diapazons/Formāts 
  • Kategoriju datu kodi un to atšifrējums, (piemēram, Likerta skalas mainīgajam var norādīt: 1 – Pilnībā nepiekrītu, 2 – Nepiekrītu, 3 – Neitrāli, 4 – Piekrītu, 5 – Pilnībā piekrītu) 
  • Aprēķini, kas izmantoti atvasināto mainīgo iegūšanai datu kopā, vai piezīmes par attiecībām starp mainīgajiem 
  • Nepieciešamības gadījumā komentāru sadaļa, piemēram, skaidrojums, kā datu kopā tika apzīmētas trūkstošās vērtības (NA/999 u.c.), iegūtā mērījuma veids (self-reported/ citādi mērīts), informācija par mēriekārtu u.tml. 
Trūkstošajiem datiem ieteicams izmanto kodus, nevis atstāt tukšus laukus (blanks). Ieteicams standartizēt šos kodus visā datu kopā (piemēram, NA = nav atbildēts).  
Ja trūkstošās vērtības datu kopā ir vairāku iemeslu dēļ, to var norādīt ar atšķirīgiem kodējumiem (piemēram, 999 = neatbildēts, 888 = nav piemērojams, 777 = kļūda datu ievadē). Svarīgi trūkstošajām vērtībām piemērot kodējumu, kas neiekļaujas mainīgā iespējamo vērtību diapazonā (piemēram, trūkstošās vecuma vērtības droši var kodēt ar 999, jo neviena dalībnieka vecums nevar ieņemt šo vērtību). 
Pēc kodu grāmatas izveides atcerieties saglabāt/konvertēt to ilgtspējīgā un savietojamā formātā. Vairāk informācijas par vēlamajiem formātiem skat. sadaļā “Datu kopas sagatavošana ilgtermiņa glabāšanai”. 

Piemērs 

Datu kopas piemērs (attēlotas pirmās 10 ierakstu rindas): 
Datu kopai atbilstošas kodu grāmatas piemērs: 

Kodu grāmata jeb datu vārdnīca

Kodu grāmata jeb datu vārdnīca ir strukturēts dokuments, kas apraksta datu kopas mainīgos un kā tie sakārtoti, tādējādi nodrošinot caurspīdīgumu, reproducējamību un efektīvu datu analīzi. Tā kalpo kā ceļvedis pētniekiem un citiem iesaistītajiem, atvieglojot datu pārvaldību un datu kopas atkalizmantošanu. 
Deponējot datu kopu repozitorijā, kodu grāmata ir jāiesniedz kopā ar datu kopām atsevišķi izveidotā dokumentā.  
Ja apraksts par datu kopas saturu, struktūru un mainīgajiem ir ietverts ReadMe datnē, tad atsevišķu kodu grāmatu nav nepieciešams sagatavot. 
Kodu grāmata parasti satur šādu informāciju: 
  • Mainīgo (variable) nosaukumi 
  • Mainīgo apraksti/skaidrojumi (label) (īss mainīgā apraksts vai tā pilns nosaukums) 
  • Datu veids/tips, piemēram, teksts (text), skaitliska vērtība (numeric), datums (date) 
  • Mērvienības/Diapazons/Formāts 
  • Kategoriju datu kodi un to atšifrējums, (piemēram, Likerta skalas mainīgajam var norādīt: 1 – Pilnībā nepiekrītu, 2 – Nepiekrītu, 3 – Neitrāli, 4 – Piekrītu, 5 – Pilnībā piekrītu) 
  • Aprēķini, kas izmantoti atvasināto mainīgo iegūšanai datu kopā, vai piezīmes par attiecībām starp mainīgajiem 
  • Nepieciešamības gadījumā komentāru sadaļa, piemēram, skaidrojums, kā datu kopā tika apzīmētas trūkstošās vērtības (NA/999 u.c.), iegūtā mērījuma veids (self-reported/ citādi mērīts), informācija par mēriekārtu u.tml. 
Trūkstošajiem datiem ieteicams izmanto kodus, nevis atstāt tukšus laukus (blanks). Ieteicams standartizēt šos kodus visā datu kopā (piemēram, NA = nav atbildēts).  
Ja trūkstošās vērtības datu kopā ir vairāku iemeslu dēļ, to var norādīt ar atšķirīgiem kodējumiem (piemēram, 999 = neatbildēts, 888 = nav piemērojams, 777 = kļūda datu ievadē). Svarīgi trūkstošajām vērtībām piemērot kodējumu, kas neiekļaujas mainīgā iespējamo vērtību diapazonā (piemēram, trūkstošās vecuma vērtības droši var kodēt ar 999, jo neviena dalībnieka vecums nevar ieņemt šo vērtību). 
Pēc kodu grāmatas izveides atcerieties saglabāt/konvertēt to ilgtspējīgā un savietojamā formātā. Vairāk informācijas par vēlamajiem formātiem skat. sadaļā “Datu kopas sagatavošana ilgtermiņa glabāšanai”. 

Piemērs 

Datu kopas piemērs (attēlotas pirmās 10 ierakstu rindas): 
Datu kopai atbilstošas kodu grāmatas piemērs: