Datu pārvaldības pamatjēdzieni
Atbilde: Pētniecības dati ir jebkura informācija, kas savākta, novērota vai radīta pētniecības projekta gaitā un kas kalpo kā pamats pētniecības rezultātu iegūšanai un secinājumu izdarīšanai. Pētniecības dati var būt:
-
Kvantitatīvi dati, piemēram, temperatūras vai spiediena mērījumi laboratorijas eksperimentos
-
Teksta dati, piemēram, interviju transkripti vai literatūras analīzes piezīmes
-
Attēlu dati, piemēram, mikroskopijas vai ģeogrāfisko karšu attēli
-
Video dati, piemēram, eksperimentu vai lauka pētījumu ieraksti
-
Audio dati, piemēram, pētnieku interviju vai skaņu novērojumu ieraksti
-
Programmatūras kods, piemēram, datu analīzes vai modelēšanas skripti
Atbilde: Dati, kas nav tieši saistīti ar zinātniskajiem pētījumiem, nav uzskatāmi par pētniecības datiem. Pētniecības dati nav:
-
Pētījuma administratīvie ieraksti, piemēram, finanšu pārskati vai personāla dokumenti
-
Komerciāla vai privāta saziņa pētījumā, piemēram, e-pasti vai sarakstes dokumenti
-
Juridiskie dokumenti, piemēram, darba līgumi vai sadarbības līgumi
-
Pētījuma mārketinga materiāli, piemēram, reklāmas bukleti
Šie dati neveicina pētniecības projekta zinātnisko analīzi vai pierādījumu bāzi, un līdz ar to tie nav uzskatāmi par pētniecības datiem.
Atbilde: Pētniecības datu pārvaldība (PDP) ir sistemātiska pieeja, kas ietver datu plānošanu, ievākšanu, uzglabāšanu, apstrādes un analīzes dokumentēšanu, koplietošanu un arhivēšanu. Tā ir svarīga, lai nodrošinātu datu kvalitāti, to ilgtermiņa pieejamību un iespēju atkārtoti izmantot tos citos pētījumos. PDP palīdz ievērot juridiskās un ētiskās prasības, kā arī nodrošina atbilstību pētījuma finansētāju prasībām.
Atbilde: FAIR principi ir vadlīnijas, kas palīdz uzlabot pētniecības datu pārvaldību un koplietošanu. Principi nosaka, ka pētniecības dati ir jāpadara:
-
Findable (atrodami): dati un to metadati ir viegli atrodami citiem pētniekiem un sistēmām
-
Accessible (pieejami): dati ir pieejami, un piekļuves nosacījumi ir skaidri norādīti
-
Interoperable (savietojami): dati ir saderīgi ar citām sistēmām un datu kopām
-
Reusable (atkārtoti izmantojami): dati ir sagatavoti tā, lai tos varētu atkārtoti izmantot nākotnē
Plašāk par FAIR skatīt šeit.
Atbilde: Atvērtie dati ir publiski pieejami pētniecības dati, kurus var brīvi izmantot, kopīgot un analizēt. Tomēr ne visos gadījumos pētniecības dati ir jāpadara par atvērtiem datiem. Pētniecības datus nedrīkst publiskot kā atvērtos datus, ja tie ietver personas datus, piemēram, respondentu vārdus vai veselības informāciju, kas jāaizsargā saskaņā ar VDAR, vai komercinformāciju, piemēram, patentējamus pētījumu rezultātus, kas aizsargāti ar intelektuālā īpašuma tiesībām. Tāpat datus nepublisko, ja tas varētu kaitēt pētījuma dalībniekiem, autoriem vai sabiedrībai.
Atbilde: Atvērtie dati un FAIR dati nav sinonīmi, tomēr viens no mērķiem tiem sakrīt — padarīt datus pēc iespējas pieejamākus. Atvērto datu pieeja pamatā koncentrējas uz neierobežotu datu publiskošanu, savukārt, FAIR — pētījumu datu efektīvu organizēšanu un pietiekamu dokumentēšanu, lai tie būtu labi atrodami, pieejami, savietojami un atkārtoti izmantojami.
FAIR principi neparedz obligātu datu atvēršanu, bet gan nodrošina, ka dati ir viegli pieejami un izmantojami pēc iespējas plašāk, saglabājot konfidencialitāti, ja nepieciešams. Tas nozīmē, ka dati var atbilst FAIR principiem, bet nebūt publiski pieejami, ja tos aizsargā privātuma vai īpašumtiesību ierobežojumi.
Atbilde: Datu kopa (angliski: dataset) ir strukturēts informācijas un datu kopums, kas savākts atbilstoši pētījuma mērķim un metodoloģijai. Datu kopums parasti tiek sakārtots tabulās vai citās strukturētās formās un sastāv no vairākiem datu elementiem vai vērtībām, kuras ir savāktas un sagatavotas analīzei. Piemēram, epidemioloģiskā pētījumā datu kopa varētu ietvert tabulu ar pacientu vecumu, dzimumu, simptomus un ārstēšanas rezultātus. Socioloģiskajā izpētē datu kopa varētu ietvert tabulā apkopotas un strukturētas respondentu atbildes uz dažādiem aptaujas jautājumiem. Humanitārās zinātnēs par datu kopu var tikt uzskatīti pat fiziski objekti, piemēram, gleznu kolekcija ar piezīmēm par tām.
Labi organizēta datu kopa ietver arī dokumentējošu un skaidrojošu informāciju, kas palīdz orientēties datu kopumā.
Repozitoriju kontekstā, ar datu kopu saprotam pētījuma datus un to pavadošo dokumentāciju, kas deponēti jeb pašarhivēti tiešsaistes glabātuvē, izveidojot aprakstošu metadatu ierakstu.
Atbilde: Lai dati būtu atkārtoti izmantojami, jāievēro FAIR principi — dati ir atrodami, pieejami, savietojami un atkārtoti izmantojami. Tam jāpievieno detalizēti un standartizēti metadati par datu struktūru, formātu, saturu un iegūšanas kontekstu. Datus ieteicams glabāt mašīnlasāmā formātā, piemēram, CSV, JSON, uzticamā repozitorijā ar pastāvīgu identifikatoru, piemēram, DOI, un skaidru licencēšanu, piemēram, Creative Commons. Ir pieejami rīki, kā F-UJI , kas palīdz novērtēt datu atbilstību FAIR principiem. Regulāra pieejamības un standartu pārbaude nodrošina datu ilgtermiņa izmantojamību.