Datu atkārtota lietošana
Lai veiktu pētījumu, ne vienmēr dati ir jāievāc no jauna, tā vietā var atkārtoti izmantot atvērtos datus savā pētniecībā.
Atvērtie dati pieejami dažādās interneta vietnēs, līdz ar to sākotnēji var būt sarežģīti gūt priekšstatu par to, kādi dati ir pieejami atkārtotai lietošanai. Šajā sadaļā sniegti daži padomi, kā meklēt un izmantot iepriekš ievāktas datu kopas.
Datu kopu meklēšana
Vispārējie vai nozaru pētniecības datu repozitoriji ir labs sākuma punkts, taču datus pētījumiem iespējams meklēt arī citos datu avotos. Sekundārie dati, ko izmantot pētījumiem, var būt pieejami, piemēram, valsts pārvaldes un centrālās statistikas datu portālos, pašvaldību mājaslapās, u.c. avotos.
Latvijas atvērto datu avoti
Resurss | Apraksts |
---|---|
Dataverse.lv | Latvijas nacionālais pētniecības datu repozitorijs. |
Latvijas Atvērto datu portāls | Latvijas valsts pārvaldes atvērtie dati. |
Oficiālās statistikas portāls | Centrālās statistikas pārvaldes dati. |
Starptautiskie atvērto datu avoti
Resurss | Apraksts |
---|---|
OpenAIRE Explore | Meklēšanas rīks datu kopām no plaša starptautisku repozitoriju klāsta (tajā skaitā Zenodo, figshare, u.c.) |
Google Dataset search | Google meklētājprogramma, kas atrod datu kopas no datu krātuvēm, izdevēju vietnēm, digitālajām bibliotēkām un dažādām tīmekļa lapām. |
Mendeley Data | Mendeley Data ir drošs bezmaksas repozitorijs, kurā iespējams glabāt datus, nodrošinot to ērtu kopīgošanu, piekļuvi un citēšanu. |
Datu citēšana
Pievērs uzmanību datu kopu licencēm
Datu īpašnieki visbiežāk piešķir atļauju datu kopu izmantošanai, izmantojot licenci. Licence ir juridisks līgums, kas nosaka standartizētus ierobežojumus un atļaujas attiecīgā darba izmantošanai, vienlaikus saglabājot īpašumtiesības.
Licences datiem var būt norādītas dažādos veidos:
-
Iekļautas datu metadatos;
-
Norādītas kā ūdenszīmes vai paziņojumi pašos datos;
-
Pieminētas datu kopuma piekļuves lapā;
-
Norādītas repozitorija mājaslapā;
-
Detalizēti aprakstītas ReadMe failā, kas pievienots datu kopai.
Lai uzzinātu vairāk par to, kā licences ietekmē datu izmantošanu, skatiet OpenAIRE rokasgrāmatu: https://www.openaire.eu/can-i-reuse-someone-else-research-data
Labā prakse un licenču nosacījumi liek atsaukties uz datu kopām, kas izmantotas pētījumā. Atsauci uz datu kopu nepieciešams iekļaut gan zinātniskās publikācijas tekstā, gan arī atsauču sarakstā.
Arvien vairāk starptautiskie zinātniskie žurnāli iekļauj datu pieejamības deklarāciju jeb paziņojumu (data availability statement) kā atsevišķu zinātniskā raksta sadaļu. Ja pētījumā tiek atkārtoti izmantoti iepriekš ievākti dati, tas skaidri jānorāda šajā sadaļā.
Datu citēšana ir būtiska, lai sniegtu atzinību datu kopas autoriem, nodrošinātu pārredzamību un reproducējamību, veicinātu to atrodamību un izsekotu, kā datu kopa tikusi lietota. Tas veicina sadarbību un datu apmaiņu, atbilst ētikas un institucionālajām prasībām un stiprina pētniecību kopumā.
Datu citēšanas elementi
Veidojot atsauci uz datu resursu, ir obligāti norādīt pamata informāciju, kas apraksta šo datu avotu.
Elements | Paskaidrojums |
---|---|
Autors | Datu kopas veidotājs |
Publicēšanas datums | Vēlākais no šiem datumiem:
|
Nosaukums | Papildus paša citētā resursa nosaukumam tas var ietvert arī objekta vai kolekcijas nosaukumus, kam šī datu kopa pieder. |
Izdevums | Datu apstrādes līmenis, norādot, cik neapstrādāta vai pilnveidota ir datu kopa. |
Versija | Versijas numurs. |
Resursa veids | Piemēram: database, dataset. |
Izdevējs | Organizācija, kas glabā datus vai veic kvalitātes nodrošināšanu. |
Unikāls ciparu paraksts (UNF – Unique Numeric Fingerprint) | Kriptogrāfiska datu virkne, ko izmanto, lai nodrošinātu, ka kopš citēšanas nav notikušas izmaiņas (UNF). |
Identifikators | Datu identifikators saskaņā ar pastāvīgu shēmu. |
Atrašanās vieta | Pastāvīgs URL, no kura ir pieejama datu kopa. |
Norādes struktūra DataCite un APA formātiem
Creator (PublicationYear). Title. Publisher. Identifier
Datukopām ar PID:
Creator. (PulicationYear). Title [Dataset]. Identifier
Datukopām bez PID:
Creator. (PulicationYear). Title [Dataset]. Retrieved from URL
Datukopām ar saistītu objektu (Associated Materials):
Creator. (PulicationYear). Title [Dataset and Type of Associated Materials]. Identifier
Atsauce tekstā (in-text citations)
Creator (PublicationYear) vai (Creator, PublicationYear).
Repozitoriju veidoto atsauču piemēri
-
Zenodo
Singh, J., Donaldson, J., Archibald, S., Parr, C., Voysey, M., & Davies, A. (2024). Small-scale fires interact with herbivore feedbacks to create persistent grazing lawn environments [Data set]. Zenodo. https://doi.org/10.5061/dryad.z612jm6kc
-
PANGAEA
Willmes, S et al. (2009): Onset dates of annual snowmelt on Antarctic sea ice in 2007/2008. doi:10.1594/PANGAEA.701380
-
Dryad
Kingsolver JG, Hoekstra HE, Hoekstra JM, Berrigan D, Vignieri SN, Hill CE, Hoang A, Gibert P, Beerli P (2001) Data from: The strength of phenotypic selection in natural populations. Dryad Digital Repository. doi:10.5061/dryad.166
-
Dataverse
Frederico Girosi; Gary King, 2007, ‘Cause of Death Data’, http://hdl.handle.net/1902.1/UOVMCPSWOL UNF:3:9JU+SmVyHgwRhAKclQ85Cg== IQSS Dataverse Network [Distributor] V3 [Version].
Datu atkārtota lietošana
Lai veiktu pētījumu, ne vienmēr dati ir jāievāc no jauna, tā vietā var atkārtoti izmantot atvērtos datus savā pētniecībā.
Atvērtie dati pieejami dažādās interneta vietnēs, līdz ar to sākotnēji var būt sarežģīti gūt priekšstatu par to, kādi dati ir pieejami atkārtotai lietošanai. Šajā sadaļā sniegti daži padomi, kā meklēt un izmantot iepriekš ievāktas datu kopas.
Datu kopu meklēšana
Vispārējie vai nozaru pētniecības datu repozitoriji ir labs sākuma punkts, taču datus pētījumiem iespējams meklēt arī citos datu avotos. Sekundārie dati, ko izmantot pētījumiem, var būt pieejami, piemēram, valsts pārvaldes un centrālās statistikas datu portālos, pašvaldību mājaslapās, u.c. avotos.
Latvijas atvērto datu avoti
Resurss | Apraksts |
---|---|
Dataverse.lv | Latvijas nacionālais pētniecības datu repozitorijs. |
Latvijas Atvērto datu portāls | Latvijas valsts pārvaldes atvērtie dati. |
Oficiālās statistikas portāls | Centrālās statistikas pārvaldes dati. |
Starptautiskie atvērto datu avoti
Resurss | Apraksts |
---|---|
OpenAIRE Explore | Meklēšanas rīks datu kopām no plaša starptautisku repozitoriju klāsta (tajā skaitā Zenodo, figshare, u.c.) |
Google Dataset search | Google meklētājprogramma, kas atrod datu kopas no datu krātuvēm, izdevēju vietnēm, digitālajām bibliotēkām un dažādām tīmekļa lapām. |
Mendeley Data | Mendeley Data ir drošs bezmaksas repozitorijs, kurā iespējams glabāt datus, nodrošinot to ērtu kopīgošanu, piekļuvi un citēšanu. |
Datu citēšana
Pievērs uzmanību datu kopu licencēm
Datu īpašnieki visbiežāk piešķir atļauju datu kopu izmantošanai, izmantojot licenci. Licence ir juridisks līgums, kas nosaka standartizētus ierobežojumus un atļaujas attiecīgā darba izmantošanai, vienlaikus saglabājot īpašumtiesības.
Licences datiem var būt norādītas dažādos veidos:
-
Iekļautas datu metadatos;
-
Norādītas kā ūdenszīmes vai paziņojumi pašos datos;
-
Pieminētas datu kopuma piekļuves lapā;
-
Norādītas repozitorija mājaslapā;
-
Detalizēti aprakstītas README failā, kas pievienots datu kopai.
Lai uzzinātu vairāk par to, kā licences ietekmē datu izmantošanu, skatiet OpenAIRE rokasgrāmatu: https://www.openaire.eu/can-i-reuse-someone-else-research-data
Labā prakse un licenču nosacījumi liek atsaukties uz datu kopām, kas izmantotas pētījumā. Atsauci uz datu kopu nepieciešams iekļaut gan zinātniskās publikācijas tekstā, gan arī atsauču sarakstā.
Arvien vairāk starptautiskie zinātniskie žurnāli iekļauj datu pieejamības deklarāciju jeb paziņojumu (data availability statement) kā atsevišķu zinātniskā raksta sadaļu. Ja pētījumā tiek atkārtoti izmantoti iepriekš ievākti dati, tas skaidri jānorāda šajā sadaļā.
Datu citēšana ir būtiska, lai sniegtu atzinību datu kopas autoriem, nodrošinātu pārredzamību un reproducējamību, veicinātu to atrodamību un izsekotu, kā datu kopa tikusi lietota. Tas veicina sadarbību un datu apmaiņu, atbilst ētikas un institucionālajām prasībām un stiprina pētniecību kopumā.
Datu citēšanas elementi
Veidojot atsauci uz datu resursu, ir obligāti norādīt pamata informāciju, kas apraksta šo datu avotu.
Elements | Paskaidrojums |
---|---|
Autors | Datu kopas veidotājs |
Publicēšanas datums | Vēlākais no šiem datumiem:
|
Nosaukums | Papildus paša citētā resursa nosaukumam tas var ietvert arī objekta vai kolekcijas nosaukumus, kam šī datu kopa pieder. |
Izdevums | Datu apstrādes līmenis, norādot, cik neapstrādāta vai pilnveidota ir datu kopa. |
Versija | Versijas numurs. |
Resursa veids | Piemēram: database, dataset. |
Izdevējs | Organizācija, kas glabā datus vai veic kvalitātes nodrošināšanu. |
Unikāls ciparu paraksts (UNF – Unique Numeric Fingerprint) | Kriptogrāfiska datu virkne, ko izmanto, lai nodrošinātu, ka kopš citēšanas nav notikušas izmaiņas (UNF). |
Identifikators | Datu identifikators saskaņā ar pastāvīgu shēmu. |
Atrašanās vieta | Pastāvīgs URL, no kura ir pieejama datu kopa. |
Norādes struktūra DataCite un APA formātiem
Creator (PublicationYear). Title. Publisher. Identifier
Datukopām ar PID:
Creator. (PulicationYear). Title [Dataset]. Identifier
Datukopām bez PID:
Creator. (PulicationYear). Title [Dataset]. Retrieved from URL
Datukopām ar saistītu objektu (Associated Materials):
Creator. (PulicationYear). Title [Dataset and Type of Associated Materials]. Identifier
Atsauce tekstā (in-text citations)
Creator (PublicationYear) vai (Creator, PublicationYear).
Repozitoriju veidoto atsauču piemēri
-
Zenodo
Singh, J., Donaldson, J., Archibald, S., Parr, C., Voysey, M., & Davies, A. (2024). Small-scale fires interact with herbivore feedbacks to create persistent grazing lawn environments [Data set]. Zenodo. https://doi.org/10.5061/dryad.z612jm6kc
-
PANGAEA
Willmes, S et al. (2009): Onset dates of annual snowmelt on Antarctic sea ice in 2007/2008. doi:10.1594/PANGAEA.701380
-
Dryad
Kingsolver JG, Hoekstra HE, Hoekstra JM, Berrigan D, Vignieri SN, Hill CE, Hoang A, Gibert P, Beerli P (2001) Data from: The strength of phenotypic selection in natural populations. Dryad Digital Repository. doi:10.5061/dryad.166
-
Dataverse