No 16. līdz 18. martam Latvijas Organiskās sintēzes institūtā norisinājās mācības Training in Databases and Omics Data Analysis, kas bija veltītas darbam ar dažādām biomedicīnas un pētniecības datubāzēm, kā arī efektīvai datu iegūšanai un analīzei. Mācībās piedalījās arī Latvijas Datu kuratoru tīkla pārstāvis un Augstākās izglītības un zinātnes IT koplietošanas pakalpojumu centra (VPC) datu kurators Mikus Melderis.

Mācību programmas pirmā diena tika veltīta klīniskajām un regulatīvajām datubāzēm, apgūstot, kā meklēt informāciju par zālēm, to apstiprināšanas statusu un klīniskajiem pētījumiem, izmantojot tādus resursus kā EMA (European Medicines Agency) un FDA (U.S. Food and Drug Administration) datubāzes. Lai gan šīs datubāzes ir uzticamas, to lietošana var būt sarežģīta un dati ne vienmēr ir pilnīgi vai viegli iegūstami.

Otrajā dienā tika aplūkotas plašas pētniecībā izmantoto datubāzu kategorijas, tostarp UniProt (Universal Protein Resource), NCBI (National Center for Biotechnology Information), EMBL-EBI (European Molecular Biology Laboratory – European Bioinformatics Institute) un dažādas omikas datu krātuves. Šīs datubāzes bieži darbojas kā “datubāzu datubāzes”, piedāvājot piekļuvi ļoti lielam datu apjomam, taču vienlaikus prasa kritisku pieeju datu kvalitātes izvērtēšanā. Daži resursi tika apskatīti arī praktiski, piemēram, GEO (Gene Expression Omnibus), kas nodrošina standartizētus un labi dokumentētus omikas datus.

Īpaša uzmanība tika pievērsta tam, ka daļa biomedicīnas datubāzu var saturēt nepilnīgus vai novecojušus datus, piemēram, zāļu mērķu anotācijās vai klīnisko informāciju, tādēļ ir būtiski vienmēr pārbaudīt primāros avotus un publikācijas. Dažās platformās tiek piedāvāti tikai ierobežotas piekļuves dati vai uzstādi īpaši nosacījumi to izmantošanai.

Noslēdzošajā mācību dienā tika apgūta programmētās piekļuves (Application Programming Interface jeb API) izmantošana datubāzēm, kas ļauj automatizēti iegūt lielus datu apjomus un veidot reproducējamus analīzes procesus. Tika salīdzināta manuāla datu iegūšana ar API piekļuvi, uzsverot, ka API nodrošina strukturētākus, ātrāk apstrādājamus datus, taču to izmantošanai nepieciešamas tehniskas prasmes.

Kopumā mācībās tika gūts visaptverošs pārskats par mūsdienu biodatu analīzes pieejām un praktiskās zināšanas par to, kā efektīvi piekļūt un izmantot liela mēroga bioloģiskos datu kopumus, stiprinot datu kuratoru spēju orientēties dažādos pētniecības datu avotos, kritiski izvērtēt datu kvalitāti un izvēlēties atbilstošākos rīkus konkrētu pētniecības jautājumu risināšanai. Gūtās zināšanas ļaus efektīvāk konsultēt pētniekus par datu atrašanu, iegūšanu un to reproducējamu analīzi, īpaši darbā ar lielapjoma biomedicīnas datiem.