Sidebar

Tikriausiai bent kartą gyvenime esate susidūrę su sąvoka „metaduomenys“. Galbūt sutikote šį terminą naršydami internete arba pildydami mokslinių tyrimų duomenų valdymo planą, o galbūt Jūsų atstovaujamoje mokslo srityje įprasta kalbėti apie metaduomenis. Net jei žodžio „metaduomenys” Jums dar neteko girdėti, su objektais, kuriuos jis apibūdina Jums tikrai jau teko susidurti: metaduomenų yra visur, kur yra duomenų, o šiais laikais vienokio ar kitokio pobūdžio duomenys mus supa iš visų pusių.

Terminas „metaduomenys“ atsirado žodį „duomenys“ sujungus su iš senovės graikų kalbos atėjusiu priešdėliu „meta-“, reiškiančiu „už“ arba „šalia“. Taigi, tiesiogiai verčiant jų pavadinimą, metaduomenys yra kažkas, kas yra šalia duomenų arba juos papildo. Nemažai apie metaduomenis rašančių šaltinių vadina juos „duomenimis apie duomenis“. Iš tikrųjų, metaduomenys – tai bet kokia informacija apie duomenis. Patys duomenys taip pat gali būti įvairiausių pavidalų – tekstai, vaizdai, skaičiai, o kartais netgi fiziniai objektai. Metaduomenys leidžia mums lengviau surasti duomenis, padeda geriau suprasti jų turinį, suteikia įvairios papildomos informacijos, pvz. apie duomenų struktūrą, jų kilmę ar naudojimo sąlygas.

Metaduomenys gali būti sugeneruoti automatiniu būdu, tuo pačiu metu, kai buvo sukurti jų aprašomi duomenys, arba registruoti rankiniu būdu. Jie gali būti pateikiami paprastu tekstu – lentelėse, ant etikečių ar kaip prierašai – arba naudojant specialias duomenų aprašymo kalbas ir formatus (pvz. XMLJSON). Metaduomenys gali būti bendro pobūdžio (pvz. failo dydis), bet gali būti labai specifiniai (pvz. žvaigždės sukimosi greitis, sutinkamas šalia tam tikrų astronomijos srities duomenų).

Metaduomenys nėra vien gražus priedas – jie suteikia duomenims pridėtinę vertę, o kartais duomenų apskritai būtų neįmanoma interpretuoti, jeigu jie nebūtų papildyti metaduomenimis. Pavyzdžiui, topografinė nuotrauka būtų mažai vertinga, nežinant joje vaizduojamos vietos koordinačių, o miesto gyventojų skaičius suteiktų mažai informacijos, jei nebūtų žinoma, koks tai miestas ir kuriais metais skaičius fiksuotas.

Atliekant mokslinį tyrimą, vertėtų pasirūpinti, kad jo metu kaupiami duomenys neliktų be reikalingų metaduomenų. Išsamūs metaduomenys leidžia mokslinio tyrimo duomenis tiksliau interpretuoti, efektyviau panaudoti, ir labai pasitarnauja, jei prireikia tyrimą atkartoti. Dėl šios priežasties, dar prieš pradedant duomenų rinkimą vertėtų pagalvoti, kokią informaciją apie juos bus reikalinga užfiksuoti, ir kaip tai bus daroma.

Apie metaduomenų svarbą kalbama ir taip vadinamuose „FAIR principuose“, nusakančiuose, kokie turėtų būti mokslinių tyrimų duomenys. Šių principų laikytis ragina Europos Parlamento ir Tarybos Direktyva dėl atvirųjų duomenų ir viešojo sektoriaus informacijos pakartotinio naudojimo, jų laikytis reikalaujama iš Europos Komisijos finansuojamų mokslo projektų, be to, juos atvirai palaiko kai kurie akademiniai leidėjai (pvz. Routledge). FAIR principai apibrėžia, kad mokslinių tyrimų duomenys turėtų būti surandami (angl. findable), prieinami (angl. accessible), sąveikūs (angl. interoperable) ir tinkami pakartotinai naudoti (angl. reusable). Beveik kiekvienos iš šių savybių įgijimui didelę įtaką turi metaduomenų kokybė. Pavyzdžiui, jei duomenų rinkinio metaduomenis galima surasti per paieškos sistemą, tai ir pačius duomenis bus lengviau surasti, o informacijos apie duomenų naudojimo sąlygas įtraukimas į metaduomenis padidina duomenų rinkinio pakartotinio panaudojimo tikimybę.

Kai kuriose mokslo šakose netgi egzistuoja taisyklių sąvadai, reglamentuojantys, kokie metaduomenys turėtų būti fiksuojami kartu su joms atstovaujančiais duomenimis ir kokia forma tie metaduomenys turėtų būti pateikiami. Tokie taisyklių sąvadai vadinami „metaduomenų standartais“. Pavyzdžiui, nemažai socialinių mokslų duomenų archyvų ir institutų naudoja DDI (Data Documentation Initiative) standartą, daug gamtos istorijos muziejų savo ištekliams dokumentuoti naudoja Darwin Core metaduomenų standartą, o štai kristalų struktūroms aprašyti naudojamas CIF (Crystallographic Information Framework) formatas. Išsamų specifinėms mokslo šakoms skirtų metaduomenų standartų sąvadą yra parengęs Mokslinių tyrimų duomenų aljansas (angl. Research Data Alliance). Šį sąrašą galima rasti čia.  

Be „specialybinių“ atskiroms mokslo šakoms sukurtų metaduomenų standartų egzistuoja ir bendrieji standartai, pritaikomi visų mokslo šakų duomenims. Pats bendriausiais ir vienas plačiausiai naudojamų – Dublin Core. Šis standartas atsirado kaip 13 pagrindinių metaduomenų elementų, skirtų mokslinėms publikacijoms aprašyti, sąrašas. Vėliau sąrašas plėtėsi ir buvo pritaikytas įvairaus pobūdžio mokslo produkcijai. Naujausią standarto versiją sudaro jau per 50 elementų. Dar vienas, specialiai mokslinei veiklai ir jos rezultatams aprašyti skirtas metaduomenų standartas yra CERIF (angl. Common European Research Information Format). Jį papildantis CERIF for Datasets (C4D) skirtas būtent mokslinių tyrimų duomenų rinkiniams aprašyti. C4D yra pagrindinis Nacionalinio atviros prieigos mokslinių tyrimų duomenų archyvo (MIDAS) naudojamas metaduomenų standartas, taigi visi į MIDAS įkelti ir jame publikuoti duomenys aprašomi būtent šiuo formatu.

Jeigu perskaitę šį straipsnį savęs klausiate, ar Jums būtina pulti ieškoti Jūsų sričiai skirto metaduomenų standarto techninės specifikacijos ir atmintinai mokytis joje išvardintus elementus, nuraminame, kad žinoti metaduomenų standartų subtilybes labiausiai aktualu specializuotoms organizacijoms ir techninėms infrastruktūroms. Paprastam mokslininkui ar tyrėjui užtenka tiesiog fiksuoti metaduomenis, reikalingus jų srities duomenims interpretuoti, ir tai daryti tvarkingai. Taigi, tam tikra prasme, kiekvienas iš mūsų galime susikurti savo asmeninį „metaduomenų  standartą“. Vis dėlto, svarbu domėtis, kokius metaduomenis ir kaip fiksuoja kiti tos pačios srities mokslininkai bei taikytis prie dalyko bendruomenėje priimtų normų – kuo vienodesnės bus metaduomenų kaupimo praktikos, tuo lengviau bus keistis informacija. Be to, jei duomenys bus publikuojami per specializuotą duomenų talpyklą ar mokslinį žurnalą, gali būti, kad teks susidurti su specifiniais reikalavimais metaduomenims.

Primename, kad informacijos apie mokslinių tyrimų duomenų valdymą ir mokslą finansuojančių organizacijų reikalavimus jam galite rasti VU bibliotekos interneto svetainės skiltyje „Mokslinių tyrimų duomenys ir jų valdymas“. Taip pat kviečiame apsilankyti bibliotekos organizuojamuose mokymuose šia tema.

Iliustracija: Vėžių pavyzdžiai su ant etiketės užrašytais metaduomenimis. Naturalis bioįvairovės centras, Leidenas, Nyderlandai

Informacija paimta iš VU bibliotekos rengiamo Mokslo atviruko.

Parengė dr. Gintė Medzvieckaitė

2023-05-15

Siekdami užtikrinti jums teikiamų paslaugų kokybę, Universiteto tinklalapiuose naudojame slapukus. Tęsdami naršymą jūs sutinkate su Vilniaus universiteto slapukų politika. Daugiau informacijos Sutinku