Vilniaus universiteto Senatas yra patvirtinęs universiteto Atvirojo mokslo politikos gaires – dokumentą, kuris turėtų rodyti kryptį Vilniaus universiteto kelyje į kokybiškesnį ir visuomenei atviresnį mokslą. Kiekvienas iš gairių skyrių dedikuotas vis kitai su moksline veikla susijusiai sričiai: mokslinėmis publikacijomis ir prieigai prie jų, mokslinių tyrimų duomenims, mokslo rezultatų vertinimui, programinei įrangai, mokymo ištekliams, visuomenės įtraukimui ir infrastruktūrai.
Kviečiame detaliau pažvelgti į Gairių 18 punktą, kuriame deklaruojama:
„Universitetas palaiko „FAIR“, „FACT“ ir kitus atvirųjų susietų mokslinių tyrimų duomenų principus, <...> pripažindamas, kad jų laikymasis užtikrina maksimalią Universitete sukuriamų mokslinių tyrimų duomenų vertę bei atkartojamumą.“
Kartu pasiaiškinkime, kaip iššifruojami akronimai „FAIR“ ir „FACT“ bei kokius principus jie nusako.
„FAIR“
Kovo 15 d. sukako šešeri metai nuo dienos, kai žurnale „Scientific Data“ pasirodė straipsnis „The FAIR Guiding Principles for scientific data management and stewardship“, kuriame pirmą kartą oficialiai įvardyti principai, minimi ne viename mokslinius tyrimus ar jų finansavimą reglamentuojančiame dokumente. 53 straipsnio autoriai – daugiausiai gyvybės ir duomenų mokslų atstovai – susitiko 2014 m. sausio 13–16 d. Nyderlandų Leideno mieste vykusiose dirbtuvėse, kurių metu ir užgimė idėja įvardyti kelis universalius principus, kurių laikantis šiuolaikinių mokslinių tyrimų vis didėjančiomis apimtimis generuojami skaitmeniniai duomenys būtų lengviau surandami ir pasiekiami tiek žmonėms, tiek kompiuteriams, paprasčiau integruojami ir sudarytų kuo mažiau kliūčių juos pakartotinai naudoti.
Akronimas „FAIR“ sudarytas iš savybių, kuriomis turėtų pasižymėti didelės išliekamosios vertės duomenys, angliškų pavadinimų. Trumpai apžvelkime, kokios šios savybės, ir kaip pasiekti, kad moksliniai tyrimai jas atspindėtų:
F: Findable (liet. surandamumas). Kad žiniatinklyje publikuotus mokslinių tyrimų duomenis būtų lengviau surasti, jie turi būti kuo išsamiau aprašyti ir jiems turėtų būti suteiktas nekintantis identifikatorius (pvz., DOI), kuris turėtų būti nurodytas duomenų rinkinio metaduomenyse (informacijoje apie duomenų rinkinį). Be to, duomenų rinkinys arba bent jo metaduomenys turėtų būti indeksuoti kokioje nors paieškos sistemoje (t.y. randami per duomenų talpyklos vidinę paieškos funkciją arba per išorinę duomenų paieškos sistemą, pvz., OpenAIRE Explore).
A: Accessible (liet. pasiekiamumas). Duomenys turėtų būti tiesiogiai pasiekiami visuotinai priimtais ir prie konkrečios nuosavybinės (t.y. mokamos) programinės įrangos nepririštais protokolais (pvz., HTTP, FTP). Vis dėlto, jeigu duomenys yra jautrūs ar konfidencialūs, siekiant užtikrinti jų saugumą, „A“ principas numato išlygą, leidžiančią iš potencialių duomenų naudotojų reikalauti tapatybės patvirtinimo ar tam tikrų kriterijų patenkinimo. „A“ principas taip pat nustato, kad, jei duomenų rinkinys taptų nebeprieinamas, bent jau jo metaduomenys turėtų išlikti prieinami.
I: Interoperable (liet. sąveikumas). Kad atskirus duomenų rinkinius kompiuteriui būtų lengviau derinti tarpusavyje, jie turi būti publikuoti standartiniais susietųjų duomenų formatais (pvz., RDF, JSON), ir turi būti aiškiai nurodytos sąsajos su kitais duomenų rinkiniais, jei tokių yra.
R: Reusable (liet. tinkamumas pakartotinam naudojimui). Norint užtikrinti, kad duomenis būtų galima prasmingai panaudoti kitiems projektams, reikia, kad jie būtų sutvarkyti ir aprašyti pagal atitinkamos mokslo srities standartus. Be to, turėtų būti pateikiama detali informacija apie duomenų kilmę (autorius, gavimo ar apdorojimo būdas, sąsajos su publikacijomis ar kitų autorių duomenų rinkiniais) ir teisinės sąlygos, kuriomis autorius leidžia naudoti duomenis (rekomenduojamos standartinės atvirojo turinio ar atvirosios programinės įrangos licencijos).
Dalį iš „FAIR“ principų įgyvendinti padeda duomenų talpyklos, kuriose publikuojami duomenys. Pavyzdžiui, Nacionalinis atviros prieigos mokslinių tyrimų duomenų archyvas (MIDAS) sudaro galimybę (ir įpareigoja) duomenis aprašyti metaduomenimis, kuriuose galima nurodyti duomenų kilmės informaciją bei naudojimo sąlygas, leidžia duomenims suteikti DOI identifikatorių. MIDAS publikuotus duomenis galima surasti MIDAS portale, B2FIND duomenų paieškos sistemoje ir Google.
FAIR principus palaiko ne tik Vilniaus universitetas, bet ir Europos Sąjunga, padariusi jų laikymąsi privalomą visiems naujausios jos mokslo finansavimo programos „Europos Horizontas“ dalyviams. FAIR principus populiarina bei jų įgyvendinimą skatina tarptautinė organizacija GO FAIR.
„FACT“
„FACT“ principus suformulavo 2016–2017 m. Nyderlanduose vystytas projektas „Responsible Data Science“, kuris subūrė vienuolikai skirtingų organizacijų atstovaujančius specialistus, siekiančius, kad duomenų mokslas taptų etiškesnis. Akronimas „FACT“ simbolizuoja keturias vertybes, į kurias turėtų lygiuotis duomenų mokslininkai ir visi dirbantieji su didžiaisiais duomenimis (angl. Big Data):
F: Fairness (liet. teisingumas). Turi būti siekiama, kad duomenys būtų analizuojami be išankstinių nusistatymų.
A: Accuracy (liet. tikslumas). Duomenų moksle turi būti siekiama kuo didesnio tikslumo. Pateikiant duomenimis paremtas prognozes ar skaičiavimus, turėtų būti aiškiai įvardijama, koks rezultatų tikslumas gali būti garantuotas ir kokia yra tikėtina skaičiavimų paklaida.
C: Confidentiality (liet. konfidencialumas). Asmenų teisė į privatumą turi būti gerbiama ir saugoma.
T: Transparency (liet. skaidrumas). Pateikiant duomenų analize paremtas išvadas, kartu turi būti įvardijami prie tų išvadų nuvedę duomenų apdorojimo proceso žingsniai. Pačios išvados turi būti pateikiamos taip, kad nebūtų dviprasmiškai interpretuojamos.
Išsamiau apie „FACT“ principus galima pasiskaityti šiame vieno iš jų kūrėjų parašytame straipsnyje.
Kiti duomenų principai
Pabaigai, reikėtų pažymėti, kad pasaulyje yra sugalvota įvairių duomenų principų. Be jau aptartų „FAIR“ ir „FACT“, verta paminėti ir „CARE“ vietinių duomenų valdymo principus (angl. Principles for Indigenous Data Governance). Jiems parama išsakoma ARQUS aljanso, kurio narys yra Vilniaus universitetas, Atvirojo mokslo politikos dokumente. Akronimas „CARE“ nusako principus, kurie turėtų būti taikomi vietos bendruomenių nariams, kai jų gyvenamoje teritorijoje renkami moksliniai ar statistiniai duomenys.
Informaciją parengė Gintė Medzvieckaitė
Iliustracija, CC-BY-SA-4.0
2022-12-15