1. Įžanga
Didelės vertės duomenų rinkinių apibrėžimas atsirado iš poreikio identifikuoti svarbiausius duomenis pavyzdžiui:
- geografiniai duomenys
- žemės stebėjimo ir aplinkos duomenys
- meteorologiniai duomenys
- statistiniai duomenys
- įmonių ir jų savininkų duomenys
- mobilumo duomenys
2. Bendrosios didelės vertės duomenų rinkinių savybės
Didelės vertės duomenų rinkiniai pasižymi specifiniais techniniais ir teisiniais reikalavimais. Šiems duomenų rinkiniams taikomi šie bendri reikalavimai:
- atvirosios duomenų licencijos;
- viešai prieinamos dokumentacijos;
- mašininio skaitomumo užtikrinimas;
- galimybė (jei tai įmanoma) parsisiųsti visus pageidaujamus duomenis vienu kartu;
- galimybė gauti duomenis naudojant API sąsajas;
- nemokama prieiga ir gavimas;
- išsamūs metaduomenų aprašai.
Atsižvelgiant į šias savybes ir, atitinkamai, iš to išplaukiančius reikalavimus, DCAT-AP-LT specifikacijoje atsiranda poreikis taikyti papildomas, modifikuotas ar sugriežtintas metaduomenų specifikacijos taisykles didelės vertės duomenų rinkiniams. Šios taisyklės apima DCAT-AP klases papildančias savybes ar griežtesnį esamų savybių privalomumo taikymą ir yra apibrėžtos DCAT-AP HVD priede.
Lietuvoje didelės vertės duomenų rinkiniai aprašomi „tokie, kokie yra“ DCAT-AP HVD 2.2.0 specifikacijoje, su nedideliais teisinio šaltinio citavimo pakeitimais, nes ELI Lietuvoje dar nepriimtas.
Šiame priede LegalResource šaltinis yra ELI atributas pavadinimu id_local. Vietinis identifikatorius naudojamas kaip Teisės aktų registre paskelbto teisinio šaltinio URI.
3. Didelės vertės duomenų rinkiniams naudojamos (DCAT-AP HVD) klasės ir savybės
3.1. Katalogas
- Apibrėžimas
- Katalogas arba saugykla, kurioje yra aprašomi duomenų rinkiniai arba duomenų paslaugos.
- DCAT nuoroda
- Nuoroda
- Savybės
- Apibrėžiamos šios šio objekto ypatybės: duomenų rinkinys, įrašas, paslauga.
Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas duomenų rinkinys Dataset 0..* Duomenų rinkinys, kuris yra dalis katalogo. Kadangi tuščių katalogų paprastai yra problemų požymis, šią savybę reikėtų derinti su kita savybe „service“, kad būtų įgyvendinta tuščio katalogo patikra. A įrašas Catalogue Record 0..* Katalogo įrašas, kuris yra dalis katalogo. A paslauga Data Service 0..* Svetainė arba galutinis taškas (duomenų paslauga), kuris yra išvardytas kataloge. Kadangi tuščių katalogų paprastai yra problemų požymis, šią savybę reikėtų derinti su ankstesne savybe „dataset“, kad būtų įgyvendinta tuščio katalogo patikra. A
3.2. Katalogo įrašas
- Apibrėžimas
- Duomenų rinkinio įrašo kataloge aprašymas.
- DCAT nuoroda
- Nuoroda
- Savybės
- Apibrėžiamos šios šio objekto ypatybės: pagrindinė tema,
Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas pagrindinė tema Catalogued Resource 1 Nuoroda į aprašytąjį duomenų rinkinį, duomenų paslaugą arba katalogą. Katalogo įrašas nurodys vieną subjektą kataloge. Tai gali būti arba duomenų rinkinys, arba duomenų paslauga. Siekiant užtikrinti neambicingą kardinalumo skaitymą, diapazonas nustatomas kaip Kataloguojamas išteklius. Tačiau šio diapazono tikslas nėra reikalauti eksplicitiškai naudoti klasę Kataloguotas įrašas. Kaip abstrakti klasė, turėtų būti naudojama antrinė klasė. A
3.3. Katalogo išteklius
- Apibrėžimas
- Šaltinis, kurį paskelbė arba kuravo vienas agentas.
- DCAT nuoroda
- Nuoroda
- Naudojimo pastaba
- Ši klasė yra laikoma kaip abstrakti sąvoka.
- Savybės
- Ši specifikacija nenustato jokių papildomų reikalavimų šio objekto savybėms.
3.4. Duomenų paslauga
- Apibrėžimas
- Operacijų rinkinys, suteikiantis prieigą prie vieno ar daugiau duomenų rinkinių arba duomenų apdorojimo funkcijų.
- DCAT nuoroda
- Nuoroda
- Šios klasės poklasė
- Katalogo resursas
- Savybės
- Apibrėžiamos šios šio objekto ypatybės: teisinis pagrindas, kontaktas, dokumentacija, prieigos taško aprašymas, prieigos taško URL, didelės vertės duomenų rinkinio kategorija, licencija, teisės, pateikia duomenų rinkinį.
Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas teisinis pagrindas Legal Resource 1..* Teisės aktai, kurie įpareigoja kurti ar valdyti duomenų paslaugą. HVD atveju reikšmė PRIVALO apimti ELI http://data.europa.eu/eli/reg_impl/2023/138/oj. Kadangi į išteklių gali būti taikomi keli teisės aktai, maksimalus kardinalumas nėra ribojamas. Lietuvoje didelės vertės duomenų rinkiniai aprašomi „tokie, kokie yra“ DCAT-AP HVD 2.2.0 specifikacijoje, su nedideliais teisinio šaltinio citavimo pakeitimais, nes ELI Lietuvoje dar nepriimtas. Šiame priede LegalResource šaltinis yra ELI atributas pavadinimu id_local. Vietinis identifikatorius naudojamas kaip Teisės aktų registre paskelbto teisinio šaltinio URI. E kontaktas Kind 1..* Kontaktinė informacija, kurią galima naudoti siunčiant pastabas apie duomenų paslaugą. 3.4 straipsnis reikalauja paskirti kontaktinį tašką API. A dokumentacija Document 1..* Puslapis, kuriame pateikiama papildoma informacija apie duomenų paslaugą. Paslaugų kokybė apima plačią aspektų spektrą. HVD reglamentas nenustato jokių privalomų temų. Todėl paslaugų kokybės informacija laikoma bendrosios duomenų paslaugos dokumentacijos dalimi. P prieigos taško aprašymas Resource 0..* Aprašymas paslaugų, prieinamų per galutinius taškus, įskaitant jų operacijas, parametrus ir t.t. Savybė pateikia konkrečias faktinių galutinių taškų detales, o dct:conformsTo naudojama nurodyti bendrąjį standartą ar specifikaciją, kurią įgyvendina galutiniai taškai. 3.3 straipsnis reikalauja pateikti API dokumentaciją Sąjungos arba tarptautiniu mastu pripažintu atviru, žmogui skaitomu ir mašinai skaitomu formatu. A prieigos taško URL Resource 1..* Pagrindinė paslaugos vieta arba pirminis galutinis taškas (IRI). Galutinio taško URL TURĖTŲ būti pastovus. Tai reiškia, kad leidėjai turėtų daryti viską, kas įmanoma, kad išlaikytų reikšmę stabilia ir egzistuojančia. A didelės vertės duomenų rinkinio kategorija Concept 1..* HVD kategorija, kuriai priklauso ši duomenų paslauga. - P licencija Licence Document 0..1 Licencija, pagal kurią teikiama duomenų paslauga. 3.3 straipsnis nurodo, kad turi būti pateiktos naudojimo sąlygos. Pagal DCAT-AP HVD teisinės informacijos gaires tai įgyvendinama pirmenybė teikiant licenciją. Kaip alternatyvą gali būti naudojamos teisės. A teisės Rights statement 0..* Deklaracija, kuriame nurodomos su platinimu susijusios teisės. 3.3 straipsnis nurodo, kad turi būti pateiktos naudojimo sąlygos. Pagal DCAT-AP HVD teisinės informacijos gaires tai įgyvendinama pirmenybė teikiant licenciją. Kaip alternatyvą gali būti naudojamos teisės. A pateikia duomenų rinkinį Dataset 1..* Ši savybė nurodo duomenų rinkinį, kurį ši duomenų paslauga gali platinti. API HVD kontekste nėra atskiras išteklius. Jis naudojamas atverti HVD duomenų rinkinius. Todėl kiekviena duomenų paslauga bent jau yra glaudžiai susijusi su duomenų rinkiniu. E
3.5. Duomenų rinkinys
- Apibrėžimas
- Konceptualus objektas, atitinkantis paskelbtą informaciją.
- DCAT nuoroda
- Nuoroda
- Šios klasės poklasė
- Katalogo resursas
- Savybės
- Apibrėžiamos šios šio objekto ypatybės: teisinis pagrindas, taikymo profilis, kontaktas, duomenų rinkinio pateikimas, didelės vertės duomenų rinkinio kategorija.
Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas teisinis pagrindas Legal Resource 1..* Teisės aktai, kurie įpareigoja kurti ar valdyti duomenų rinkinį. HVD atveju reikšmė privalo apimti ELI http://data.europa.eu/eli/reg_impl/2023/138/oj. Kadangi į išteklių gali būti taikomi keli teisės aktai, maksimalus kardinalumas nėra ribojamas. Lietuvoje didelės vertės duomenų rinkiniai aprašomi „tokie, kokie yra“ DCAT-AP HVD 2.2.0 specifikacijoje, su nedideliais teisinio šaltinio citavimo pakeitimais, nes ELI Lietuvoje dar nepriimtas. Šiame priede LegalResource šaltinis yra ELI atributas pavadinimu id_local. Vietinis identifikatorius naudojamas kaip Teisės aktų registre paskelbto teisinio šaltinio URI. E atitinka Standard 0..* Įgyvendinimo taisyklė ar kita specifikacija. Pateikta informacija turėtų leisti patikrinti, ar yra tenkinami išsamūs HVD informacijos reikalavimai. Daugiau naudojimo pasiūlymų žr. skyriuje apie konkrečius duomenų reikalavimus. A contact point Kind 0..* Kontaktinė informacija, kurią galima naudoti siunčiant pastabas apie duomenų rinkinį. - A duomenų rinkinio pateiktis Distribution 1..* Prieinama duomenų rinkinio pateiktis. HVD IR yra esamų duomenų rinkinių kokybės gerinimas. Tikimasi, kad HVD duomenų rinkiniai yra viešai ir atvirai prieinami. Todėl tikimasi, kad pateiktis bus pateikta. (3.1 straipsnis) A didelės vertės duomenų rinkinio kategorija Concept 1..* HVD kategorija, kuriai priklauso šis duomenų rinkinys. - P
3.6. Pateiktis
- Apibrėžimas
- Katalogas arba saugykla, kurioje yra aprašomi duomenų rinkiniai arba duomenų paslaugos.
- DCAT nuoroda
- Nuoroda
- Naudojimo pastaba
- Masiniai atsisiuntimai turi būti koduojami kaip pateikimas.
- Savybės
- Apibrėžiamos šios šio objekto ypatybės: prieigos paslauga, prieigos URL, teisinis pagrindas, licencija, susijusi schema, teisės.
Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas prieigos paslauga Data Service 0..* Duomenų paslauga, suteikianti prieigą prie duomenų rinkinio platinimo. - A prieigos URL Resource 1..* URL, suteikiantis prieigą prie duomenų rinkinio pateikties. Išteklius prieigos URL adrese turėtų apimti informaciją, kaip gauti duomenų rinkinį. Pagal DCAT gaires pageidautina taip pat nustatyti downloadURL savybę, jei URL yra nuoroda į atsisiunčiamą išteklių. A teisinis pagrindas Legal Resource 1..* Teisės aktai, kurie įpareigoja kurti ar valdyti platinimą. HVD atveju reikšmė privalo apimti ELI http://data.europa.eu/eli/reg_impl/2023/138/oj. Kadangi į išteklių gali būti taikomi keli teisės aktai, maksimalus kardinalumas nėra ribojamas. Lietuvoje didelės vertės duomenų rinkiniai aprašomi „tokie, kokie yra“ DCAT-AP HVD 2.2.0 specifikacijoje, su nedideliais teisinio šaltinio citavimo pakeitimais, nes ELI Lietuvoje dar nepriimtas. Šiame priede LegalResource šaltinis yra ELI atributas pavadinimu id_local. Vietinis identifikatorius naudojamas kaip Teisės aktų registre paskelbto teisinio šaltinio URI. E licencija Licence Document 0..1 Licencija, pagal kurią pateiktis yra prieinama. 4.3 straipsnis nurodo, kad aukštos vertės duomenų rinkiniai turėtų būti prieinami naudojimui. Pagal DCAT-AP HVD teisinės informacijos gaires tai įgyvendinama pirmenybė teikiant licenciją. Kaip alternatyvą gali būti naudojamos teisės. A susijusi schema Standard 0..* Nustatyta schema, kurią atitinka aprašyta pateiktis. Pateikta informacija turėtų leisti patikrinti, ar yra tenkinami išsamūs HVD informacijos reikalavimai. Daugiau naudojimo pasiūlymų žr. skyriuje apie konkrečius duomenų reikalavimus. A teisės Rights statement 0..* Deklaracija, kurioje nurodomos su platinimu susijusios teisės. 4.3 straipsnis nurodo, kad aukštos vertės duomenų rinkiniai turėtų būti prieinami naudojimui. Pagal DCAT-AP HVD teisinės informacijos gaires tai įgyvendinama pirmenybė teikiant licenciją. Kaip alternatyvą gali būti naudojamos teisės. A
3.7. Rūšis
- Apibrėžimas
- Aprašymas pagal "vCard" specifikaciją, pvz., nurodant kontaktinio punkto telefono numerį ir el. pašto adresą.
- Naudojimo pastaba
- Rekomenduojama pateikti bent el. laišką arba kontaktinę formą iš, pvz., aptarnavimo centro.
- Savybės
- Apibrėžiamos šios šio objekto ypatybės: kontaktas el. paštas.
Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas kontaktas Resource 0..1 Tinklalapis, kuris leidžia užmegzti kontaktą (pvz., per internetinę formą) arba informacija, kaip susisiekti. - P el.paštas Resource 0..1 El. pašto adresas, per kurį galima užmegzti kontaktą. - P
3.8. Licencijos dokumentas
- Apibrėžimas
- Teisinis dokumentas, suteikiantis oficialų leidimą ką nors daryti su ištekliais.
- Naudojimo pastaba
- Pagal HVD yra reikalaujama, kad licencija būtų pateikiama kompiuterio skaitomu būdu. Minimalių duomenų modelis licencijos dokumentui apibūdinti yra už šios specifikacijos ribų.
- Savybės
- Ši specifikacija nenustato jokių papildomų reikalavimų šio objekto ypatybėms.
4. Padėka
Norime išreikšti padėką visiems dirbusiems, kuriant DCAT-AP-LT specifikaciją: Kęstutis Andrijauskas, Martynas Mockus, Mantas Zimnickas, Darius Amilevičius, Martynas Daugirdas, Gabrielė Stočkūnaitė, Alanas Lukjanovičius, Vladimiras Desiatnikovas
5. Nuorodos
- [DCAT-AP-LT]
- Lithuanian DCAT Application Profile
- [REGISTER OF LEGAL ACTS IN LITHUANIA]
- LIthuanian register of legal acts
- [SEMIC]
- JoinUp welcomes Interoperable Europe. European Commission. URL: https://joinup.ec.europa.eu/
- [vocab-dcat-1]
- Data Catalog Vocabulary (DCAT). Fadi Maali; John Erickson. W3C. 4 February 2020. W3C Recommendation. URL: https://www.w3.org/TR/vocab-dcat-1/
- [vocab-dcat-2]
- Data Catalog Vocabulary (DCAT) - Version 2. Riccardo Albertoni; David Browning; Simon Cox; Alejandra Gonzalez Beltran; Andrea Perego; Peter Winstanley. W3C. 4 February 2020. W3C Recommendation. URL: https://www.w3.org/TR/vocab-dcat-2/
- [vocab-dcat-3]
- Data Catalog Vocabulary (DCAT) - Version 3. Simon Cox; Andrea Perego; Alejandra Gonzalez Beltran; Peter Winstanley; Riccardo Albertoni; David Browning. W3C. 18 January 2024. W3C Candidate Recommendation. URL: https://www.w3.org/TR/vocab-dcat-3/
- [DCAT-AP-HVD]
- Usage Guidelines of DCAT-AP for High-Value Datasets. European Commission. URL: https://semiceu.github.io/uri.semic.eu-generated/DCAT-AP/releases/2.2.0-hvd/
- [FAIR]
- How to make your data FAIR. OpenAire. URL: https://www.openaire.eu/how-to-make-your-data-fair
- [HVD]
- Implementing Regulation for High Value Datasets. European Union. URL: https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32023R0138