DCAT-AP-LT HVD

Technical Specification,


1. Įžanga

Didelės vertės duomenų rinkinių apibrėžimas atsirado iš poreikio identifikuoti svarbiausius duomenis pavyzdžiui:

Šie duomenys turi didžiausią potencialą daryti įtaką svarbiausioms Europos Komisijos įvardintoms sritims. Tokių duomenų atvėrimas ir pakartotinis panaudojimas sukuria didelę pridėtinę vertę, bet tuo pačiu reikalauja papildomų taisyklių, reglamentuojančių jų prieinamumą, sąveikumą ir panaudojimą. Atsižvelgiant į tai, kad DCAT-AP plėtinys negali pilnai patenkinti didelės vertės duomenų rinkinių kokybės, patikimumo bei atvirumo reikalavimų, buvo pradėtas vystyti DCAT-AP HVD plėtinys, remiantis gairėmis, kurios pateiktos Didelės vertės duomenų rinkinio įgyvendinimo reglamente . Atitinkamai šis plėtinys yra adaptuojamas ir DCAT-AP-LT, pakeičiant LegalResource išteklių į atributą pagal ELI:LegalResource pavadinimu id_local.

2. Bendrosios didelės vertės duomenų rinkinių savybės

Didelės vertės duomenų rinkiniai pasižymi specifiniais techniniais ir teisiniais reikalavimais. Šiems duomenų rinkiniams taikomi šie bendri reikalavimai:

Atsižvelgiant į šias savybes ir, atitinkamai, iš to išplaukiančius reikalavimus, DCAT-AP-LT specifikacijoje atsiranda poreikis taikyti papildomas, modifikuotas ar sugriežtintas metaduomenų specifikacijos taisykles didelės vertės duomenų rinkiniams. Šios taisyklės apima DCAT-AP klases papildančias savybes ar griežtesnį esamų savybių privalomumo taikymą ir yra apibrėžtos DCAT-AP HVD priede.
Lietuvoje didelės vertės duomenų rinkiniai aprašomi „tokie, kokie yra“ DCAT-AP HVD 2.2.0 specifikacijoje, su nedideliais teisinio šaltinio citavimo pakeitimais, nes ELI Lietuvoje dar nepriimtas. Šiame priede LegalResource šaltinis yra ELI atributas pavadinimu id_local. Vietinis identifikatorius naudojamas kaip Teisės aktų registre paskelbto teisinio šaltinio URI.

3. Didelės vertės duomenų rinkiniams naudojamos (DCAT-AP HVD) klasės ir savybės

3.1. Katalogas

Apibrėžimas
Katalogas arba saugykla, kurioje yra aprašomi duomenų rinkiniai arba duomenų paslaugos.
DCAT nuoroda
Nuoroda
Savybės
Apibrėžiamos šios šio objekto ypatybės: duomenų rinkinys, įrašas, paslauga.


Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas
duomenų rinkinys Dataset 0..* Duomenų rinkinys, kuris yra dalis katalogo. Kadangi tuščių katalogų paprastai yra problemų požymis, šią savybę reikėtų derinti su kita savybe „service“, kad būtų įgyvendinta tuščio katalogo patikra. A
įrašas Catalogue Record 0..* Katalogo įrašas, kuris yra dalis katalogo. A
paslauga Data Service 0..* Svetainė arba galutinis taškas (duomenų paslauga), kuris yra išvardytas kataloge. Kadangi tuščių katalogų paprastai yra problemų požymis, šią savybę reikėtų derinti su ankstesne savybe „dataset“, kad būtų įgyvendinta tuščio katalogo patikra. A

3.2. Katalogo įrašas

Apibrėžimas
Duomenų rinkinio įrašo kataloge aprašymas.
DCAT nuoroda
Nuoroda
Savybės
Apibrėžiamos šios šio objekto ypatybės: pagrindinė tema,


Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas
pagrindinė tema Catalogued Resource 1 Nuoroda į aprašytąjį duomenų rinkinį, duomenų paslaugą arba katalogą. Katalogo įrašas nurodys vieną subjektą kataloge. Tai gali būti arba duomenų rinkinys, arba duomenų paslauga. Siekiant užtikrinti neambicingą kardinalumo skaitymą, diapazonas nustatomas kaip Kataloguojamas išteklius. Tačiau šio diapazono tikslas nėra reikalauti eksplicitiškai naudoti klasę Kataloguotas įrašas. Kaip abstrakti klasė, turėtų būti naudojama antrinė klasė. A

3.3. Katalogo išteklius

Apibrėžimas
Šaltinis, kurį paskelbė arba kuravo vienas agentas.
DCAT nuoroda
Nuoroda
Naudojimo pastaba
Ši klasė yra laikoma kaip abstrakti sąvoka.
Savybės
Ši specifikacija nenustato jokių papildomų reikalavimų šio objekto savybėms.

3.4. Duomenų paslauga

Apibrėžimas
Operacijų rinkinys, suteikiantis prieigą prie vieno ar daugiau duomenų rinkinių arba duomenų apdorojimo funkcijų.
DCAT nuoroda
Nuoroda
Šios klasės poklasė
Katalogo resursas
Savybės
Apibrėžiamos šios šio objekto ypatybės: teisinis pagrindas, kontaktas, dokumentacija, prieigos taško aprašymas, prieigos taško URL, didelės vertės duomenų rinkinio kategorija, licencija, teisės, pateikia duomenų rinkinį.


Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas
teisinis pagrindas Legal Resource 1..* Teisės aktai, kurie įpareigoja kurti ar valdyti duomenų paslaugą. HVD atveju reikšmė PRIVALO apimti ELI http://data.europa.eu/eli/reg_impl/2023/138/oj. Kadangi į išteklių gali būti taikomi keli teisės aktai, maksimalus kardinalumas nėra ribojamas. Lietuvoje didelės vertės duomenų rinkiniai aprašomi „tokie, kokie yra“ DCAT-AP HVD 2.2.0 specifikacijoje, su nedideliais teisinio šaltinio citavimo pakeitimais, nes ELI Lietuvoje dar nepriimtas. Šiame priede LegalResource šaltinis yra ELI atributas pavadinimu id_local. Vietinis identifikatorius naudojamas kaip Teisės aktų registre paskelbto teisinio šaltinio URI. E
kontaktas Kind 1..* Kontaktinė informacija, kurią galima naudoti siunčiant pastabas apie duomenų paslaugą. 3.4 straipsnis reikalauja paskirti kontaktinį tašką API. A
dokumentacija Document 1..* Puslapis, kuriame pateikiama papildoma informacija apie duomenų paslaugą. Paslaugų kokybė apima plačią aspektų spektrą. HVD reglamentas nenustato jokių privalomų temų. Todėl paslaugų kokybės informacija laikoma bendrosios duomenų paslaugos dokumentacijos dalimi. P
prieigos taško aprašymas Resource 0..* Aprašymas paslaugų, prieinamų per galutinius taškus, įskaitant jų operacijas, parametrus ir t.t. Savybė pateikia konkrečias faktinių galutinių taškų detales, o dct:conformsTo naudojama nurodyti bendrąjį standartą ar specifikaciją, kurią įgyvendina galutiniai taškai. 3.3 straipsnis reikalauja pateikti API dokumentaciją Sąjungos arba tarptautiniu mastu pripažintu atviru, žmogui skaitomu ir mašinai skaitomu formatu. A
prieigos taško URL Resource 1..* Pagrindinė paslaugos vieta arba pirminis galutinis taškas (IRI). Galutinio taško URL TURĖTŲ būti pastovus. Tai reiškia, kad leidėjai turėtų daryti viską, kas įmanoma, kad išlaikytų reikšmę stabilia ir egzistuojančia. A
didelės vertės duomenų rinkinio kategorija Concept 1..* HVD kategorija, kuriai priklauso ši duomenų paslauga. - P
licencija Licence Document 0..1 Licencija, pagal kurią teikiama duomenų paslauga. 3.3 straipsnis nurodo, kad turi būti pateiktos naudojimo sąlygos. Pagal DCAT-AP HVD teisinės informacijos gaires tai įgyvendinama pirmenybė teikiant licenciją. Kaip alternatyvą gali būti naudojamos teisės. A
teisės Rights statement 0..* Deklaracija, kuriame nurodomos su platinimu susijusios teisės. 3.3 straipsnis nurodo, kad turi būti pateiktos naudojimo sąlygos. Pagal DCAT-AP HVD teisinės informacijos gaires tai įgyvendinama pirmenybė teikiant licenciją. Kaip alternatyvą gali būti naudojamos teisės. A
pateikia duomenų rinkinį Dataset 1..* Ši savybė nurodo duomenų rinkinį, kurį ši duomenų paslauga gali platinti. API HVD kontekste nėra atskiras išteklius. Jis naudojamas atverti HVD duomenų rinkinius. Todėl kiekviena duomenų paslauga bent jau yra glaudžiai susijusi su duomenų rinkiniu. E

3.5. Duomenų rinkinys

Apibrėžimas
Konceptualus objektas, atitinkantis paskelbtą informaciją.
DCAT nuoroda
Nuoroda
Šios klasės poklasė
Katalogo resursas
Savybės
Apibrėžiamos šios šio objekto ypatybės: teisinis pagrindas, taikymo profilis, kontaktas, duomenų rinkinio pateikimas, didelės vertės duomenų rinkinio kategorija.


Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas
teisinis pagrindas Legal Resource 1..* Teisės aktai, kurie įpareigoja kurti ar valdyti duomenų rinkinį. HVD atveju reikšmė privalo apimti ELI http://data.europa.eu/eli/reg_impl/2023/138/oj. Kadangi į išteklių gali būti taikomi keli teisės aktai, maksimalus kardinalumas nėra ribojamas. Lietuvoje didelės vertės duomenų rinkiniai aprašomi „tokie, kokie yra“ DCAT-AP HVD 2.2.0 specifikacijoje, su nedideliais teisinio šaltinio citavimo pakeitimais, nes ELI Lietuvoje dar nepriimtas. Šiame priede LegalResource šaltinis yra ELI atributas pavadinimu id_local. Vietinis identifikatorius naudojamas kaip Teisės aktų registre paskelbto teisinio šaltinio URI. E
atitinka Standard 0..* Įgyvendinimo taisyklė ar kita specifikacija. Pateikta informacija turėtų leisti patikrinti, ar yra tenkinami išsamūs HVD informacijos reikalavimai. Daugiau naudojimo pasiūlymų žr. skyriuje apie konkrečius duomenų reikalavimus. A
contact point Kind 0..* Kontaktinė informacija, kurią galima naudoti siunčiant pastabas apie duomenų rinkinį. - A
duomenų rinkinio pateiktis Distribution 1..* Prieinama duomenų rinkinio pateiktis. HVD IR yra esamų duomenų rinkinių kokybės gerinimas. Tikimasi, kad HVD duomenų rinkiniai yra viešai ir atvirai prieinami. Todėl tikimasi, kad pateiktis bus pateikta. (3.1 straipsnis) A
didelės vertės duomenų rinkinio kategorija Concept 1..* HVD kategorija, kuriai priklauso šis duomenų rinkinys. - P

3.6. Pateiktis

Apibrėžimas
Katalogas arba saugykla, kurioje yra aprašomi duomenų rinkiniai arba duomenų paslaugos.
DCAT nuoroda
Nuoroda
Naudojimo pastaba
Masiniai atsisiuntimai turi būti koduojami kaip pateikimas.
Savybės
Apibrėžiamos šios šio objekto ypatybės: prieigos paslauga, prieigos URL, teisinis pagrindas, licencija, susijusi schema, teisės.


Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas
prieigos paslauga Data Service 0..* Duomenų paslauga, suteikianti prieigą prie duomenų rinkinio platinimo. - A
prieigos URL Resource 1..* URL, suteikiantis prieigą prie duomenų rinkinio pateikties. Išteklius prieigos URL adrese turėtų apimti informaciją, kaip gauti duomenų rinkinį. Pagal DCAT gaires pageidautina taip pat nustatyti downloadURL savybę, jei URL yra nuoroda į atsisiunčiamą išteklių. A
teisinis pagrindas Legal Resource 1..* Teisės aktai, kurie įpareigoja kurti ar valdyti platinimą. HVD atveju reikšmė privalo apimti ELI http://data.europa.eu/eli/reg_impl/2023/138/oj. Kadangi į išteklių gali būti taikomi keli teisės aktai, maksimalus kardinalumas nėra ribojamas. Lietuvoje didelės vertės duomenų rinkiniai aprašomi „tokie, kokie yra“ DCAT-AP HVD 2.2.0 specifikacijoje, su nedideliais teisinio šaltinio citavimo pakeitimais, nes ELI Lietuvoje dar nepriimtas. Šiame priede LegalResource šaltinis yra ELI atributas pavadinimu id_local. Vietinis identifikatorius naudojamas kaip Teisės aktų registre paskelbto teisinio šaltinio URI. E
licencija Licence Document 0..1 Licencija, pagal kurią pateiktis yra prieinama. 4.3 straipsnis nurodo, kad aukštos vertės duomenų rinkiniai turėtų būti prieinami naudojimui. Pagal DCAT-AP HVD teisinės informacijos gaires tai įgyvendinama pirmenybė teikiant licenciją. Kaip alternatyvą gali būti naudojamos teisės. A
susijusi schema Standard 0..* Nustatyta schema, kurią atitinka aprašyta pateiktis. Pateikta informacija turėtų leisti patikrinti, ar yra tenkinami išsamūs HVD informacijos reikalavimai. Daugiau naudojimo pasiūlymų žr. skyriuje apie konkrečius duomenų reikalavimus. A
teisės Rights statement 0..* Deklaracija, kurioje nurodomos su platinimu susijusios teisės. 4.3 straipsnis nurodo, kad aukštos vertės duomenų rinkiniai turėtų būti prieinami naudojimui. Pagal DCAT-AP HVD teisinės informacijos gaires tai įgyvendinama pirmenybė teikiant licenciją. Kaip alternatyvą gali būti naudojamos teisės. A

3.7. Rūšis

Apibrėžimas
Aprašymas pagal "vCard" specifikaciją, pvz., nurodant kontaktinio punkto telefono numerį ir el. pašto adresą.
Naudojimo pastaba
Rekomenduojama pateikti bent el. laišką arba kontaktinę formą iš, pvz., aptarnavimo centro.
Savybės
Apibrėžiamos šios šio objekto ypatybės: kontaktas el. paštas.


Savybė Intervalas Kard Apibrėžimas Naudojimas Perpanaudojimas
kontaktas Resource 0..1 Tinklalapis, kuris leidžia užmegzti kontaktą (pvz., per internetinę formą) arba informacija, kaip susisiekti. - P
el.paštas Resource 0..1 El. pašto adresas, per kurį galima užmegzti kontaktą. - P

3.8. Licencijos dokumentas

Apibrėžimas
Teisinis dokumentas, suteikiantis oficialų leidimą ką nors daryti su ištekliais.
Naudojimo pastaba
Pagal HVD yra reikalaujama, kad licencija būtų pateikiama kompiuterio skaitomu būdu. Minimalių duomenų modelis licencijos dokumentui apibūdinti yra už šios specifikacijos ribų.
Savybės
Ši specifikacija nenustato jokių papildomų reikalavimų šio objekto ypatybėms.

4. Padėka

Norime išreikšti padėką visiems dirbusiems, kuriant DCAT-AP-LT specifikaciją: Kęstutis Andrijauskas, Martynas Mockus, Mantas Zimnickas, Darius Amilevičius, Martynas Daugirdas, Gabrielė Stočkūnaitė, Alanas Lukjanovičius, Vladimiras Desiatnikovas

5. Nuorodos

[DCAT-AP-LT]
Lithuanian DCAT Application Profile
LIthuanian register of legal acts
[SEMIC]
JoinUp welcomes Interoperable Europe. European Commission. URL: https://joinup.ec.europa.eu/
[vocab-dcat-1]
Data Catalog Vocabulary (DCAT). Fadi Maali; John Erickson. W3C. 4 February 2020. W3C Recommendation. URL: https://www.w3.org/TR/vocab-dcat-1/
[vocab-dcat-2]
Data Catalog Vocabulary (DCAT) - Version 2. Riccardo Albertoni; David Browning; Simon Cox; Alejandra Gonzalez Beltran; Andrea Perego; Peter Winstanley. W3C. 4 February 2020. W3C Recommendation. URL: https://www.w3.org/TR/vocab-dcat-2/
[vocab-dcat-3]
Data Catalog Vocabulary (DCAT) - Version 3. Simon Cox; Andrea Perego; Alejandra Gonzalez Beltran; Peter Winstanley; Riccardo Albertoni; David Browning. W3C. 18 January 2024. W3C Candidate Recommendation. URL: https://www.w3.org/TR/vocab-dcat-3/
[DCAT-AP-HVD]
Usage Guidelines of DCAT-AP for High-Value Datasets. European Commission. URL: https://semiceu.github.io/uri.semic.eu-generated/DCAT-AP/releases/2.2.0-hvd/
[FAIR]
How to make your data FAIR. OpenAire. URL: https://www.openaire.eu/how-to-make-your-data-fair
[HVD]
Implementing Regulation for High Value Datasets. European Union. URL: https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32023R0138