Brandos lygiai#
Duomenų brandos lygis nurodomas level
stulpelyje.
Duomenų brandos lygis atitinka 5 ★ Open Data skalę, tačiau ji yra adaptuota duomenų struktūros aprašo kontekstui, brandos lygius pritaikant ir uždariems duomenims.
Pirmasis brandos lygis, kuris nurodo, kad duomenys turi būti publikuojami pagal atvirą licenciją, DSA kontekste, šis reikalavimas išplėstas ir apima ne tik atviras licencijas, bet ir bet kokias duomenų teikimo sąlygas.
Todėl reikia atkreipti dėmesį, kad duomenų brandos lygis ar formatas nėra susijęs su duomenų atvirumu. Duomenys gali būti pateikti aukščiausiu 5 brandos lygiu, tačiau pats duomenų prieinamumas gali būti visiškai uždaras, siauram naudotojų ratui, kurie turi ribotą ir saugų prieigos kanalą prie duomenų.
Papildomai įtrauktas nulinis lygis, kai duomenys nekaupiami, tačiau yra reikalingi ir yra parengtas jų duomenų struktūros aprašas.
Tim Berners Lee brandos lygius aprašo, kaip pavyzdį pasitelkiant duomenų distribucijų formatus. Tačiau duomenų distribucijų formatai yra labai netikslus pavyzdys. Rengiant duomenų struktūros aprašą, brandos lygis vertinamas kiekvienam duomenų laukui atskirai, todėl tarkime CSV failas, gali būti didesnio arba mažesnio nei trečias brandos lygio, priklausomai nuo CSV faile esančių duomenų turinio. Tačiau grubiai vertinant, vidutiniškai CSV failai turi daugiau ar mažiau 3 brandos lygį, koks ir yra nurodytas Tim Berners Lee pavyzdžiuose.
Rengiant duomenų struktūros aprašą, reikėtų nurodyti ne šaltinio duomenų brandos lygį, o galutinį brandos lygį, kuris yra gaunamas atlikus visas duomenų struktūros apraše nurodytas transformacijas.
L100: Nenuskaitoma mašininiu būdu#
Duomenys publikuojami bet kokia forma. Užpildyta resource
eilutė.
Plačiau apie brandos lygio kėlimą skaitykite skyriuje to-level-1.
Pirmu brandos lygiu žymimi duomenų laukai, kurių reikšmės neturi vientisumo, tarkime ta pati reikšmė gali būti pateikta keliais skirtingais variantais.
Pavyzdžiai
Imone |
||
---|---|---|
imones_id |
imones_pavadinimas |
rusis |
42 |
UAB "Įmonė" |
1 |
Filialas |
||||
---|---|---|---|---|
ikurimo_data |
atstumas |
imones_id._id |
imones_pavadinimas |
tel_nr |
vakar |
1 m. |
1 |
Įmonė 1 |
+370 345 36522 |
2021 rugpjūčio 1 d. |
1 m |
1 |
UAB Įmonė 1 |
8 345 36 522 |
1/9/21 |
1 metras |
1 |
Įmonė 1, UAB |
|
21/9/1 |
0.001 km |
1 |
„ĮMONĖ 1“, UAB |
037034536522 |
Struktūros aprašas |
|||||||
---|---|---|---|---|---|---|---|
d |
r |
b |
m |
property |
type |
ref |
level |
example |
|||||||
Imone |
id |
4 |
|||||
imones_id |
integer |
2 |
|||||
imones_pavadinimas |
string |
2 |
|||||
rusis |
integer |
2 |
|||||
Filialas |
3 |
||||||
ikurimo_data |
string |
1 |
|||||
atstumas |
string |
1 |
|||||
imones_id |
ref |
Imone |
1 |
||||
imones_pavadinimas |
string |
1 |
|||||
tel_nr |
string |
1 |
L101: Neaiški struktūra#
Pirmu brandos lygiu žymimi duomenys, kuriuose nėra aiškios struktūros,
pavyzdžiui ikurta
datos formatas nėra vienodas, kiekviena data užrašyta vis
kitokiu formatu.
L102: Nėra vientisumo#
Pirmu brandos lygiu žymimi duomenys, kuruose nėra vientisumo, pavyzdžiui
atstumas
užrašytas laikantis tam tikros struktūros, tačiau skirtingais
vienetais.
L103: Neįmanomas jungimas#
Pirmu brandos lygiu žymimi duomenys, kurių neįmanoma arba sudėtinga sujungti.
Pavyzdžiui Filialas
duomnų laukas imone
naudoja tam tikrą identifikatorių,
kuris nesutampa nei su vienu iš Imone
atributų, pagal kuriuose būtų galima
identifikuoti filialo įmonę.
L104: Identifikatorius nėra unikalus#
Objekto identifikatorius nėra unikalus, turi pasikartojančių reikšmių.
L105: Vienetų konvertavimo paklaida#
Tam tikrais atvejais, kai kiekybiniai duomenys pateikiami išskaidant į atskirus duomenų laukus, gali būti prarandamas duomenų tikslumas.
Pavyzdys
model |
property |
type |
ref |
level |
---|---|---|---|---|
Assmuo |
id |
4 |
||
id |
integer |
4 |
||
metai |
integer |
yr |
4 |
|
menesiai |
integer |
mo |
1 |
|
dienos |
integer |
d |
1 |
Šiame pavyzdyje nurodytas asmens amžius pateikiant atskirai metus, mėnesius ir dienas, tarkim 25 metai, 5 mėnesiai, 29 dienos.
Jei norėtume gauti amžių dienomis, rezultatas \(25*365 + 5*30 + 29 = 9304\) būtų netikslus, kadangi metai ir mėnesiai turi skirtingus dienų skaičius, todėl konvertuojant rezultatą į dienas, gausime netikslų rezultatą.
Kadangi nustatyti nėra galimybės nustatyti galutinio tikslaus mėnesio ir dienų skaičiaus, nurodomas 1 brandos lygis.
L200: Nestandartinis pateikimas#
Duomenys kaupiami struktūruota, mašininiu būdu nuskaitoma forma, bet kokiu
formatu. Užpildytas property.source
stulpelis.
Plačiau apie brandos lygio kėlimą skaitykite skyriuje to-level-2.
Antru brandos lygiu žymimi duomenų laukai, kurie pateikti vieninga forma arba pagal aiškų ir vienodą šabloną. Tačiau pateikimo būdas nėra standartinis. Nestandartinis duomenų formatas yra toks, kuris neturi viešai skelbiamos ir atviros formato specifikacijos arba, kuris nėra priimtas kaip standartas, kurį prižiūri tam tikra standartizacijos organizacija.
Pavyzdžiai
Imone |
||
---|---|---|
imones_id |
imones_pavadinimas |
rusis |
42 |
UAB "Įmonė" |
1 |
Filialas |
||||
---|---|---|---|---|
ikurimo_data |
atstumas |
imones_id |
imones_pavadinimas._id |
tel_nr |
1/9/21 |
1 m. |
1 |
UAB "Įmonė" |
(83) 111 11111 |
2/9/21 |
2 m. |
1 |
UAB "Įmonė" |
(83) 222 22222 |
3/9/21 |
3 m. |
1 |
UAB "Įmonė" |
(83) 333 33333 |
4/9/21 |
4 m. |
1 |
UAB "Įmonė" |
(83) 444 44444 |
Struktūros aprašas |
|||||||
---|---|---|---|---|---|---|---|
d |
r |
b |
m |
property |
type |
ref |
level |
example |
|||||||
JuridinisAsmuo |
kodas |
4 |
|||||
kodas |
integer |
4 |
|||||
pavadinimas@lt |
text |
4 |
|||||
Imone |
imones_id |
2 |
|||||
imones_id |
integer |
2 |
|||||
imones_pavadinimas |
string |
2 |
|||||
rusis |
integer |
2 |
|||||
Filialas |
3 |
||||||
ikurimo_data |
string |
2 |
|||||
atstumas |
string |
2 |
|||||
imones_id |
integer |
2 |
|||||
imones_pavadinimas |
string |
2 |
|||||
tel_nr |
string |
2 |
L202: Nestandartinis formatas#
Antru brandos lygiu žymimi duomenys, kurie pateikti nestandartiniu formatu. Standartinis duomenų pateikimas nurodytas prie kiekvieno duomenų tipo skyriuje Duomenų tipai. Payvzdžiui:
ikurimo_data
- nurodytasDD/MM/YY
, turėtu būtiYYYY-MM-DD
.atstumas
- nurodytaX m.
, turėtu būtiX
.tel_nr
- nurodytas(XX) XXX XXXXX
, turėtu būti+XXX-XXX-XXXXX
.
L203: Nestandartiniai kodiniai pavadinimai#
Antru brandos lygiu žymimi duomenys, kurių kodiniai pavadinimai, neatitinka standartinių reikalavimų keliamų kodiniams pavadinimams. Pavyzdžiui:
imones_id
- dubliuojamas modelio pavadinimas, turėtu būtiid
.imones_pavadinimas
- dubliuojamas modelio pavadinimas, turėtu būtipavadinimas
.ikurimo_data
- dubliuojamas tipo pavadinimas, turėtu būtiikurta
.
Taip pat žiūrėkite
L204: Nepatikimi identifikatoriai#
Antru brandos lygiu žymimi duomenys, kurių ref
tipui naudojami nepatikimi
identifikatoriai, pavyzdžiui tokie, kaip pavadinimai, kurie gali keistis arba
kartotis. Pavyzdžiui:
imones_pavadinimas
- jungimas daromas per įmonės pavadinimą, tačiau šiuo atveju kito varianto nėra, nesFilialas.imones_id
nesutampa suImone.imones_id
.
L205: Denormalizuoti duomenys#
Antru brandos lygiu žymimi duomenys, kurie dubliuoja kito modelio duomenis ir yra užrašyti nenurodant, kad tai yra duomenys dubliuojantys kito modelio duomenis. Pavyzdžiui:
Filialas.imones_id
turėtu būtiFilialas.imone.imones_id
.Filialas.imones_pavadinimas
turėtu būtiFilialas.imone.imones_pavadinimas
.
Plačiau apie denormalizuotus duomenis skaitykite skyriuje Jungtinis modelis.
L206: Nenurodytas susiejimas#
Antru brandos lygiu žymimi duomenys, kurie siejasi su kitu modeliu, tačiau tokia informacija nėra pateikta metaduomenyse. Pavyzdžiui:
Filialas.imone
-Filialas
siejasi suImone
, perFilialas.imones_pavadiniams
, todėl turėtu būti nurodytasimone ref Imone
ryšys suImone
.
L207: Neatitinka modelio bazės#
Antru brandos lygiu žymimi duomenys, kurie priklauso vienai semantinei klasei, tačiau duomenų schema nesutampa su bazinio modelio schema. Pavyzdžiui:
Imone
- priklauso semantinei klaseiJuridinisAsmuo
, tačiau tai nėra pažymėta metaduomenyse.Imone.imones_id
turėtu būtiImone.kodas
, kad sutaptu su baze (JuridinisAsmuo.kodas
).Imone.imones_pavadinimas
turėtu būtiImone.pavadinimas@lt
, kad sutaptu su baze (JuridinisAsmuo.pavadinimas@lt
).
L208: Nenurodytas enum kodinėms reikšmėms#
Antru brandos lygiu žymimi kategoriniai duomenys, kurių reikšmės pateiktos sutartiniais kodais, kurių prasmė nėra aiški. Pavyzdžiui:
Imone.rusis
- įmonės rūšis žymima skaičiais, tačiau nėra aišku, koks skaičius, ką reiškia, todėl reikia pateiktienum
sąrašą, kuriame būtų nurodyta, ką koks skaičius reiškia. Plačiau skaityti enum.
L209: Nenurodyta modelio bazė#
Modelis atitinka registre apibrėžtą esybę, tačiau nėra su ja susietas.
L210: Išskaidyta atskirais komponentais#
DSA turi sudėtinius tipus, tokius kaip date
, datetime
ir
geometry
, kuri apima kelis atskirus duomenų komponentus, kurie pateikiami
kaip viena reikšmė, nustatytu formatu.
Jei komponentai yra išskaidyti į atskirus duomenų laukus, tuomet tai yra nestandartinis duomenų pateikimas žymimas 2 brandos lygiu.
L300: Nėra identifikatoriaus#
Duomenys saugomi atviru, standartiniu formatu. Užpildytas
property.type
stulpelis ir duomenys atitinka nurodytą tipą.
Plačiau apie brandos lygio kėlimą skaitykite skyriuje to-level-3.
Trečias brandos lygis suteikiamas tada, kai duomenys pateikti vieninga forma, vieningu masteliu, naudojamas formatas yra standartinis, tai reiškia, kad yra viešai skelbiama ir atvira formato specifikacija arba pats formatas yra patvirtintas ir prižiūrimas kokios nors standartizacijos organizacijos.
Pavyzdžiai
Imone |
||
---|---|---|
id |
pavadinimas@lt |
rusis |
42 |
UAB "Įmonė" |
juridinis |
Filialas |
||||
---|---|---|---|---|
ikurta |
atstumas |
imone._id |
imone.pavadinimas@lt |
tel_nr |
2021-09-01 |
1 |
42 |
UAB "Įmonė" |
+37011111111 |
2021-09-02 |
2 |
42 |
UAB "Įmonė" |
+37022222222 |
2021-09-03 |
3 |
42 |
UAB "Įmonė" |
+37033333333 |
2021-09-04 |
4 |
42 |
UAB "Įmonė" |
+37044444444 |
Struktūros aprašas |
|||||||||
---|---|---|---|---|---|---|---|---|---|
d |
r |
b |
m |
property |
type |
ref |
level |
prepare |
title |
example |
|||||||||
JuridinisAsmuo |
kodas |
4 |
|||||||
kodas |
integer |
4 |
|||||||
pavadinimas@lt |
text |
4 |
|||||||
JuridinisAsmuo |
4 |
||||||||
Imone |
kodas |
4 |
|||||||
kodas |
4 |
||||||||
pavadinimas@lt |
4 |
||||||||
rusis |
string |
3 |
|||||||
/ |
|||||||||
Filialas |
3 |
||||||||
ikurta |
date |
3 |
|||||||
atstumas |
integer |
3 |
|||||||
imone |
ref |
Imone |
3 |
||||||
imone.kodas |
4 |
||||||||
imone.pavadinimas@lt |
4 |
||||||||
tel_nr |
string |
4 |
L301: Nėra globalaus objekto identifikatoriaus#
Nėra naudojamas globalus objekto identifikatorius, objektas identifikuojamas naudojant tik lokalų identifikatorių. Tokiu atveju, objektas negali būti nuskaitomas tiesiogiai, gali būti vykdoma tik atranka, nurodant filtrą, pagal lokalų identifikatorių.
Filialas.imone
- siejimas atliekamas perImone.kodas
, o ne perImone._id
.
L302: Nenurodyti matavimo vienetai#
Trečiu brandos lygiu žymimi kiekybiniai duomenys, kuriems nėra nurodyti
matavimo vienetai property.ref
stulpelyje. Pavyzdžiui:
atstumas
- nenurodyta, kokiais vienetais matuojamas atstumas.
L304: Neaprašyti kategoriniai duomenys#
Trečiu brandos lygiu žymimi kategoriniai duomenys, kurių reikšmės pačios savaime yra aiškios, tačiau neišvardintos struktūros apraše. Pavyzdžiui:
Imone.rusis
- įmonės rūšies kategorijos duomenys yra pateikta tekstine forma, tačiau, struktūros apraše nėra išvardintos visos galimos kategorijos ir pats duomenų laukas nėra pažymėtas, kaip kategorinis.
L400: Nesusieata su žodynais#
Duomenų objektai turi aiškius, unikalius identifikatorius. Užpildyti
model.ref
ir property.ref
stulpeliai.
Pastaba
property.ref
stulpelis pildomas šiais atvejais:
Jei duomenų laukas yra išorinis raktas (žiūrėti Jungimo būdai).
Jei duomenų laukas yra kiekybinis ir turi matavimo vienetus (žiūrėti Matavimo vienetai).
Jei duomenų laukas žymi laiką ar vietą (žiūrėti temporal-types ir spatial-types).
Plačiau apie brandos lygio kėlimą skaitykite skyriuje to-level-4.
Ketvirtas duomenų brandos lygis labiau susijęs ne su pačių duomenų formatu, bet su metaduomenimis, kurie lydi duomenis.
Duomenų struktūros apraše model.ref
stulpelyje, pateikiamas
objektą unikaliai identifikuojančių laukų sąrašas, o
property.type
stulpelyje įrašomas ref
tipas, kuris nurodo
ryšį tarp dviejų objektų.
Pavyzdžiai
Imone |
|||
---|---|---|---|
_id |
id |
pavadinimas@lt |
rusis |
26510da5-f6a6-45b0-a9b9-27b3d0090a58 |
42 |
UAB "Įmonė" |
1 |
Filialas |
|||||||
---|---|---|---|---|---|---|---|
_id |
id |
ikurta |
atstumas |
imone._id |
imone.id |
imone.pavadinimas@lt |
tel_nr |
63161bd2-158f-4d62-9804-636573abb9c7 |
1 |
2021-09-01 |
1 |
26510da5-f6a6-45b0-a9b9-27b3d0090a58 |
42 |
UAB "Įmonė" |
+37011111111 |
65ec7208-fb97-41a8-9cfc-dfedd197ced6 |
2 |
2021-09-02 |
2 |
26510da5-f6a6-45b0-a9b9-27b3d0090a58 |
42 |
UAB "Įmonė" |
+37022222222 |
2b8cdfa6-1396-431a-851c-c7c6eb7aa433 |
3 |
2021-09-03 |
3 |
26510da5-f6a6-45b0-a9b9-27b3d0090a58 |
42 |
UAB "Įmonė" |
+37033333333 |
1882bb9e-73ee-4057-b04d-d4af47f0aae8 |
4 |
2021-09-04 |
4 |
26510da5-f6a6-45b0-a9b9-27b3d0090a58 |
42 |
UAB "Įmonė" |
+37044444444 |
Struktūros aprašas |
|||||||||
---|---|---|---|---|---|---|---|---|---|
d |
r |
b |
m |
property |
type |
ref |
level |
prepare |
title |
example |
|||||||||
JuridinisAsmuo |
kodas |
4 |
|||||||
kodas |
integer |
4 |
|||||||
pavadinimas@lt |
text |
4 |
|||||||
JuridinisAsmuo |
4 |
||||||||
Imone |
kodas |
4 |
|||||||
id |
integer |
4 |
|||||||
pavadinimas@lt |
text |
4 |
|||||||
rusis |
integer |
4 |
|||||||
enum |
1 |
Juridinis |
|||||||
2 |
Fizinis |
||||||||
/ |
|||||||||
Filialas |
id |
4 |
|||||||
id |
integer |
4 |
|||||||
ikurta |
date |
D |
4 |
||||||
atstumas |
integer |
km |
4 |
||||||
imone |
ref |
Imone |
4 |
||||||
imone.id |
4 |
||||||||
imone.pavadinimas@lt |
4 |
||||||||
tel_nr |
string |
4 |
L401: Nesusieta su standartiniu žodynu#
Ketvirtu brandos lygiu žimimi duomenys, kurie nėra susieti su standartiniais
žodynais ar ontologijomis. Siejimas su žodynais atliekamas model.uri
ir
property.uri
stulpeluose.
L500: Trūkumų nėra#
Modeliai iš įstaigų duomenų rinkinių vardų erdvės susieti su modeliais
iš standartų vardų erdvės, užpildyta base
eilutė. Standartų
vardų erdvėje esantiems modeliams ir jų
savybėms užpildytas uri
stulpelis.
Daugiau apie vardų erdves skaitykite skyrelyje: vardu-erdves.
Plačiau apie brandos lygio kėlimą skaitykite skyriuje to-level-5.
Penkto brandos lygio duomenys yra lygiai tokie patys, kaip ir ketvirto
brandos lygio, tačiau penktame brandos lygyje, duomenys yra praturtinami
metaduomenimis, pateikiant nuorodas į išorinius žodynus arba bent jau
pateikiant aiškius pavadinimus ir aprašymus, užpildant title
ir
description
stulpelius.
Penktame brandos lygyje visas dėmesys yra sutelkiamas į semantinę duomenų prasmę.
Pavyzdžiai
Imone |
|||
---|---|---|---|
_id |
id |
pavadinimas@lt |
rusis |
26510da5-f6a6-45b0-a9b9-27b3d0090a58 |
42 |
UAB "Įmonė" |
1 |
Filialas |
|||||||
---|---|---|---|---|---|---|---|
_id |
id |
ikurta |
atstumas |
imone._id |
imone.id |
imone.pavadinimas@lt |
tel_nr |
63161bd2-158f-4d62-9804-636573abb9c7 |
1 |
2021-09-01 |
1 |
26510da5-f6a6-45b0-a9b9-27b3d0090a58 |
42 |
UAB "Įmonė" |
tel:+37011111111 |
65ec7208-fb97-41a8-9cfc-dfedd197ced6 |
2 |
2021-09-02 |
2 |
26510da5-f6a6-45b0-a9b9-27b3d0090a58 |
42 |
UAB "Įmonė" |
tel:+37022222222 |
2b8cdfa6-1396-431a-851c-c7c6eb7aa433 |
3 |
2021-09-03 |
3 |
26510da5-f6a6-45b0-a9b9-27b3d0090a58 |
42 |
UAB "Įmonė" |
tel:+37033333333 |
1882bb9e-73ee-4057-b04d-d4af47f0aae8 |
4 |
2021-09-04 |
4 |
26510da5-f6a6-45b0-a9b9-27b3d0090a58 |
42 |
UAB "Įmonė" |
tel:+37044444444 |
Struktūros aprašas |
||||||||||
---|---|---|---|---|---|---|---|---|---|---|
d |
r |
b |
m |
property |
type |
ref |
level |
uri |
prepare |
title |
example |
||||||||||
prefix |
foaf |
http://xmlns.com/foaf/0.1/ |
||||||||
dct |
http://purl.org/dc/terms/ |
|||||||||
schema |
http://schema.org/ |
|||||||||
JuridinisAsmuo |
kodas |
4 |
||||||||
kodas |
integer |
4 |
||||||||
pavadinimas@lt |
text |
4 |
||||||||
JuridinisAsmuo |
4 |
|||||||||
Imone |
id |
5 |
foaf:Organization |
|||||||
id |
5 |
dct:identifier |
||||||||
pavadinimas@lt |
5 |
dct:title |
||||||||
rusis |
integer |
4 |
||||||||
enum |
1 |
Juridinis |
||||||||
2 |
Fizinis |
|||||||||
/ |
||||||||||
Filialas |
id |
5 |
schema:LocalBusiness |
|||||||
id |
date |
1D |
5 |
dct:identifier |
||||||
ikurta |
date |
1D |
5 |
dct:created |
||||||
atstumas |
integer |
km |
5 |
schema:distance |
||||||
imone |
ref |
Imone |
5 |
foaf:Organization |
||||||
imone.id |
integer |
5 |
dct:identifier |
|||||||
imone.pavadinimas@lt |
text |
5 |
dct:title |
|||||||
tel_nr |
string |
5 |
foaf:phone |