Rozhranie katalógu otvorených dát DCAT-AP-SK 2.0.1

Living Standard,

This version:
https://datova-kancelaria.github.io/dcat-ap-sk-2.0/
Editors:
Jakub Klímek (Charles University)
Miroslav Líška (MIRRI)

Abstract

Cieľom tohto dokumentu je špecifikovať dátový model a rozhranie lokálných katalógov otvorených dát (LKOD) pre ich harvestovanie Národným katalógom otevrených dát (NKOD). Rovnaká špecifikácia platí aj pre dátový model NKOD a dáta poskytované z NKOD v podobe súborov na stiahnutie resp. cez SPARQL endpoint. Najskôr je špecifikovaný dátový model katalogizačného záznamu. Následne sú špecifikované 2 varianty rozhrania pre harvestáciu, ktoré sú založené na štandarde DCAT-AP 2.1.0. Jedna používa SPARQL endpoint a druhá špecifikuje variantu uloženia záznamov v súboroch, bez použitia SPARQL endpointu.

1. Úvod

Prevádzkovanie lokálneho katalógu otvorených dát (LKOD) je jeden zo spôsobov zaistenia katalogizácie dát v Národnom katalógu otvorených dát (NKOD).

2. Položky metadátového záznamu

V tejto sekcii sú popísané položky, ktoré môžu byť evidované v Národnom katalógu otvorených dát (NKOD) pre každý dataset a jeho distribúciu. Položky sa riadia štandardom DCAT Application Profile for data portals in Europe Version 2.1.1 (DCAT-AP 2.1.1).

Konceptuálný model DCAT-AP-SK 2.0
Diagram dátového modelu DCAT-AP-SK 2.0. Šedou zafarabené časti sú špecifikované číselníkmi.

DCAT-AP 2.1.1 rozlišuje štyri základné typy entít. Katalóg, jeho datasety, distribúcie datasetov a dátovú službu. Metadáta datasetu popisujú otvorené údaje bez ohľadu na konkrétnú reprezentáciu dát. Tie sú popsáné ako distribúcie datasetu, ktoré reprezentuje buď súbor na stiahnutie, alebo odkazuje na dátovou službu, prostredníctvom ktorej sú dáta k dispozícii. Distribúcií môže mať dataset viacej, líšiť sa ale môžu jedine formátom súboru na stiahnutie (napr. CSV či JSON) alebo spôsobom sprístupnenia (súbor na stiahnutie alebo dátová služba). Obsahovo musia byť distribúcie totožné.

2.1. Použité prefixy

V popisu položiek a rozhraní budú použité následujúce prefixy slovníkov.

@prefix dcat: <http://www.w3.org/ns/dcat#> .
@prefix dct: <http://purl.org/dc/terms/> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix schema: <http://schema.org/> .
@prefix skos: <http://www.w3.org/2004/02/skos/core#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix vcard: <http://www.w3.org/2006/vcard/ns#> .
@prefix leg: <https://data.gov.sk/def/ontology/legislation/> .

Pre prehľadnosť zápisu budú použité aj nasledujúce prefixy skracujúce IRI vzorových entít.

@prefix dataset: <https://data.gov.sk/dataset/1> .
@prefix katalóg: <https://data.gov.sk/set/catalog/lkod/1> .
@prefix distribúcia: <https://data.gov.sk/set/1/resource/1> .
@prefix služba: <https://data.gov.sk/id/egov/app-service/1> .
@prefix čas: <https://data.gov.sk/set/1/temporal> .
@prefix kontakt: <https://data.gov.sk/set/1/contact-point> .
@prefix podmienky: <https://data.gov.sk/set/1/resource/1/terms-of-use> .
@prefix správca: <https://data.gov.sk/catalog/lkod/1/contact-point> .

2.2. Trieda: Katalóg

Popis

Trieda reprezentujúca dátový katalóg. Je definovaná ako dcat:Catalog.

Príklad
katalog: a dcat:Catalog .

2.2.1. Názov

Popis

Táto vlastnosť obsahuje názov dátového katalógu. Je definovaná ako dct:title.

Vlastnosť

názov, dct:title

Typ

Text

Povinnosť

Povinná

Príklad
katalog: dct:title "Katalóg otvorených dát Ministerstva dopravy"@sk, "Open Data Catalog of the Ministry of Transport"@en .

2.2.2. Popis

Popis

Táto Vlastnosť obsahuje volný text s popisom dátového katalógu. Je definovaná ako dct:description.

Vlastnosť

popis, dct:description

Typ

Text

Povinnosť

Povinná

Príklad
katalog: dct:description "Otvorené dáta Ministerstva dopravy. Obsahuje datasety o cestovných poriadkoch a liniových vedeniach verejnej dopravy."@sk, "Open data of the Ministry of Transport. It contains datasets regarding timetables of public transport."@en .

2.2.3. Poskytovateľ

Popis

Poskytovateľ dátového katalógu. Je definovaná ako dct:publisher.

Vlastnosť

poskytovateľ, dct:publisher

Typ

IRI

Povinnosť

Povinná

Príklad
katalog: dct:publisher <https://data.gov.sk/legal-subject/30416094> .

2.2.4. Kontaktný bod - meno a email

Popis

Táto Vlastnosť obsahuje kontaktné informáce, ktoré môžu byť využité pre posielanie pripomienok ku katalógu. Je definovaná ako dcat:contactPoint.

Vlastnosť

kontaktný_bod, dcat:contactPoint

Typ

Entita podtypu vcard:Kind s Vlastnosťami vcard:fn a vcard:hasEmail.

Povinnosť

Nepovinná

Príklad
katalog: dcat:contactPoint správca: .

správca: a vcard:Individual ;
         vcard:fn "Jan Novák"@sk ;
         vcard:hasEmail <mailto:jan.novak@mindop.sk> .

2.2.5. Domovská stránka

Popis

Táto Vlastnosť odkazuje na domovskú stránku lokálneho katalógu, kde môžu chodiť používatelia. Je definovaná ako foaf:homepage.

Vlastnosť

domovská_stránka, foaf:homepage

Typ

URL webové stránky

Povinnosť

Nepovinná

Príklad
katalog: foaf:homepage <https://opendata.mindop.sk/> .

2.2.6. Väzba: dataset

Popis

Táto Vlastnosť odkazuje na dataset v katalógu. Je definovaná ako dcat:dataset.

Vlastnosť

dataset, dcat:dataset

Typ

Entita typu dataset

Povinnosť

Povinná

Príklad
katalog: dcat:dataset dataset: .

2.3. Trieda: Dataset

Popis

Kolekcia dát poskytovaná či riadená jedným zdrojom, ktorá je k dispozícii pre prístup či stiahnutie v jednom či viacerých formátoch. Je definovaná ako dcat:Dataset.

Príklad
dataset: a dcat:Dataset .

2.3.1. Názov

Popis

Táto Vlastnosť obsahuje názov datasetu. Je definovaná ako dct:title.

Vlastnosť

názov, dct:title

Typ

Entita typu dataset

Povinnosť

Povinná

Príklad
dataset: dct:title "Kontroly plnenia Povinnosti zamestnávateľov v oblasti sociálneho zabezpečenia"@sk, "Duty fulfillment inspections in the area of social security"@en .

2.3.2. Popis

Popis

Táto Vlastnosť obsahuje volný text s popisom datasetu. Je definovaná ako dct:description.

Vlastnosť

popis, dct:description

Typ

Text

Povinnosť

Povinná

Príklad
dataset: dct:description "Štatistika kontrol plnenia Povinností zamestnávateľov v oblasti sociálneho zabezpečenia od roku 2009"@sk, "Social security statistics for 2009"@en .

2.3.3. Poskytovateľ

Popis

Poskytovateľ datasetu. Je definovaná ako dct:publisher.

Vlastnosť

poskytovateľ, dct:publisher

Typ

IRI

Povinnosť

Povinná

Príklad
dataset: dct:publisher <https://data.gov.sk/legal-subject/30416094> .

2.3.4. Dátum publikácie

Popis

Táto Vlastnosť obsahuje dátum publikácie (prvé vytvorenie) datasetu. Je definovaná ako dct:issued.

Vlastnosť

dátum_publikácie, dct:issued

Typ

Dátum a čas

Povinnosť

Nepovinná

Príklad
dataset: dct:issued "2024-01-21T12:00:00"^^xsd:dateTime .

2.3.5. Dátum modifikácie

Popis

Táto Vlastnosť obsahuje dátum modifikácie datasetu. Je definovaná ako dct:modified.

Vlastnosť

dátum_modifikácie, dct:modified

Typ

Dátum a čas

Povinnosť

Nepovinná

Príklad
dataset: dct:modified "2024-01-22T16:23:00"^^xsd:dateTime .

2.3.6. Téma

Popis

Táto Vlastnosť odkazuje na kategóriu alebo tému datasetu. Dataset môže byť popísaný viacerými témami. Je definovaná ako dcat:theme. Podľa DCAT-AP 2.1.1 musí byť aspoň jedna téma z európského číselníka dátových tém.

Vlastnosť

téma, dcat:theme

Typ

Viac IRI

Povinnosť

Povinná

Príklad
dataset: dcat:theme <http://publications.europa.eu/resource/authority/data-theme/TRAN> .

2.3.7. Periodicita aktualizácie

Popis

Táto Vlastnosť odkazuje na frekvenciu, s ktorou je dataset aktualizovaný. Je definovaná ako dct:accrualPeriodicity. Podľa DCAT-AP 2.1.1 sú hodnoty z európského číselníka frekvencií.

Vlastnosť

periodicita_aktualizace, dct:accrualPeriodicity

Typ

IRI položky z európského číselníka frekvencí

Povinnosť

Povinná

Príklad
dataset: dct:accrualPeriodicity <http://publications.europa.eu/resource/authority/frequency/MONTHLY> .

2.3.8. Klúčové slová

Popis

Táto Vlastnosť obsahuje kľúčové slovo alebo značku popisujúcu dataset. Je definovaná ako dcat:keyword.

Vlastnosť

kľúčové_slovo, dcat:keyword

Typ

Text, opakovaná Vlastnosť

Povinnosť

Povinná

Príklad
dataset: dcat:keyword "kontrola"@sk, "štatistika"@sk, "inspection"@en, "statistics"@en .

2.3.9. Typ datasetu

Popis

Táto Vlastnosť určuje typ datasetu. Je definovaná ako dct:type.

Vlastnosť

typ_datasetu, dct:type

Typ

IRI položiek z číselníka typ datasetu.

Povinnosť

Nepovinná

Príklady
dataset: dct:type <https://data.gov.sk/def/dataset-type/1> .

2.3.10. Súvisiace geografické územie

Popis

Táto Vlastnosť odkazuje na geografickú oblasť pokrytú datasetom. Dataset môže byť popísaný viacerými geografickými oblasťami. Je definovaná ako dct:spatial.

Vlastnosť

geografické_územie, dct:spatial

Typ

IRI položiek pre územné entity Slovenskej Republiky primárne z taxonómie NUTS-SK, európských číselníkov krajín, kontinentov, miest alebo IRI objektu z Geonames.

Povinnosť

Nepovinná

Príklady
dataset: dct:spatial <https://data.gov.sk/id/nuts1/SK0> .
dataset: dct:spatial <http://publications.europa.eu/resource/authority/continent/EUROPE> .
dataset: dct:spatial <https://sws.geonames.org/6290257/> .

2.3.11. Časové pokrytie

Popis

Táto Vlastnosť odkazuje na časový úsek pokrytý datasetom. Je definovaná ako dct:temporal.

Vlastnosť

časové_pokrytie, dct:temporal

Typ

Entita typu dct:PeriodOfTime s Vlastnosťami dcat:startDate a dcat:endDate, ktoré majú dátový typ xsd:date.

Povinnosť

Nepovinná

Príklad
dataset: dct:temporal čas: .

čas: dcat:startDate "2009-01-01"^^xsd:date ;
     dcat:endDate "2017-12-31"^^xsd:date .

2.3.12. Kontaktný bod - meno a email

Popis

Táto Vlastnosť obsahuje kontaktné informáce, ktoré môžu byť využité pre zasielanie pripomienok k datasetu. Je definovaná ako dcat:contactPoint.

Vlastnosť

kontaktný_bod, dcat:contactPoint

Typ

Entita podtypu vcard:Kind s Vlastnosťami vcard:fn a vcard:hasEmail.

Povinnosť

Nepovinná

Príklad
dataset: dcat:contactPoint kontakt: .

kontakt: a vcard:Individual ;
         vcard:fn "Jan Novák"@sk ;
         vcard:hasEmail <mailto:jan.novak@mindop.sk> .

2.3.13. Webová stránka

Popis

Táto Vlastnosť odkazuje na domovskú WWW stránku datasetu, kde dataset vznikol. Môže to byť stránka na centrálnom portáli otvorených údajov, alebo stránka v lokálnom opendatovom portáli. Je definovaná ako dcat:landingPage.

Vlastnosť

webová_stránka_datasetu, dcat:landingPage

Typ

URL webovej stránky datasetu.

Povinnosť

Nepovinná

Príklad
dataset: dcat:landingPage <https://data.gov.sk/set/kontroly-plnenia-Povinnosťi-zamestnavatelov-v-oblasti-socialneho-zabezpecenia> .

2.3.14. Súvisiaci zdroj

Popis

Táto Vlastnosť odkazuje na ľubovoľný súvisiaci zdroj datasetu. Je definovaná ako dct:relation.

Vlastnosť

súvisiaci_zdroj_datasetu, dct:relation

Typ

URL súvisiaceho zdroja datasetu.

Povinnosť

Nepovinná

Príklad
dataset: dct:relation <https://www.employment.gov.sk/sk/praca-zamestnanost/vztah-zamestnanca-zamestnavatela/zakonnik-prace/zamestnavatel/povinnosti-zamestnavatela.html> .

2.3.15. Odkaz na špecifikáciu

Popis

Táto Vlastnosť odkazuje na špecifikáciu, ktorou sa riadi dataset. Je definovaná ako dct:conformsTo.

Vlastnosť

špecifikácia, dct:conformsTo

Typ

URL špecifikácie.

Povinnosť

Nepovinná

Príklad
dataset: dct:conformsTo <https://data.gov.sk/def/ontology/finance/> .

2.3.16. Klasifikácia podľa EuroVoc

Popis

Táto Vlastnosť odkazuje na kategóriu alebo tému datasetu podľa EuroVoc. Dataset môže byť popísaný viacerými témamy. Je definovaná ako dcat:theme.

Vlastnosť

koncept_euroVoc, dcat:theme

Typ

IRI konceptov z európskeho tezauru EuroVoc.

Povinnosť

Nepovinná

Príklad
dataset: dcat:theme <http://eurovoc.europa.eu/1001>, <http://eurovoc.europa.eu/4050> .

2.3.17. Priestorové rozlíšenie v metroch

Popis

Táto Vlastnosť určuje priestorové rozlišenie dát v datasete v metroch. Jedná sa o najmenší priestorový rozdiel v datasete. Je definovaná ako dcat:spatialResolutionInMeters.

Vlastnosť

priestorové_rozlišenie_v_metroch, dcat:spatialResolutionInMeters

Typ

Desatinné číslo

Povinnosť

Nepovinná

Príklad
dataset: dcat:spatialResolutionInMeters 0.5 .

2.3.18. Časové rozlíšenie

Popis

Táto Vlastnosť určuje časové rozlišenie dát v datasete. Jedná sa o najmenší časový rozdiel v datasete. Je definovaná ako dcat:temporalResolution.

Vlastnosť

časové_rozlišenie, dcat:temporalResolution

Typ

xsd:duration

Povinnosť

Nepovinná

Príklad
dataset: dcat:temporalResolution "P1D"^^xsd:duration .

2.3.19. Väzba: Je súčásťou

Popis

Táto Vlastnosť odkazuje na zastrešujúci dataset dátovej série, ktorého je tento dataset súčasťou. Je definovaná ako dct:isPartOf.

Vlastnosť

je_sučásťou, dct:isPartOf

Typ

IRI zastrešujúceho datasetu.

Povinnosť

Nepovinná

Príklad
dataset: dct:isPartOf <https://data.gov.sk/set/pohladavky-mindop> .

2.3.20. Väzba: Distribúcia datasetu

Popis

Táto Vlastnosť odkazuje z datasetu na jej distribúciu. Je definovaná ako dcat:distribution.

Vlastnosť

distribúcia, dcat:distribution

Typ

Entita typu distribúcia datasetu.

Povinnosť

Povinná, pokiaľ nejde o zastrešujúci dataset dátovej série.

Príklad
dataset: dcat:distribution distribúcia: .

2.4. Trieda: Distribúcia datasetu

Popis

Fyzická podoba datasetu v konkrétnom formáte alebo ako konkrétná dátová služba, nikdy súčasne. Je definovaná ako dcat:Distribution.

Príklad
distribúcia: a dcat:Distribution .

2.4.1. Špecifikácia podmienok použitia

Popis

Táto Vlastnosť odkazuje na štruktúrovaný popis podmnienok použitia tejto distribúcie datasetu. Hodnoty se riadia Podmienkami použitia

Vlastnosť

podmienky_použitia, leg:termsOfUse

Typ

Entita typu leg:TermsOfUse s Vlastnosťami leg:authorsWorkType, leg:originalDatabaseType, leg:databaseProtectedBySpecialRightsType a leg:personalDataContainmentType. Voliteľne tiež leg:authorName a leg:originalDatabaseAuthorName. Viď Návrh URI pre NKOD

Povinnosť

Povinná

Príklad
distribúcia: leg:termsOfUse podmienky: .

podmienky: a leg:TermsOfUse ;
    leg:authorsWorkType <https://data.gov.sk/def/authors-work-type/3> ;
    leg:originalDatabaseType <https://data.gov.sk/def/original-database-type/3> ;
    leg:databaseProtectedBySpecialRightsType <https://data.gov.sk/def/codelist/database-creator-special-rights-type/2> ;
    leg:personalDataContainmentType <https://data.gov.sk/def/personal-data-occurence-type/2> .

2.4.2. Odkaz na stiahnutie súboru

Popis

Táto Vlastnosť obsahuje URL, ktoré je priamym odkazom na stiahnuteľný súbor v danom formáte. Je definovaná ako dcat:downloadURL.

Vlastnosť

súbor_na_stiahnutie, dcat:downloadURL

Typ

URL súbor na stiahnutie.

Povinnosť

Povinná pre súbor na stiahnutie

Príklad
distribúcia: dcat:downloadURL <https://mindop.sk/dump/kontroly-plneni-Povinnosťi-zamestnavatelu-v-oblasti-socialniho-zabezpeceni.csv> .

2.4.3. Prístupové URL

Popis

Táto Vlastnosť obsahuje URL, pomocou ktorého sa je možné dostať k distribúcii datasetu. Je definovaná ako dcat:accessURL. Pre účely katalógov otvorených dát je hodnota tejto Vlastnosti buď rovnaká ako odkaz na stiahnutie súboru v pripadě distribúcie reprezentujúcej súbor na stiahnutie, alebo rovnaká ako prístupový bod v prípadě distribúcie reprezentujúcej dátovú službu.

Vlastnosť

přístupové_url, dcat:accessURL

Typ

Prístupové URL distribúcie datasetu.

Povinnosť

Povinná

Príklad
distribúcia: dcat:accessURL <https://data.cssz.cz/dump/kontroly-plneni-Povinnosťi-zamestnavatelu-v-oblasti-socialniho-zabezpeceni.csv> .

2.4.4. Formát súboru na stiahnutie

Popis

Táto Vlastnosť odkazuje na typ súboru s distribúciou. Je definovaná ako dct:format. Podľa DCAT-AP 2.1.1 sú hodnoty z európského číselníka typov súborov.

Vlastnosť

formát, dct:format

Typ

IRI položky z európského číselníka typov súborov

Povinnosť

Povinná pre súbor na stiahnutie

Príklad
distribúcia: dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> .

2.4.5. Typ média súboru na stiahnutie

Popis

Táto Vlastnosť odkazuje na typ média distribúcie podľa oficiálneho registra typov médií spravovaného v IANA [IANA-MEDIA-TYPES]. Je definovaná ako dcat:mediaType.

Vlastnosť

typ_média, dcat:mediaType

Typ

IRI Typ média z registra IANA.

Povinnosť

Povinná pre súbor na stiahnutie

Príklad
distribúcia: dcat:mediaType <http://www.iana.org/assignments/media-types/text/csv> .

2.4.6. Odkaz na strojovo-čitateľnú schému súboru na stiahnutie

Popis

Táto Vlastnosť odkazuje na stanovenú schému, ktorou sa riadi popisovaná distribúcia. Je definovaná ako dct:conformsTo.

Vlastnosť

schéma, dct:conformsTo

Typ

URL schémy.

Povinnosť

Nepovinná

Príklad
distribúcia: dct:conformsTo <https://data.cssz.cz/dump/kontroly-plnenia-Povinnosti-zamestnavateľov-v-oblasti-sociálneho-zabezpečenia-schema.json> .

2.4.7. Typ média kompresného formátu

Popis

Táto Vlastnosť odkazuje na typ média kompresného formátu súboru podľa oficiálneho registra typov médií spravovaného v IANA [IANA-MEDIA-TYPES]. Kompresný formát určuje techniku použitú na zmenšenie veľkosti jedného súboru na stiahnutie. Je definovaná ako dcat:compressFormat.

Vlastnosť

typ_média_kompresie, dcat:compressFormat

Typ

IRI Typ media z registra IANA.

Povinnosť

Nepovinná

Príklad
distribúcia: dcat:compressFormat <http://www.iana.org/assignments/media-types/application/zip> .

2.4.8. Typ média balíčkovacieho formátu

Popis

Táto Vlastnosť odkazuje na typ média balíčkovacího formátu súboru podľa oficiálneho registra typov médií spravovaném v IANA [IANA-MEDIA-TYPES]. Balíčkovací formát určuje techniku použitú na zabalenie viacero súborov do jedného. Je definovaná ako dcat:packageFormat.

Vlastnosť

typ_média_balíčka, dcat:packageFormat

Typ

IRI Typ média z registra IANA.

Povinnosť

Nepovinná

Príklad
distribúcia: dcat:packageFormat <http://www.iana.org/assignments/media-types/application/zip> .

2.4.9. Názov distribúcie datasetu

Popis

Táto Vlastnosť obsahuje názov distribúcie. Je definovaná ako dct:title.

Vlastnosť

názov, dct:title

Typ

Text

Povinnosť

Nepovinná

Príklad
distribúcia: dct:title "Kontroly plnění Povinnosťí zaměstnavatelů v oblasti sociálního zabezpečení v CSV."@sk, "CSV representation of inspections in the area of social security."@en .

2.4.10. Väzba: prístupová služba

Popis

Dátová služba sprístupňujúca distribúciu datasetu. Je definovaná ako dcat:accessService.

Vlastnosť

prístupová_služba, dcat:accessService

Typ

Entita typu datová služba.

Povinnosť

Povinná pre dátovú službu

Príklad
distribúcia: dcat:accessService služba: .

2.5. Trieda: Dátová služba

Popis

Trieda reprezentujúca dátovú službu sprístupňujúcu dáta datasetu. Je definovaná ako dcat:DataService.

Príklad
služba: a dcat:DataService .

2.5.1. Názov

Popis

Táto Vlastnosť obsahuje názov datovej služby. Je definovaná ako dct:title.

Vlastnosť

názov, dct:title

Typ

Text

Povinnosť

Povinná

Príklad
služba: dct:title "SPARQL endpoint Slovenskej správy sociálného zabezpečenia"@sk, "Czech Social Security Administration SPARQL endpoint"@en .

2.5.2. Prístupový bod

Popis

Táto Vlastnosť obsahuje URL prístupového bodu dátovej služby. Je definovaná ako dcat:endpointURL.

Vlastnosť

prístupový_bod, dcat:endpointURL

Typ

Text

URL

Povinná

Príklad
služba: dcat:endpointURL <https://data.gov.sk/sparql> .

2.5.3. Odkaz na špecifikáciu

Popis

Táto Vlastnosť odkazuje na špecifikáciu, ktorou sa dátová služba riadi. Takou špecifikáciou je napríklad SPARQL. Zoznam možných hodnôt je možné nájsť napríklad v zozname udržiavanom Open Source Geospatial Foundation. Je definovaná ako dct:conformsTo.

Vlastnosť

špecifikácia, dct:conformsTo

Typ

URL špecifikácie.

URL

Nepovinná

Príklad
služba: dct:conformsTo <https://www.w3.org/TR/sparql11-protocol/> .

2.5.4. Popis prístupového bodu

Popis

Táto Vlastnosť obsahuje URL popisu prístupového bodu dátovej služby. Je definovaná ako dcat:endpointDescription.

Vlastnosť

popis_prístupového_bodu, dcat:endpointDescription

Typ

URL

URL

Nepovinná

Príklad
služba: dcat:endpointDescription <https://data.gov.sk/sparql> .

3. Rozhranie DCAT-AP SPARQL Endpoint

Toto rozhranie predpokladá, že metadáta datasetov podľa tejto špecifikácie sú uložené a sprístupnené prostredníctvom SPARQL endpointu [sparql11-protocol]. Po registrácii tohto SPARQL endpointu sa ho NKOD spýta najskôr na zoznam inštancií tried dcat:Dataset, a následne sa po skupinách bude pýtat na povinné, nepovinné i dalšie položky jednotlivých datasetov podľa tejto špecifikácie a špecifikácie DCAT-AP 2.1.1. Jedná se o nejjednoduchší spôsob registrácie lokálneho katalógu otvorených dát.

Datasety, distribúcie a dátové služby musia byť identifikovateľné svojimi IRI, nesmie sa jednať o RDF prázdne uzly [rdf11-concepts].

4. Rozhranie DCAT-AP Dokumenty

Táto varianta rozhrania je určená pre inštitúcie, ktoré nechcú alebo nemôžu prevádzkovať pre účely harvestácie metadát o datasetoch NKOD SPARQL endpoint. Počíta so serializáciou metadát o datasetoch do statických súborov umiestnených na webe. Ako indexový súbor následne poslúži súbor obsahujúci inštanciu triedy dcat:Catalog, ktorá pomocou Vlastnosti dcat:dataset ukazuje na URL jednotlivých datasetov. Pri prístupe na toto URL datasetov NKOD predpokladá, že v odpovedi dostane kompletný katalogizačný záznam pre dané datasety, vrátane ich distribúcií a dátových služieb.

Datasety, distribúcie a dátové služby musia byť identifikované svojími IRI, nesmie sa jednať o RDF prázdne uzly [rdf11-concepts].

4.1. Súbor katalógu

Súbor katalógu je súbor v RDF serializácii Turtle [turtle] či JSON-LD [json-ld11], ktorý obsahuje inštanciu triedy dcat:Catalog a odkazy na jednotlivé katalogizované datasety.
@prefix dcat: <http://www.w3.org/ns/dcat#> .
@prefix dct:  <http://purl.org/dc/terms/> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix vcard2006: <http://www.w3.org/2006/vcard/ns#> .

<https://data.gov.sk/set/lkod/mdsr/katalog> a dcat:Catalog ;
    dct:title "Katalóg otvorených dát Ministerstva dopravy"@sk, "Open Data Catalog of the Ministry of Transport"@en ;
    dct:description "Otvorené dáta Ministerstva dopravy. Obsahuje datasety o cestovných poriadkoch a liniových vedeniach verejnej dopravy."@sk;
    dct:description "Open data of the Ministry of Transport. It contains datasets regarding timetables of public transport."@en ;
    dct:publisher <https://data.gov.sk/legal-subject/30416094> ;
    foaf:homepage <https://www.mindop.sk> ;
    dcat:contactPoint [
        a vcard2006:Organization ;
        vcard2006:fn "Ministerstvo dopravy, Odbor verejnej dopravy"@sk, "Ministry of Transport"@en ;
        vcard2006:hasEmail <mailto:info@mindop.sk>
    ] ;
    dcat:dataset  <https://data.gov.sk/set/zoznam-zástavok-2022-10> ,
                  <https://data.gov.sk/set/líniové-vedenia-2022-10> ,
                  <https://data.gov.sk/set/zoznam-tratí-2022> .
Príklad v JSON-LD, JSON Schéma, JSON-LD kontext
{
    "@context": "https://datova-kancelaria.github.io/dcat-ap-sk-2.0/kontexty/rozhranie-katalógu-otvorených-dát.jsonld",
    "iri": "https://data.gov.sk/set/lkod/mdsr/katalog",
    "typ": "Katalóg",
    "názov": {
        "sk": "Katalóg otvorených dát Ministerstva dopravy",
        "en": "Open Data Catalog of the Ministry of Transport"
    },
    "popis": {
        "sk": "Otvorené dáta Ministerstva dopravy. Obsahuje datasety o cestovných poriadkoch a liniových vedeniach verejnej dopravy.",
        "en": "Open data of the Ministry of Transport. It contains datasets regarding timetables of public transport."
    },
    "kontaktný_bod": {
        "typ": "Organizácia",
        "meno": {
          "sk": "Ministerstvo dopravy, Odbor verejnej dopravy",
          "en": "Ministry of Transport"
        },
        "e-mail": "mailto:info@mindop.sk"
    },
    "domovská_stránka": "https://www.mindop.sk",
    "poskytovateľ": "https://data.gov.sk/legal-subject/30416094",
    "dataset": [
         "https://data.gov.sk/set/zoznam-zástavok-2022-10",
         "https://data.gov.sk/set/líniové-vedenia-2022-10",
         "https://data.gov.sk/set/zoznam-tratí-2022"
  ]
}

4.2. Súbor datasetu

Na URL špecifikovaných v súbore katalógu NKOD očakává súbory v RDF serializácii Turtle [turtle] či JSON-LD [json-ld11] obsahujúce kompletný metadatový záznam datasetu, vrátane distribúcií.
@prefix dcat: <http://www.w3.org/ns/dcat#> .
@prefix dct: <http://purl.org/dc/terms/> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix vcard2006: <http://www.w3.org/2006/vcard/ns#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

@prefix filetype: <http://publications.europa.eu/resource/authority/file-type/> .
@prefix application: <http://www.iana.org/assignments/media-types/application/> .
@prefix freq: <http://publications.europa.eu/resource/authority/frequency/> .
@prefix theme: <http://publications.europa.eu/resource/authority/data-theme/> .
@prefix continent: <http://publications.europa.eu/resource/authority/continent/> .
@prefix euroVoc: <http://eurovoc.europa.eu/> .

@prefix leg: <https://data.gov.sk/def/ontology/legislation/> .

<https://data.gov.sk/set/vld> a dcat:Dataset ;
    dct:title "Cestovné poriadky"@sk, "Public transport timetables"@en;
    dct:description "Obsahom datasetu sú schválené a aktuálne platné cestovné poriadky verejné linkové dopravy poskytnuté do Centrálneho informačního systému Cestovné poriadky ve strojovo spracovateľnom formáte."@sk ;
    dct:description "This dataset contains approved timetables and timetables in effect for public transport entered into the state-wide timetable information system."@en ;
    dct:publisher <https://data.gov.sk/legal-subject/30416094> ;
    dct:issued "2024-01-01T12:00:34"^^xsd:dateTime ;
    dct:modified "2024-01-01T14:23:16"^^xsd:dateTime ;
    dct:type <https://data.gov.sk/def/dataset-type/1> ;
    dcat:theme theme:TRAN ;
    dct:accrualPeriodicity freq:WEEKLY_3 ;
    dcat:keyword "autobusy"@sk, "cestovné poriadky"@sk, "verejná linková doprava"@sk, "timetable"@en, "bus"@en, "public transport"@en ;
    dct:spatial <https://data.gov.sk/id/nuts1/SK0> ;
    dct:temporal [
        a dct:PeriodOfTime ;
        dcat:startDate "2009-01-01"^^xsd:date ;
        dcat:endDate "2017-12-31"^^xsd:date
    ] ;
    dcat:contactPoint [
        a vcard2006:Organization ;
        vcard2006:fn "Ministerstvo dopravy, Odbor verejnej dopravy"@sk, "Ministry of Transport"@en ;
        vcard2006:hasEmail "mailto:info@mindop.sk"
    ] ;
    dcat:landingPage <https://opendata.mindop.sk/show/vld> ;
    dct:relation <https://www.mindop.sk/ministerstvo-1/cestovny-ruch-7> ;
    dct:conformsTo <https://data.gov.sk/def/ontology/transport/> ;
    dcat:theme euroVoc:4512 ;
    dcat:spatialResolutionInMeters 12.0 ;
    dcat:temporalResolution "P1D"^^xsd:duration ;
    dcat:distribution <https://data.gov.sk/set/vld/resource/csv> ,
                      <https://data.gov.sk/set/vld/resource/sparql> .

<https://data.gov.sk/set/vld/resource/csv> a dcat:Distribution ;
    leg:termsOfUse [ a leg:TermsOfUse ;
                    leg:authorsWorkType <https://creativecommons.org/licenses/by/4.0/> ;
                    leg:authorName "Ministerstvo dopravy, Odbor verejnej dopravy"@sk ;
                    leg:databaseProtectedBySpecialRightsType <https://creativecommons.org/publicdomain/zero/1.0/> ;
                    leg:originalDatabaseType <https://creativecommons.org/licenses/by/4.0/> ;
                    leg:originalDatabaseAuthorName "Ministerstvo dopravy, Odbor verejnej dopravy"@sk ;
                    leg:personalDataContainmentType <https://data.gov.sk/def/personal-data-occurence-type/2> ] ;
    dcat:accessURL <https://opendata.middop.sk/pub/draha/mestske/JDF.zip> ;
    dcat:downloadURL <https://opendata.middop.sk/pub/draha/mestske/JDF.zip> ;
    dct:format filetype:ZIP ;
    dct:conformsTo <https://opendata.middop.sk/schemy/json-schema.json> ;
    dcat:mediaType application:json ;
    dcat:compressFormat application:zip ;
    dcat:packageFormat application:zip ;
    dct:title "JSON distribúcia v ZIP súbore"@sk, "JSON distribution in ZIP file"@en .

<https://data.gov.sk/set/vld/resource/sparql> a dcat:Distribution ;
    leg:termsOfUse [ a leg:TermsOfUse ;
                    leg:authorsWorkType <https://data.gov.sk/def/authors-work-type/3> ;
                    leg:databaseProtectedBySpecialRightsType <https://data.gov.sk/def/codelist/database-creator-special-rights-type/2> ;
                    leg:originalDatabaseType <https://data.gov.sk/def/original-database-type/3> ;
                    leg:personalDataContainmentType <https://data.gov.sk/def/personal-data-occurence-type/2> ] ;
    dcat:accessURL <https://opendata.middop.sk/sparql> ;
    dct:title "SPARQL endpoint pre cestovné poriadky"@sk, "SPARQL endpoint for timetables"@en ;
    dcat:accessService <https://data.gov.sk/id/egov/app-service/123> .

<https://data.gov.sk/id/egov/app-service/123> a dcat:DataService ;
    dct:title "SPARQL endpoint pre cestovné poriadky"@sk, "SPARQL endpoint for timetables"@en ;
    dcat:endpointURL <https://opendata.middop.sk/sparql> ;
    dcat:endpointDescription <https://opendata.middop.sk/sparql> ;
    dct:conformsTo <https://www.w3.org/TR/sparql11-protocol/> .
Príklad v JSON-LD, JSON Schéma, JSON-LD kontext
{
    "@context": "https://datova-kancelaria.github.io/dcat-ap-sk-2.0/kontexty/rozhranie-katalógu-otvorených-dát.jsonld",
    "iri": "https://data.gov.sk/set/vld",
    "typ": "Dataset",
    "názov": {
        "sk": "Cestovné poriadky",
        "en": "Public transport timetables"
    },
    "popis": {
        "sk": "Obsahom datasetu sú schválené a aktuálne platné cestovné poriadky verejné linkové dopravy poskytnuté do Centrálneho informačního systému Cestovné poriadky ve strojovo spracovateľnom formáte.",
        "en": "This dataset contains approved timetables and timetables in effect for public transport entered into the state-wide timetable information system."
    },
    "poskytovateľ": "https://data.gov.sk/legal-subject/30416094",
    "dátum_publikácie": "2024-01-01T12:00:34",
    "dátum_modifikácie": "2024-01-01T14:23:16",
    "typ_datasetu": "https://data.gov.sk/def/dataset-type/1",
    "téma": [
        "http://publications.europa.eu/resource/authority/data-theme/TRAN"
    ],
    "periodicita_aktualizácie": "http://publications.europa.eu/resource/authority/frequency/WEEKLY_3",
    "kľúčové_slovo": {
        "sk": [
            "cestovné poriadky",
            "verejná linková doprava",
            "autobus"
        ],
        "en": [
            "timetable",
            "public transport",
            "bus"
        ]
    },
    "geografické_územie": [
        "https://data.gov.sk/id/nuts1/SK0"
    ],
    "prvek_rúian": [
        "https://linked.cuzk.cz/resource/ruian/stat/1"
    ],
    "časové_pokrytie": {
        "typ": "Časový interval",
        "začiatok": "2009-01-01",
        "koniec": "2017-12-31"
    },
    "kontaktný_bod": {
        "typ": "Organizácia",
        "meno": {
            "sk": "Ministerstvo dopravy, Odbor verejnej dopravy",
            "en": "Ministry of Transport"
        },
        "e-mail": "mailto:info@mindop.cz"
    },
    "webová_stránka_datasetu": "https://opendata.mindop.sk/show/vld",
    "súvisiaci_zdroj_datasetu": [
        "https://www.mindop.sk/ministerstvo-1/cestovny-ruch-7"
    ],
    "dokumentácia": "https://www.middop.sk/",
    "špecifikácia": [
        "https://data.gov.sk/def/ontology/transport/"
    ],
    "koncept_euroVoc": [
        "http://eurovoc.europa.eu/4512"
    ],
    "priestorové_rozlíšenie_v_metroch": "12.0",
    "časové_rozlíšenie": "P1D",
    "distribúcia": [{
            "iri": "https://data.gov.sk/set/vld/resource/csv",
            "typ": "Distribúcia",
            "podmienky_použitia": {
                "typ": "Špecifikácia podmienok použitia",
                "autorské_dielo": "https://creativecommons.org/licenses/by/4.0/",
                "autor": {
                    "sk": "Ministerstvo dopravy, Odbor verejnej dopravy"
                },
                "databáza_chránená_zvláštnými_právami": "https://creativecommons.org/publicdomain/zero/1.0/",
                "databáza_ako_autorské_dielo": "https://creativecommons.org/licenses/by/4.0/",
                "autor_databázy": {
                    "sk": "Ministerstvo dopravy, Odbor verejnej dopravy"
                },
                "osobné_údaje": "https://data.gov.sk/def/personal-data-occurence-type/2"
            },
            "prístupové_url": "https://mindop.sk/pub/draha/mestske/JDF.zip",
            "súbor_na_stiahnutie": "https://mindop.sk/pub/draha/mestske/JDF.zip",
            "formát": "http://publications.europa.eu/resource/authority/file-type/ZIP",
            "typ_média": "http://www.iana.org/assignments/media-types/application/json",
            "schéma": "https://portal.cisjr.cz/schemata/json-schema.json",
            "typ_média_kompresie": "http://www.iana.org/assignments/media-types/application/zip",
            "typ_média_balíčka": "http://www.iana.org/assignments/media-types/application/zip",
            "názov": {
                "en": "JSON distribution in ZIP file",
                "sk": "JSON distribúcia v ZIP soubrou"
            }
        },
        {
            "iri": "https://data.gov.sk/set/vld/resource/sparql",
            "typ": "Distribúcia",
            "podmienky_použitia": {
                "typ": "Špecifikácia podmienok použitia",
                "autorské_dielo": "https://data.gov.sk/def/authors-work-type/3",
                "databáza_chránená_zvláštnými_právami": "https://data.gov.sk/def/codelist/database-creator-special-rights-type/2",
                "databáza_ako_autorské_dielo": "https://data.gov.sk/def/original-database-type/3",
                "osobné_údaje": "https://data.gov.sk/def/personal-data-occurence-type/2"
            },
            "prístupové_url": "https://opendata.mindop.sk/sparql",
            "názov": {
                "en": "SPARQL endpoint for timetables",
                "sk": "SPARQL endpoint pre cestovné poriadky"
            },
            "prístupová_služba": {
                "iri": "https://data.gov.sk/id/egov/app-service/123",
                "typ": "Dátová služba",
                "názov": {
                    "sk": "SPARQL endpoint pre cestovné poriadky",
                    "en": "SPARQL endpoint for timetables"
                },
                "špecifikácia": [
                    "https://www.w3.org/TR/sparql11-protocol/"
                ],
                "prístupový_bod": "https://mindop.sk/sparql",
                "popis_prístupového_bodu": "https://mindop.sk/sparql"
            }
        }
    ]
}

5. Rozhranie CKAN API

CKAN API je rozhranie pre implementáciu dátového katalógu CKAN. Je založené na formáte JSON [ECMA-404], a obsahuje dve hlavné funkcie, package_list a package_show. Toto rozhranie je implemetované samotným katalógom CKAN a tiež katalógom DKAN.
Rozhranie CKAN API je podporované iba z dôvodu zpätnej kompatibility. Nebude se rozšiřovať o nové položky anie funkcionality a neumožňuje kvalitne katalogizovať datasety podľa štandardu DCAT Application Profile for data portals in Europe Version 2.1.1 (DCAT-AP 2.1.1). Rozhranie CKAN API sa prestane úplne podporovať. Pokiaľ je to možné, použite jedno z rozhraní kompatibilných s DCAT-AP.

5.1. Funkcia package_list

Táto funkcia vracia zoznam identifikátorov jednotlivých datasetov registrovaných v LKOD. Tieto identifikátory sa následne predávajú funkcii package_show v parametri id. Identifikátory môžu obsahovať písmena, čísla, pomlčky a podtržítka. Nesmú však obsahovať medzeru.
Pre URL https://organizacia.sk/api/3/action/package_list
{
   "success": true, 
   "result": [
      "zoznam-zástavky", 
      "vld", 
      "železnice"
   ]
}

5.2. Funkcia package_show

Táto funkcia vracia metadátový záznam pre dataset, ktorej identifikátor je predaný v parametri id.
Pre URL https://organizacia.sk/api/3/action/package_show?id=zeleznice
{
    "success": true,
    "result": {
        "title": "Číselník ŠÚ: Druh volieb (kód 1051)",
        "notes": "Druh volieb",
        "license_link": "https://creativecommons.org/licenses/by/4.0/",
        "maintainer_email": "info@statistics.sk",
        "maintainer": "Štatistický úrad SR",
        "tags": [{
            "name": "VOLBY"
        }, {
            "name": "číselník"
        }, {
            "name": "SÚ"
        }],
        "resources": [{
            "url": "https://statistics.sk/iSMS/cisexp.jsp?kodcis=1051&typdat=0&cisjaz=203&format=0",
            "format": "text/xml",
            "name": "Číselník v XML"
        }]
    }
}

5.3. Podmnožina hodnôt pre CKAN API záznam datasetu

V tejto sekci sú popísané položky týkajúce sa datasetu vo funkci package_show.

5.3.1. Názov datasetu

Vlastnosť

title

Typ

Reťazec

Povinnosť

Povinná

Príklad
{
    "success": true,
    "result": {
        "title": "Číselník ŠÚ: Druh volieb (kód 1051)"
    }
}

5.3.2. Popis datasetu

Vlastnosť

notes

Typ

Reťazec

Povinnosť

Povinná

Príklad
{
    "success": true,
    "result": {
        "notes": "Druh volieb"
    }
}

5.3.3. Odkaz na podmienky použitia

V štandarde DCAT-AP, na ktorom je Národný katalog otvorených dat založený, sú podmienky použitia Vlastnosťou distribúcie datasetu. V rozhraní CKAN API je to však Vlastnosťou celého datasetu. Podmienky použitia sa teda interpretujú ako identické pre všetky distribúce datasetu. Je treba povedať, že CKAN API neumožňuje špecifikovať podmienky použitia v súladu s právnými predpismy, viď § 2.4.1 Špecifikácia podmienok použitia.

Vlastnosť

license_link

Typ

URL [URL]

Povinnosť

Povinná

Príklad
{
    "success": true,
    "result": {
        "license_link": "https://creativecommons.org/licenses/by/4.0/"
    }
}

5.3.4. Email Kurátora dát

Vlastnosť

maintainer_email

Typ

Reťazec

Povinnosť

Nepovinná

Príklad
{
    "success": true,
    "result": {
        "maintainer_email": "vdb@statistics.sk"
    }
}

5.3.5. Meno Kurátora dát

Vlastnosť

maintainer

Typ

Reťazec

Povinnosť

Nepovinná

Príklad
{
    "success": true,
    "result": {
        "maintainer": "Štatistický úrad"
    }
}

5.3.6. Kľúčové slová

Vlastnosť

tags

Typ

Pole objektov s Vlastnosťou name

Povinnosť

Povinná

Príklad
{
    "success": true,
    "result": {
        "tags": [{
            "name": "VOLBY"
        }, {
            "name": "číselník"
        }, {
            "name": "ČSÚ"
        }]
    }
}

5.3.7. Distribúcia datasetu

Vlastnosť

resources

Typ

Pole objektov, viď Distribúcia v CKAN API.

Povinnosť

Povinná

Príklad
{
    "success": true,
    "result": {
        "resources": [{
            "url": "https://statistics.sk/iSMS/cisexp.jsp?kodcis=1051&typdat=0&cisjaz=203&format=0",
            "format": "text/xml",
            "name": "Číselník v XML"
        }]
    }
}

5.4. Podmnožina hodnôt pre CKAN API distribúciu datasetu

V tejto sekcii sú popísáné položky týkajúce sa distribúcie datasetu, tj. pole resources vo funkcii package_show.

5.4.1. Odkaz na stiahnutie súboru

Vlastnosť

url

Typ

URL [URL]

Povinnosť

Povinná

Príklad
{
    "success": true,
    "result": {
        "resources": [{
            "url": "https://statistics.sk/iSMS/cisexp.jsp?kodcis=1051&typdat=0&cisjaz=203&format=0"
        }]
    }
}

5.4.2. Media type súboru na stiahnutie

Vlastnosť

format

Typ

Reťazec obsahujúcí Media type podľa IANA [IANA-MEDIA-TYPES].

Povinnosť

Povinná

Príklad
{
    "success": true,
    "result": {
        "resources": [{
            "format": "text/xml"
        }]
    }
}

5.4.3. Názov distribúcie datasetu

Vlastnosť

name

Typ

Reťazec

Povinnosť

Nepovinná

Príklad
{
    "success": true,
    "result": {
        "resources": [{
            "name": "Číselník v XML"
        }]
    }
}

References

Normative References

[ECMA-404]
The JSON Data Interchange Format, 2nd edition. 1 December 2017. Standard. URL: https://www.ecma-international.org/wp-content/uploads/ECMA-404_2nd_edition_december_2017.pdf
[IANA-MEDIA-TYPES]
Media Types. URL: https://www.iana.org/assignments/media-types/
[JSON-LD11]
Gregg Kellogg; Pierre-Antoine Champin; Dave Longley. JSON-LD 1.1. URL: https://w3c.github.io/json-ld-syntax/
[RDF11-CONCEPTS]
Richard Cyganiak; David Wood; Markus Lanthaler. RDF 1.1 Concepts and Abstract Syntax. URL: https://w3c.github.io/rdf-concepts/spec/
[SPARQL11-PROTOCOL]
Lee Feigenbaum; et al. SPARQL 1.1 Protocol. URL: https://w3c.github.io/sparql-protocol/spec/
[TURTLE]
Eric Prud'hommeaux; Gavin Carothers. RDF 1.1 Turtle. URL: https://w3c.github.io/rdf-turtle/spec/
[URL]
Anne van Kesteren. URL Standard. Living Standard. URL: https://url.spec.whatwg.org/