Skip to content

GovDataOfficial/DCAT-AP.de-SHACL-Validation

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DCAT-AP.de SHACL-Validation

⚠️ Hinweis zur aktuellen Entwicklung ⚠️
Die DCAT-AP.de SHACL-Validation wird aktuell mit Blick auf die DCAT-AP.de 3.0 Spezifikation weiterentwickelt.
Wenn Sie Fehler entdecken, dann freuen wir uns über Ihr Feedback!

DCAT-AP.de 3.0 - Spezifikation

Basiert auf dem Profil DCAT-AP 3.0 - Übersetzungen und Einschränkungen und ergänzt es um folgende Aspekte:

DCAT-AP 3.0 - Übersetzungen und Einschränkungen

Die SEMIC stellt ihren eigenen DCAT-AP-Validator zur Verfügung, der zuverlässig funktioniert.

Dieses Validierungsprofil basiert auf de SEMIC Datei (https://github.com/SEMICeu/DCAT-AP/blob/master/releases/3.0.0/shacl/dcat-ap-SHACL.ttl) erweitert um die Datei dcat-ap-SHACL-DE.ttl. Die deutschen Erweiterungen verändern die Validierung wie folgt:

  • Hinzufügen deutschsprachiger Fehlermeldungen
  • Deaktivierung von Shapes, die eine nicht sinnvolle Range prüfen

Betroffen sind die Klassen dcterms:Frequency, dcterms:LicenseDocument, dcterms:LinguisticSystem, dcterms:MediaType, dcterms:MediaTypeOrExtent, dcterms:ProvenanceStatement, dcterms:RightsStatement, dcterms:Standard, eli:LegalResource, foaf:Document, locn:Geometry, odrl:Policy, prov:Activity, prov:Attribution, rdfs:Resource, skos:Concept, skos:ConceptScheme und spdx:ChecksumAlgorithm.

DCAT-AP.de 2.0 - Spezifikation

Die SEMIC stellt ihren eigenen DCAT-AP-Validator zur Verfügung, der zuverlässig funktioniert.

Der deutsche Validator verwendet die verpflichtenden Regeln der SEMIC und reichert sie mit deutschen Fehlernachrichten an. Dazu werden folgende Dateien verwendet:

Die folgende Datei fügt zu den DCAT-AP-SHACL-Shapes deutsche Regeln hinzu, so dass DCAT-AP.de 2.0 geprüft wird. Dafür werden zum Teil auch widersprüchliche DCAT-AP-SHACL-Shapes deaktiviert:

Weitere externe Quellen, wie Ontologien, deren Kontext relevant sind oder kontrollierte Vokabulare, werden durch diese Datei importiert:

Prüfungen

  • Verwendung aller Pflichteigenschaften
  • Min- und Max-Kardinalitäten
  • Verwendung (getypter) Literals, wenn zutreffend
  • Verwendung von URIs, wenn als Ziel eine Klasse erwartet wird
  • Verwendung von URIs, wenn als Ziel eine beliebige Webadresse erwartet wird
  • Verwendung der korrekten kontrollierten Vokabulare
  • Warnung bei der Verwendung von deprecated-Eigenschaften

Ob das Objekt einer Eigenschaft die von DCAT-AP(.de) vorgegebene Klasse hat, wird geprüft, wenn der Aufbau des Objekts für den Anwendungsfall "Anlieferung an ein Metadatenportal" entscheidend ist. Dies betrifft die DCAT-AP-Kernklassen und Eigenschaften dcat:catalog, dcat:dataset, dcat:service, dcat:record und dcat:distribution sowie die Eigenschaften, die auf z.B. foaf:Agent, dct:PeriodOfTime oder dct:Location verweisen.

Für die Eigenschaften adms:sample, dct:source, dct:hasVersion, dct:isVersionOf, dct:hasPart und dct:isPartOf wird davon ausgegangen, dass deren Objekte nicht im Kern der Validierung stehen. Daher wird lediglich gewarnt, wenn sie nicht die korrekte Klasse haben.

Keine Prüfungen

  • Kategorie (da kontrolliertes Vokabular genutzt werden muss)
  • Kategorienschema (da kontrolliertes Vokabular genutzt werden muss)
  • Lizenzdokument (da kontrolliertes Vokabular genutzt werden muss)

DCAT-AP.de 2.0 - Spezifikation & Konventionen

Dieses Profil prüft alles, was DCAT-AP.de SHACL-Validation prüft. Zusätzlich:

Prüfung von Konventionen

  • K01: dcat:contactPoint: Kontaktinformationen MÜSSEN mindestens Angaben zur Email (vcard:hasEmail) oder einen Link zum Kontaktformular oder Chatbot (vcard:hasURL) enthalten.
  • K12&13: dcat:Dataset: dcatde:contributorID MUSS verwendet werden und DARF nur genau einmal eine IRI aus http://dcat-ap.de/def/contributors/ verwenden.
  • K36: dcat:Dataset: dct:publisher MUSS verwendet werden.
  • K30: dcat:Dataset: dcat:theme: Zur Steigerung der Metadatenqualität wird die Angabe von Kategorien empfohlen.
  • K31: dcat:Distribution: dct:license MUSS eine IRI aus http://dcat-ap.de/def/licenses/ verwenden.
  • K32: dcat:Distribution: dct:format MUSS eine IRI aus dem EU Vokabular 'File Type' verwenden.

Prüfung besonders empfohlener Eigenschaften

  • dcat:Dataset: dcat:distribution: Es wird empfohlen, dass jedes Dataset über eine Distribution verfügt.
  • dcat:Dataset: dcat:keyword: Zur Steigerung der Metadatenqualität wird die Angabe von Schlagworten empfohlen.
  • dcat:Dataset: dcat:landingPage: Zur Steigerung der Metadatenqualität wird die Angabe der ursprünglichen Webseite empfohlen.
  • dcat:Dataset: dct:issued: Zur Steigerung der Metadatenqualität wird die Angabe des Veröffentlichungsdatums empfohlen.
  • dcat:Distribution: dct:title: Es wird empfohlen, dass jede Distribution über einen dct:title verfügt.

Prüfung im Rahmen der Dublettenprüfung

  • dcat:Dataset: Ggf. MUSS dct:identifier zur Dublettenprüfung verwendet werden.
  • dcat:Dataset: Ggf. MUSS dct:modified zur Dublettenprüfung verwendet werden.

Prüfung auf (ausgewählte) sinnvolle Ranges

Die Auswahl erfolgte mit Blick auf die Verarbeitung im GovData-Frontend.

  • dcat:Dataset: IRIorLiteral: dct:conformsTo, dct:accessRights, dct:provenance
  • dcat:Dataset: IRI: prov:wasGeneratedBy, dcat:landingPage, foaf:page
  • dcat:Catalog: IRIorLiteral: dct:rights
  • dcat:Catalog: IRI: foaf:homepage
  • dcat:DataService: IRIorLiteral: dct:accessRights
  • dcat:Distribution: IRIorLiteral: dct:conformsTo, dct:rights
  • dcat:Distribution: IRI: foaf:page, odrl:hasPolicy
  • dcat:CatalogRecord: IRIorLiteral: dct:conformsTo

GovData MQA/Dashboard

Diese Profile prüfen Eigenschaften, die auch im GovData-Dashboard zur Metadatenqualität angezeigt werden.


Weitere Informationen

Feedback gerne als GitHub Issue oder per E-Mail an info@govdata.de.

Bisherige Inhalte wurden in die Datei README_v1X.md verschoben.

© CC BY 4.0 ']init[ AG für GovData'

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy