entityXML: Ein Austausch- und Speicherformat

entityXML ist (bisher) eine Konzeptstudie in der Version 0.6.5 (BETA), die darauf abzielt, ein einheitliches XML basiertes Datenformat für die Text+ GND Agentur zu modellieren.

Das Format soll dabei vorallem drei Aspekte abdecken: Die Bereitstellung eines einheitlichen (1) Austausch- und (2) Speicherformats zur Beschreibung von Entitäten, das direkt auf die GND gemappt werden kann, und der Text+ GND Agentur zudem als (3) Workflow-Steuerungsinstrument dient.

Als Austauschformat

Als Austauschformat für die Text+ GND-Agentur soll entityXML als transparentes und dokumentiertes Format dienen, um Daten zwischen Datenlieferanten (etwa digitale Editions- oder Erschließungsprojekte) und der Text+ GND Agentur systematisch (d.h. gemäß eines wohl definierten Ablaufs) austauschen zu können. Aus diesem Grund baut das entityXML Schema grundlegend auf der GND-Ontologie als Beschreibungsmodell von Entitäten auf.

Daten, die in entityXML angelegt und ausgetauscht werden, können mit Hilfe des entityXML Schemas sowohl auf Nutzer- als auch auf Agenturseite validiert werden, um eine erste und regelmäßige Qualitätssicherung zu gewährleisten. Das Datenmodell ermöglicht in der Folge die Implementierung generischer Transformationsszenarien, die in Zukunft unteranderem den Einspeisevorgang in die GND unterstützen sollen.

Desweiteren untertützt entityXML die Kommunikation zwischen Datenlieferanten und der Text+ GND Agentur, indem Fragen, Anmerkungen und anderweitige Informationen entweder für eine ganze Lieferung oder für einzelne Einträge direkt mit erfasst und ausgewertet werden können.

Das Wichtigste zum Aspekt "Austauschformat" in Kürze:

Als Speicherformat

Als Speicherformat für Projekte bietet entityXML zahlreiche Möglichkeiten der Verwendung: Einerseits hat man hiermit eine niedrigschwellige Möglichkeit an der Hand, Entitäten wartungsarm und ohne komplexe Speicherlösung zu dokumentieren und zu speichern. Die erschlossenen Daten bleiben somit zum Einen als Erschließungsleistung der entsprechenden Projekte transparent (z.B. zum Nachweis von Arbeitsleistungen für Förderinstitutionen). Zum Zweiten können sie einfach in bestehende Forschungsdatenmanagementkonzepte (z.B. spezifische Versionierungsworkflows, Langzeitarchivierung etc.) eingebunden werden. Zum Dritten (und hier liegt ein echter Vorteil zu Excel und Co.) können die (XML) Daten, die auf diese Weise entstehen, direkt in projektspezifischen Softwarelösungen genutzt werden (z.B. Einspeisung in Webportale, Datenbanken, Erstellung von Registern, etc.).

entityXML basiert zwar auf der Idee, die GND-Ontologie zur Beschreibung von Entitäten zu verwenden. Allerdings ist das Schema offen gehalten, sprich: Sofern an die Daten, die dokumentiert werden sollen, Anforderungen gestellt werden, die sich über die GND-Ontologie nicht beschreiben lassen, dann bietet entityXML die Möglichkeit, schemafremde Elemente und Attribute aus eigenen Namensräumen mit zu erschließen. Diese Informationen werden zwar bei der Einspeisung in die GND vernachlässigt, nichtsdestoweniger bleiben sie den Projekten als integrale Bestandteile der Forschungsdaten erhalten und können selbstverständlich weiter genutzt werden.

Darüberhinaus bietet entityXML die Möglichkeit sowohl auf Datensammlungs- als auch auf Eintragsebene detailierte Revisionsbeschreibungen vorzunehmen, um Recherchestände zu dokumentieren - und kann dementsprechend dabei helfen projektinterne Arbeitsabläufe zu unterstützen.

Das Wichtigste zum Aspekt "Speicherformat" in Kürze: