Navigation überspringen
Ruprecht-Karls-Universität Heidelberg
Universitätsbibliothek
heiEDITIONS - Heidelberger digitale Editionen
Kontakt

Dr. Jakub Šimek
Universitätsbibliothek Heidelberg
Tel: +49 (0) 6221 54-2033
E-Mail

Leonhard Maylein
Universitätsbibliothek Heidelberg
Tel: +49 (0) 6221 54-2591
E-Mail

Dr. Maria Effinger
Universitätsbibliothek Heidelberg
Tel: +49 (0) 6221 54-3561
Brief E-Mail

Text Encoding Initiative

Logo von TEI.org
Die Universitätsbibliothek Heidelberg ist institutionelles Mitglied des TEI-Consortiums.

Infrastruktur von heiEDITIONS


Arbeit am Datenmodell von heiEDITIONS im Programm Oxygen XML Editor

Digitale Editionen stellen ein dynamisches Feld dar, das sich einerseits durch die Absetzung von herkömmlichen Präsentationsmodi gedruckter Editionen profiliert, andererseits aber auch als Surrogat, Vorstufe, Ergänzung, Erweiterung oder dokumentarisches Materialarchiv mit dem gedruckten Buch verschiedene Symbiosen eingeht. Charakteristisch für digitale Editionen ist nach wie vor ihr Experimentalcharakter, der sowohl für zugrundeliegende editorische Paradigmata als auch für Präsentationsschnittstellen Gültigkeit besitzt. Für die Datenmodellierung findet das Regelwerk des XML-basierten De-facto-Standards der Text Encoding Initiative (TEI) eine weite Verbreitung. Mit steigendem Bewusstsein für die Wichtigkeit der Langzeitsicherung digitaler Editionen und deren Interoperabilität erhöhen sich gleichzeitig die Anforderungen an die semantische Robustheit und die technische Normierung der TEI-kodierten Editionsdaten.

Die Heterogenität einzelner Editionsprojekte in der TEI-Anwendung erschwert allerdings massiv die Interoperabilität der erzeugten Editionsdaten. Hilfreiche Ansätze bestehen darin, innerhalb institutionell verankerter Editionsinfrastrukturen für eine semantische und technische Vereinheitlichung des TEI-Codes zu sorgen sowie die eigenen Standards nach innen und nach außen transparent zu dokumentieren.

Die aus einer Reihe digitaler Editionsprojekte hervorgegangene und an der UB Heidelberg angesiedelte Plattform heiEDITIONS stellt ein breites Spektrum schrifttragender Artefakte und edierter Texte unter ein gemeinsames Dach.

Für die Realisierung und den Betrieb dieser Plattform für digitale Editionen entwickelt die UB Heidelberg seit 2018 einen konzeptuellen Rahmen und eine technische Infrastruktur. Während die Visualisierung von TEI-Daten anfangs als Modul im Heidelberger Digitalisierungssystem DWork integriert war, wurde diese Visualisierungstechnik mittlerweile aus DWork herausgelöst, um sie nicht nur in seitenweiser Anbindung an Digitalisate, sondern auch in anderen Kontexten eigenständig nutzen zu können. Das Back-End basiert dabei auf der Open-Source-XML-Datenbank eXist-db, das Front-End auf gängigen Webtechnologien.

Bevor die TEI/XML-Daten in das Back-End geladen werden, durchlaufen sie mehrere Verarbeitungspipelines, die mit der XML-Pipeline-Technologie XProc realisiert sind und in der Regel aus XSLT-Skripten bestehen. Die XProc-Pipelines prüfen bereits zu Beginn der Verarbeitung, ob die an sie übergebenen XML-Dateien gemäß des hauseigenen TEI-Schemas valide sind.

Das TEI-Schema von heiEDITIONS (heiEDITIONS Schema) ist eine TEI-konforme Anpassung (customization) des allgemeinen Regelwerks der TEI. Es besteht einerseits aus präzisierenden und konkretisierenden Einschränkungen, andererseits aber auch aus bestimmten Erweiterungen der TEI. Da Schema-Anpassungen dieser Art von der TEI ausdrücklich vorgesehen sind, stellt sie für Schema-Modellierung auch eine Reihe dedizierter Werkzeuge bereit. Ziel ist es dabei, für konkrete Anwendungen eine strengere Qualitätssicherung mittels technischer Validierung zu ermöglichen, als sie durch das allgemeine TEI-Schema mit seinen zahlreichen Auslegungsmöglichkeiten und Implementierungsfreiheiten gegeben wäre. Es geht aber auch darum, wissenschaftlich begründete Räume für die Diversität editorischer Ansätze und textueller Phänomene zu schaffen, die in den allgemeinen TEI-Richtlinien nicht bedacht sind. Es wird Wert darauf gelegt, dass die Schema-Modellierung transparent und für die TEI-Community nachvollziehbar erfolgt, weswegen sie vordergründig mit der TEI-eigenen deklarativen Sprache ODD realisiert wird.

Erfahrungen aus der Datenmodellierung mehrerer Editionsprojekte brachten uns dazu, die Vielfalt der im TEI-Code immer wieder und für sehr unterschiedliche Zwecke benötigten Typenangaben für die Bezeichnung verschiedener Phänomene in einer eigenen Taxonomie bzw. Ontologie (heiEDITIONS Concepts) zu verwalten. Die Konzepte dieser Ontologie sind als Klassen im Sinne des Semantic Web gestaltet und sowohl über eine HTML-Referenz einsehbar als auch als RDF-Ressourcen maschinell abrufbar. Damit verfügt jeder ›Typ‹ und jede ›Kategorie‹, mit der wir im TEI-Code arbeiten, um diverse Phänomene zu beschreiben und editorische Konstrukte zum Ausdruck zu bringen, über einen URI (Uniform Resource Identifier), der unverwechselbar und eindeutig ist.

Das heiEDITIONS Schema regelt die Verwendung der URIs von heiEDITIONS Concepts in TEI-Dokumenten. In der Praxis sind auch projektspezifisch abgeleitete XML-Schemata als Auszüge konkret relevanter TEI-Konstrukte für einzelne Anwendungen vorgesehen.

Die Pflege von heiEDITIONS Schema, heiEDITIONS Concepts sowie der zugehörigen Dokumentation sind technisch in einem eigens entwickelten Datenmodellmanagementsystem eng miteinander verzahnt. Damit soll die Verwaltung und Steuerung des Datenmodells auch künftig bei einer wachsenden Zahl an Projektbedarfen effizient und skalierbar bleiben. Da das Datenmodell und die konzeptuellen wie technischen Regelwerke eine Schlüsselrolle bei der Gestaltung der Editionsdaten einnehmen, kommt diesem Bereich in heiEDITIONS ein hoher Stellenwert zu. Die Editionsdaten bestimmen mit ihrer Form ja nicht nur unmittelbar ihre eigene Visualisierung, sondern bilden auch bei jeder digitalen Edition den Kernteil, der langfristig verfügbar und nachnutzbar bleiben soll.

Zur Infrastruktur von heiEDITIONS gehören ebenfalls Werkzeuge für Datenhaltung und Redaktion. Für jede von der UB Heidelberg direkt betreute Edition wird ein Repositorium auf einem GitLab-Server eingerichtet. Dieses Repositorium dient dann als zentrale Datenablage mit Nutzerverwaltung, Unterstützung für kollaboratives Arbeiten sowie Versionierung. Darüber hinaus bietet jedes GitLab-Repositorium ein Ticket-System für Problemmanagement (›Issues‹) sowie ein Wiki für projektspezifische Anleitungen und Dokumentation. Außerdem können in einem GitLab-Repositorium sog. Trigger konfiguriert werden, die bei Datenaktualisierungen selbständig die Verarbeitungspipelines anstoßen. Damit kann die Visualisierung nahezu in Echtzeit den aktuellen Bearbeitungsstand der Editionsdaten spiegeln.

Die Redaktion der Editionsdaten erfolgt zunehmend direkt in TEI. Wir setzen dabei immer mehr auf die Erweiterungsmöglichkeiten des Oxygen XML Editor durch Frameworks und Plugins. Dadurch können bestimmte Redaktionsschritte erleichert oder gar automatisiert werden, und eine visuelle Ansicht stellt den TEI-Code in einer fürs Korrekturlesen geeigneten Form dar.

Die Infrastruktur von heiEDITIONS bedient primär Editionen, in denen sich die UB Heidelberg direkt als Kooperationspartner oder Dienstleister engagiert. Idealerweise nehmen wir bereits im Vorfeld eines Editionsprojekts und in der Antragsphase beratend an der Konzeption der digitalen Edition teil. So können die wissenschaftlichen Anforderungen und die technische Umsetzung am besten miteinander in Einklang gebracht werden.

Daneben fungiert heiEDITIONS aber auch in einzelnen Fällen als Partner für die Erstpublikation oder sekundäre Veröffentlichung von Editionsdaten, deren Erarbeitung nicht von der UB Heidelberg betreut wurde. Die Daten solcher Editionen müssen vor einer Übernahme erst in das Format von heiEDITIONS überführt werden, was häufig nicht ohne Abstriche und Kompromisse möglich ist.

Wir streben nicht nur die Veröffentlichung der Editionsinhalte im Open Access an, sondern auch die schrittweise Bereitstellung der konzeptuellen und technischen Infrastruktur als frei zugängliche Daten und Open-Source-Software. Erste Informationen dazu sind der Dokumentation zu entnehmen, die kontinuierlich ergänzt wird.


Jakub Šimek, Universitätsbibliothek Heidelberg, März 2021

zum Seitenanfang