2.1 Textkonstitution (Corpuswahl und -digitalisierung)
Die Textkonstitution bezeichnet das Zusammenstellen der zu edierenden Texte. Falls es sich um eine textgenetisch ausgerichtete Edition handelt, d.h. falls die Entstehungs- und Publikationsgeschichte eines Werkes nachvollziehbar gemacht werden soll, umfasst die Textkonstitution das Auffinden und die Auswahl aller zu edierenden Textstufen (Manu- oder Typoskripte und Korrekturfahnen, die im Schaffensprozess entstanden sind) und der Textausgaben (verschiedene autorisierte oder nichtautorisierte Drucke, ggfls. ebenfalls mit händischen Notizen oder Korrekturen von Autor:innen, Lektor:innen und Herausgeber:innen).
Die editionsphilologischen Überlegungen in der Textkonstitution erscheinen auf den ersten Blick unabhängig davon, ob die angestrebte Edition digital oder gedruckt sein soll. Tatsächlich spielt es jedoch eine Rolle, wo sich die zu edierenden Textzeugen befinden und wie ihre Zugangs- und Publikationsrechte sind, da unterschiedliche Publikationsformen (open/restricted/closed access, mit oder ohne Digitalisat) daraus resultieren können, wie im Folgenden gezeigt wird.
1. Zugang zum Textträger und Publikationsrechte
Die Textkonstitution ist damit verbunden, ob und wie die physischen Textträger zur Transkription zugänglich sind bzw. gemacht werden können. Eine Edition kann sich gegen die Edition von Textträgern entscheiden, wenn diese schwer zugänglich und mit großem (finanziellen, logistischen oder rechtlichen) Aufwänden verbunden sind. Möglicherweise sind Textträger sogar schon digitalisiert vorhanden und auf der Datenbank einer Gedächtnisinstitution (s.u.) oder archive.org abrufbar.
Für DSE gehören weiterere Schritte zur Textkonstitution, die über die Edition eines Textträgers entscheiden, namentlich Abklärungen zu den rechtlichen Modalitäten, wie die Textträger der Edition zur Verfügung gestellt werden. Die Rechteinhaber:innen oder Besitzer:innen eines Textträgers können eine digitale, breit zugängliche Veröffentlichung des Digitalisats verbieten und/oder starke Restriktionen fordern (letztere nicht mithilfe des Urheberrechts, sondern indem Sie den Zugang zum Textträger kontrollieren). Im Extremfall kann dies ein Grund sein, ganz von der Edition des Textträgers abzusehen. Versuche, rechtlichen Einschränkungen zu genügen, können aber beispielsweise auch dazu führen, dass die Digitalisate der Textträger nur im Arbeitsprozess Verwendung finden und nicht veröffentlicht werden oder Texte und Digitalisate mit einem Kopierschutz ausgestattet sind.
Beispielhafte DSE
Einen rechtlich restriktiven Weg geht die online Ausgabe der Stoffe-Edition Friedrich Dürrenmatts: Die Digitalisate lassen sich zwar einblenden, aber nicht herunterladen, der transkribierte Text lässt nur die Kopie einer bestimmten Zeichenzahl zu und liegt nicht als TEI/XML vor. Diese beschränkte Funktionalität, die von mittlerweile etablierten DSE-Daten- und Präsentationtsstandards abweicht, wurden aus einer Open Access Perspektive in einem Review der Zeitschrift RIDE (A review journal for digital editions and resources) thematisiert. Das Stoffe-Projekt ist beispielhaft für einen früh in der Planungsphase getroffenen Kompromiss: Die Entscheidung, einen rechtlich geschützten Text überhaupt zugänglich machen zu wollen, kann mit großen Einschränkungen einhergehen.
2. Wege zum Digitalisat
Sind rechtliche Fragen geklärt, stellen sich institutionelle und technische Fragen in der digitalen Textkonstitution, die weitreichende Folgen bis zur langfristigen Publikation und Langzeitsicherung haben. Wir unterschieden drei grundsätzliche Wege zum Digitalisat, seiner Verfügbarmachung und seiner Einbindung in die DSE.
2.1 Digitalisierung und Verfügbarmachung durch eine Gedächtnisinstitution
Hierbei handelt es sich um den anstrebenswerten Standard beziehungsweise die best practice auf dem Weg zum Digitalisat: Die Gedächtnisinstitution (Archiv, Bibliothek, Museum o.ä.), welche den Textträger besitzt, digitalisiert diesen und macht ihn selbst digital öffentlich zugänglich. Die Digitalisierung geschieht nach etablierten Normen (z.B. ISO-Standards) und in gleichbleibender Qualität. Sie wird nach dem Digitalisierungsprozess durch die Gedächtnisinstitution auf einer Datenbank langzeitarchiviert.
Solche öffentliche Datenbanken werden meist von einem Verbund von Gedächtnisinstitutionen betrieben, für die Schweiz z.B. im Kanton Waadt Patrinum oder in der Deutschschweiz e-manuscripta. Dort werden die Bilddaten mit dem IIIF-Standard zugänglich gemacht. D.h. jedes Dokument erhält ein IIIF-Manifest (das die im Dokument enthaltenen Textzeugen beschreibt) und kann über entsprechende Schnittstellen angesteuert werden.
Erfahrung aus der Showcase-Edition
In der Textkonstitution der exemplarischen Brief-Edition Gaston Paris' konnte auf langjährige Forschungserfahrung und Übersicht über das Korpus zurückgegriffen werden. Unter anderem wurden für ein Vorgängerprojekt alle dort befindlichen Briefe Gaston Paris' von der Französischen Nationalbibliothek digitalisiert und online zur Verfügung gestellt. Deshalb konnten schnell die relevanten Digitalisate in deren Datenbank Gallica zur Weiterverarbeitung heruntergeladen werden.
Aufgrund von Download-Restriktionen in Gallica konnten die Bilder nicht über das entsprechende IIIF angesteuert werden, was im Rahmen der kleinen Projektgröße unproblematisch war. Im Falle von größeren Bild-Mengen, die über IIIF angesteuert werden müssen, empfehlen wir in solchen Fällen die Kontaktaufnahme mit der Administration der Datenbanken.
Um den Zugang zu den Bilddaten für alle Projekmtitarbeitenden remote sicherzustellen und die Seiten Transkribus und dem TEI Publisher zuzuweisen, wurde ein GitLab-Seite für die Bild-Metadaten erstellt.
Der große Vorteil dieses Wegs ist es, dass die Langzeitsicherung der Bilddaten nicht in der Hand eines temporär begrenzten Projektes liegt. Dies folgt der modularen Logik, den Betrieb und die Sicherung der verschiedenen DSE-Bestandteile voneinander unabhängig zu gestalten (siehe Projekt-Ziele und Ressourcen).
2.2 Digitalisierung durch eine Gedächtnisinstitution, Verfügbarmachung durch das Projekt
Sollte die Gedächtnisinstitution das Digitalisat nicht selbst auf einer Datenbank zur Verfügung stellen - sei es, weil sie keine solche Datenbank besitzt, weil die Auswahl zu klein bzw. zu spezifisch ist oder weil der Textträger nicht aus den eigenen Beständen stammt - ist auch die Verwendung eines IIIF-Servers einer weiteren Institution möglich. Universitätsbibliotheken bieten Projekten mittlerweile oftmals Speicherplatz auf einem solchen Server zum Unkostenbeitrag an. Dieser zusätzliche finanzielle Aufwand muss - wie alle weiteren Server-Kosten - über die Projektlaufzeit hinaus beantragt werden. Die Bilddaten sind in diesem Fall nicht unabhängig über eine Datenbank abrufbar, können aber über eine eigene URI unabhängig übers Internet angesteuert werden.
2.3 Digitalisierung und Sicherung durch das Projekt
Eine projekteigene Digitalisierung sollte dann in Erwägung gezogen werden, wenn der Zugang zu einem Digitalisierungsdienst erschwert ist (z.B. wenn die Bestände in Archiven ohne Digitalisierungsabteilung liegen und ein Transport in eine andere Institution nicht möglich oder nicht sinnvoll ist). Die projekteigene Digitalisierung kann auch erwogen werden, wenn das Projekt die Textträger selbst verwaltet, professionelle Scanner verfügbar sind und die Digitalisierungsarbeit durch Hilfsassistent:innen o.ä. durchgeführt werden kann. Wichtig ist, dass die Durchführung durch Fachpersonen geplant und angeleitet wird und nicht zu Lasten der Forschungs- oder Editionszeit akademisch zu qualifizierender (z.B. Doktorierende) oder qualifizierter (z.B. Postdocs) Mitarbeitender geschieht.