Einleitung in die Langzeitsicherung
Die Langzeitsicherung von DSE ist bis heute, Stand 2024, eine nur teilweise und in mancher Hinsicht unbefriedigend gelöste Herausforderung. Das vorliegende Kapitel kann deshalb nur eingeschränkt von Standardlösungen sprechen und dient zuweilen eher als Wegweiser, in welche Richtung technische Entwicklungen zur Langzeitsicherung sich zurzeit bewegen, welche Lösungen von diesen Entwicklungen zu erwarten sind und welche Limitationen oder Planungsschritte sie mit sich bringen.
Grundsätzlich lässt sich das Thema Langzeitsicherung in zwei Aspekte aufteilen, wie das in den folgenden Unterkapiteln geschieht. Hier wird diese Unterscheidung, die z.T. fliessende Übergänge nicht ausschliesst, einleitend erklärt.
1. Langzeitsicherung der Präsentation
Die Langzeitsicherung der Präsentation bedeutet, dass das Frontend langfristig zugänglich bleibt. Dies entspricht einem Wunsch vieler DSE-Projekte, die z.T. große Ressourcen in das Design und die Funktionalitäten ihrer Frontends investieren, selbst wenn es sich dabei technisch betrachtet um Standardlösungen wie den TEI Publisher handelt. Projekte betrachten die Präsentation als integraler Bestandteil der Publikation und beschreiben diese oft in Analogie zum gedruckten Buch (das bislang die Langlebigkeit von DSE-Frontends bei weitem übersteigt).
Viele Projekte verfügen jedoch nicht über die Infrastruktur, die es ihnen erlaubt, dynamische Webanwendungen (wie sie etwa durch den TEI Publisher bislang, d.h. bis zu Version 9, generiert werden) langfristig zu warten. Unter dynamischen Webanwendungen verstehen wir Programme, die die gewünschte Anzeige jeweils bei Abruf einer Website oder einer Suche auf derselben mithilfe einer Datenbank generieren. Projektlaufzeiten sind in der Regel auf wenige Jahre begrenzt, für die projekteigene Wartung einer dynamischen Webanwendung werden kaum Mittel über diese Laufzeiten hinaus gesprochen. Normalerweise dienen Projektmittel zur Langzeitsicherung einzig der Archivierung von Datensätzen (s.u.), die Mittel sind deshalb an externe Institutionen zur digitalen Archivierung gebunden (in der Schweiz z.B. ans DaSCH).
Forschung- und Gedächtnisinstitutionen haben hingegen die Langzeitsicherung von dynamischen Webanwendungen nicht als Kernaufgabe, zumal eine solche technische Unwägbarkeiten und finanzielle Risiken mit sich brächte. Zurzeit garantiert unseres Wissens keine Institution im deutschsprachigen Raum DSE-Projekten offiziell die langfristige Wartung von DSE-Webanwendungen, auch wenn sie vereinzelt defacto verschiedentlich schon länger gewartet werden.
Die im Unterkapitel diskutierte Lösung dieser Herausforderung besteht in der Generierung von statischen Präsentationen von DSE, die zurzeit in verschiedenen Projektkontexten (weiter-)entwickelt werden. Sie unterscheiden sich von dynamischen Webanwendungen darin, dass die meisten Ansichten darin so vorgeneriert sind, dass keine weiteren Programme oder Datenbanken im Hintergrund nötig sind. Es sind jedoch auch Lösungen möglich, in denen gewisse dynamische Funktionen erhalten bleiben und ggfls., wenn die Wartung nicht mehr möglich ist, ohne Verlust der statischen Funktionen abgestellt werden können.
2. Archivierung der Daten
Im Zentrum der Datenarchivierung steht die langfristige Zugänglichkeit zu den Editionsdaten. Dies kann eine generische Präsentation der Daten beinhalten. Der Schwerpunkt liegt jedoch auf der dauerhaften Zugänglichkeit der Daten selber, deren Findbarkeit und Verständlichkeit. Eine aufschlussreiche Dokumentation und wohlgeformte TEI/XML Daten sind somit eine Voraussetzung für jegliche Form der Datenarchivierung. Die Langzeitsicherung von Präsentationsoberflächen stellt ganz andere Anforderungen und ist insofern unabhängig von der Datenarchivierung.
Neben archivierten Gesamtdatensätzen von DSE ist die Archivierung verschiedener Datentypen für verschiedene Nutzformen zentral. Diesen Nutzformen weichen in der Regel von der durch das Frontend ermöglichten Lektüre und philologischen bzw. hermeneutischen Erforschung des Textcorpus ab; sie verstehen den Text stattdessen als Datengrundlage z.B. für distant-reading oder computerlinguistische Methoden oder nutzen sie für Datenvisualisierungen.