Preservation Policy der Technischen Informationsbibliothek (TIB)

Version 1.4 // Stand: 18. Februar 2019 (zuletzt reviewed am 18. Februar 2022)

1. Einleitung

Die Technische Informationsbibliothek (TIB) ist die Deutsche Zentrale Fachbibliothek für Technik sowie Architektur, Chemie, Informatik, Mathematik und Physik. Sie versorgt vor allem die nationale wie internationale Forschung und Industrie mit Literatur und Information. Als weltweit größte Fachbibliothek in ihren Bereichen trägt sie Verantwortung, das verzeichnete Wissen zu erhalten und aktuelle Informationen unabhängig von Ort und Zeit heute und in Zukunft bereitzustellen.

Die TIB ist Mitglied der Leibniz-Gemeinschaft.

Die TIB, ZBW – Leibniz-Informationszentrum Wirtschaft und ZB MED – Informationszentrum Lebenswissenschaften bilden zusammen den Verbund der Zentralen Fachbibliotheken in Deutschland. Die Partnerbibliotheken betreiben zusammen ein digitales Langzeitarchivierungssystem, um die Langzeitverfügbarkeit ihrer Bestände sicherzustellen und haben 2014 eine konsortiale Preservation Policy verabschiedet. Die vorliegende institutionelle Preservation Policy der TIB konkretisiert die digitale Langzeitarchivierung an der TIB und richtet sich an Mitarbeitende, Datenproduzentinnen und -produzenten sowie Nutzerinnen und Nutzer. Die Policy wird jährlich auf Aktualisierungsbedarf geprüft. Detaillierte Informationen werden auf den Internetseiten der digitalen Langzeitarchivierung der TIB zur Verfügung gestellt.

2. Mission

2.1 Aufgabe 

Als Deutsche Zentrale Fachbibliothek für Technik sowie Architektur, Chemie, Informatik, Mathematik und Physik sichert die TIB mit ihren zukunftsgerichteten Dienstleistungen die infrastrukturellen Voraussetzungen einer qualitativ hochwertigen Informations- und Literaturversorgung für die nationale Wissenschaft, Forschung, Lehre und Praxis.

Der weltweit einmalige Bestand an technisch-naturwissenschaftlichen Fach- und Forschungsinformationen bildet das Fundament der Dienstleistungen der TIB. Diesen Bestand in seiner Einzigartigkeit auszubauen, als kulturelles Erbe zu bewahren, den Zugang durch verlässliche Informationsinfrastruktur zu erleichtern und entsprechende Services durch eigene Forschung zu optimieren, bildet den Kern der Aktivitäten der TIB.

Die Aufgabe der Langzeitarchivierung ist in der Strategie der TIB dokumentiert.

Die TIB ist Depotbibliothek für Forschungsberichte für verschiedene Ministerien und forschungsfördernde Institutionen, darunter das Bundesministerium für Bildung und Forschung (BMBF) und das Bundesministerium für Wirtschaft und Energie (BMWi).

Die TIB archiviert die Hochschulschriften der Fakultäten der Leibniz Universität Hannover sowie die Objekte des institutionellen Repositoriums der Leibniz Universität Hannover.

2.2 Zielgruppen

Die Zielgruppen des digitalen Langzeitarchivs unterteilen sich in Datenproduzentinnen und -produzenten, die Belegschaft der TIB sowie die Nutzerinnen und Nutzer.

Datenproduzentinnen und -produzenten geben Objekte an die TIB ab.

Die Zielgruppe Mitarbeitende der TIB umfasst insbesondere Mitarbeiterinnen und Mitarbeiter der digitalen Langzeitarchivierung sowie Mitarbeitende, die mit dem digitalen Langzeitarchivierungssystem Rosetta arbeiten.

Die Nutzerinnen und Nutzer des digitalen Langzeitarchivs entsprechen den Nutzergruppen der TIB: Angehörige der Leibniz Universität Hannover, akademische und außeruniversitäre Forschungseinrichtungen, die interessierte Öffentlichkeit und die Wirtschaft.

Die Anforderungen der Zielgruppen an das digitale Langzeitarchivierungssystem werden berücksichtigt. 

2.3 Sammlungsprofil und Selektion

Als Zentrale Fachbibliothek für Technik sowie Architektur, Chemie, Informatik, Mathematik und Physik hat die TIB die Aufgabe, den verfügbaren Content in diesen Fachgebieten zu erwerben, zu erschließen, ihn überregional Forschung und Lehre bereitzustellen und dessen langfristige Zugänglichkeit zu gewährleisten. Die TIB verfolgt eine „e-preferred“-Strategie und erwirbt zunehmend Publikationen, die ausschließlich digital verfügbar sind. Der Anteil nicht-textueller Medien wächst stetig.

Die TIB verfolgt das Ziel, für ihren Bestand eine besitzende Bibliothek zu sein.

Unter Umständen besteht ein Objekt aus mehr als einer Repräsentation. Kriterien für die Auswahl der Repräsentationen sind wie folgt:

  • Wenn es möglich ist, wird die vom Produzenten abgelieferte Originaldatei als Repräsentation MASTER erfasst.
  • Wenn es eine Nutzungskopie auf einer Nutzungsplattform gibt, wird die Nutzungskopie als Repräsentation DERIVATIVE COPY erfasst.
  • Wenn es eine bearbeitete Kopie des MASTERS gibt, die für die Erhaltung der Objekte von Nutzen ist – zum Beispiel weil die Reihenfolge von Einzeldateien abgebildet wird – wird diese als MODIFIED MASTER erfasst.

Bei der Priorisierung für die Langzeitarchivierung werden neben dem Sammelauftrag auch Kriterien wie der Erhaltungszustand der Datenträger und Besonderheiten einzelner Teilbestände wie der Alleinbesitz in Deutschland/ Europa/weltweit berücksichtigt.

3. Prinzipien der digitalen Langzeitarchivierung

Die TIB ist für den Erhalt der Langzeitverfügbarkeit ihrer Bestände verantwortlich. Zu diesem Zweck definiert die TIB folgende Prinzipien für die digitale Langzeitarchivierung:

3.1 Preservation Watch

Aktuelle technische Entwicklungen müssen fortlaufend beobachtet werden, um auf drohende Formatobsoleszenz, neue Erwartungen der Datenkonsumenten sowie neue Technologien und Stand-der-Technik-Entwicklungen rechtzeitig reagieren zu können.

Die TIB engagiert sich auf nationaler und internationaler Ebene als Mitglied in den Langzeitarchivierungsnetzwerken nestor und Open Preservation Foundation (OPF) und fördert die fachliche Kompetenz der Mitarbeitenden durch Teilnahme an Workshops, Konferenzen und den kontinuierlichen Austausch mit ihren Partnern.

3.2 Metadaten 

Metadaten gewährleisten im Kontext der digitalen Langzeitarchivierung nicht nur die langfristige Auffindbarkeit eines Objekts via deskriptiver Informationen. Ferner werden in den Metadaten langzeitarchivierungsrelevante Informationen über technische Eigenschaften des digitalen Objekts sowie über dessen Entstehungsprozess erfasst und alle Änderungen an einem Objekt dokumentiert. Die Metadaten werden mit dem Objekt in einem logischen AIP gespeichert.

Neben den deskriptiven Metadaten aus dem Katalog oder anderen Nachweissystemen erfasst die TIB technische, administrative, rechtliche, strukturelle und prozessbezogene Metadaten. Dabei werden die Metadatenstandards Dublin Core, das PREMIS-basierte DNX und METS verwendet.

3.3 Rechtliche Kompatibilität

Die TIB beachtet die geltenden rechtlichen Bestimmungen und holt von den Produzentinnen und Produzenten die Erlaubnis zur Langzeitarchivierung ein. Werden die entsprechenden Rechte für ein Objekt nicht erteilt, erfolgt die Langzeitarchivierung auf Basis der gesetzlichen Regelungen.

3.4 Preservation Level 

Es gibt verschiedene Preservation Level, die die Qualität der Langzeitarchivierungsmaßnahmen beschreiben:

  • Bitstream Preservation: Hierbei handelt es sich um die bloße Speicherung und Erhaltung des Bitstroms durch Überwachung und Austausch der Speichermedien. Es werden keine Maßnahmen zum Erhalt auf logischer Dateiformatebene unterstützt. Die Bitstream Preservation ist das niedrigste Erhaltungslevel. 
  • Logical Preservation: Die langfristige Verfügbar- und Lesbarkeit der Objekte auf Dateiformatebene ist sichergestellt. Mit der Logical Preservation wird die Ausführbarkeit der Objekte sichergestellt. 
  • Semantic Preservation: Semantic Preservation stellt die langfristige Interpretierbarkeit auf inhaltlicher Ebene sicher. Benötigte Kontextinformationen werden in begleitenden Metadaten (Representation Information) erfasst und regelmäßig auf Aktualität überprüft. Analog zur Migration auf logischer Ebene können Metadaten auf kontextueller Ebene migriert und versioniert werden. 

Die TIB strebt für die Objekte, für die sie langzeitarchivierungspflichtig ist, die Langzeitarchivierung auf allen Ebenen an.

Für Objekte mit Passwortschutz, Digital Rights Management, Signaturen und anderen Schutzmaßnahmen, die Bestandserhaltungsmaßnahmen verhindern, kann nur Bitstream Preservation angeboten werden.

3.5 Erhalt der Datenintegrität

Der Bitstrom eines gespeicherten Objekts muss vor ungewollten Änderungen durch Hardwaredefekte, Kopierfehler, menschliche Bedienfehler und Speichermedienverschleiß geschützt werden.

Die TIB betreibt ein eigenes Rechenzentrum und folgt dabei der Best Practice:

  • Die Datenintegrität wird mit Prüfsummen und Speicherverwaltungsprozessen sichergestellt.
  • Die TIB speichert die Daten redundant auf getrennten Speichermedien.
  • Die Speichermedien werden überwacht und bei Bedarf ausgetauscht.

3.6 Erhalt der Authentizität

Die TIB bewahrt die Originaldatei unverändert als Archivmaster.

Änderungen erfolgen grundsätzlich an einer Kopie der Originaldateien. Eine Änderung liegt vor, wenn zum Beispiel:

  • eine Reihenfolge der Originaldateien festgelegt wird,
  • das Objekt vertrauliche Bestandteile enthält und diese entfernt werden,
  • ein Titelblatt eingefügt wird oder
  • eine verändernde Bestandserhaltungsmaßnahme wie Migration durchgeführt wird.

Die modifizierte Kopie wird zusätzlich zum Archivmaster als modifizierter Archivmaster gespeichert. Bei Änderungen an einem AIP wird das AIP versioniert und eine neue METS-Datei erzeugt. Sämtliche Änderungen an einem Objekt werden in den Metadaten dokumentiert.

3.7 Erhalt der Vollständigkeit

Die Objekte werden vollständig langzeitarchiviert. Struktur und Inhalt der Archivmaster werden vollständig übernommen.

3.8 Erhalt der Lesbarkeit

Die TIB hat für verschiedene Publikationsarten Formatempfehlungen veröffentlicht (Hochschulschriften, Deutsche Forschungsberichte, audiovisuelle Medien). Für die Hochschulschriften sind die Formatvorgaben verbindlich.

Das digitale Langzeitarchivierungssystem verfügt über ein Preservation-Planning-Modul, mit dem Preservation Plans geschrieben und analysiert sowie Preservation Actions durchgeführt werden können.

Die TIB erhält die Nutzbarkeit der Objekte neben der Erhaltung des Bitstroms durch die Bestandserhaltungsstrategien Migration und Emulation. Die Bestandserhaltungsmaßnahmen werden mit Preservation Plans individuell an die verschiedenen Format-, Sammlungs- und Objektgruppen angepasst.

3.9 Erhalt der Auffindbarkeit

Objekte müssen wieder auffindbar sein.

Objekte in Rosetta erhalten eine systeminterne ID auf folgenden Ebenen:

  • Information Package (SIP-ID)
  • Intellectual Entity (IE-ID)
  • Repräsentation (REP-ID)
  • File (File-ID)

Ausgewählte Objekte erhalten einen Digital Object Identifier (DOI). Dissertationen der Leibniz Universität Hannover erhalten eine URN (Uniform Resource Name).

3.10 Wahrung der Vertraulichkeit

Die Nutzungsrechte für ein Objekt werden in Rosetta erfasst. Der Lizenztext wird gespeichert und in den Metadaten mit dem Objekt verlinkt. Die Access Rights werden der Lizenzvereinbarung entsprechend zugewiesen. Nutzungsbeschränkungen werden dabei berücksichtigt.

  • Objekte mit Sperrfrist erhalten bis zum Ablauf der Sperrfrist eine vollständige Zugriffssperre.
  • Auf Objekte mit eingeschränktem Zugriff kann nur zugegriffen werden, wenn die Zugangsvoraussetzungen erfüllt sind (s. 3.12 Zugriff und Nutzung).

3.11 Dokumentation der Prozesse

Die TIB hat die Prozesse der digitalen Langzeitarchivierung dokumentiert.

3.12 Zugriff und Nutzung

Nutzungsszenario 1: Zugriff von außerhalb auf Nutzungskopien auf Nutzungsplattformen
Der Zugriff durch die Produzentinnen und Produzenten oder die Nutzerinnen und Nutzer auf die digitalen Ob­jekte erfolgt derzeit nicht auf die in Rosetta gespeicherten Nutzungskopien. Die Katalogisate oder andere Nachweis- und Nutzungsinstrumente enthalten einen Link auf die Objekte, die darüber den Nutzerinnen und Nutzern zur Verfügung stehen. Die TIB ist bestrebt, den Nutzern unter Beachtung der rechtlichen Beschränkungen komfortable Zugriffsmöglichkeiten anzubieten. Aus rechtlichen Gründen stehen aber nicht alle Objekte der TIB online zur Verfügung. Es existieren folgende Nutzungsszenarien:

  • frei im Online-Zugriff verfügbar
  • Zugriff nur mit Campus-Lizenz
  • Zugriff nur für registrierte Nutzerinnen und Nutzer
  • Zugriff nur vor Ort im Lesesaal
  • Zugriff auf einen Datenträger oder auf eine Druckausgabe

Nutzungsszenario 2: Interner Zugriff auf Nutzungskopien in Rosetta
Der interne Zugriff auf Nutzungskopien ist abhängig von einem Trigger-Ereignis, zum Beispiel:

  • Die für die Nutzerinnen und Nutzer zugängliche Nutzungskopie ist nicht mehr vorhanden.
  • Die für die Nutzerinnen und Nutzer zugängliche Nutzungskopie funktioniert nicht mehr.

Im Trigger-Fall wird das entsprechende AIP im digitalen Langzeitarchivierungssystem gesucht. Die im AIP hinterlegte Nutzungskopie wird als Kopie aus Rosetta exportiert. Diese Kopie wird an die entsprechende Nutzungsplattform übergeben.

Nutzungsszenario 3: Nutzungskopien werden von Rosetta an eine Nutzungsplattform geliefert
Für bestimmte Workflows können Objekte von Rosetta an die jeweilige Nutzungsplattform geliefert werden. 

4. Technische Infrastruktur

Die technische Infrastruktur der TIB entspricht den Anforderungen des OAIS-Modells. Die erforderlichen Prozesse sind OAIS-konform umgesetzt und Reportfunktionen sind vorhanden.

Die TIB betreibt in einem eigenen Rechenzentrum den Archivspeicher.

Das digitale Langzeitarchivierungssystem Rosetta erfüllt die Anforderungen an ein digitales Langzeitarchiv:

  • Ingest (inklusive Deposit)
  • Data Management
  • Archival Storage
  • Administration
  • Preservation Planning
  • Access 

5. Verantwortlichkeiten

Die digitale Langzeitarchivierung ist keine befristete Aufgabe, sondern ein kontinuierlicher, wiederkehrender Prozess. Die digitale Langzeitarchivierung ist Bestandteil der Organisationsstruktur und der Haushaltsplanung der TIB. Der Leiter/die Leiterin des Bereichs Bestandserhaltung und Langzeitarchivierung ist für alle Fragen zum Erhalt der langfristigen Verfügbarkeit verantwortlich. 

Wer hilft weiter?

Thomas Bähr
Bestandserhaltung und Langzeitarchivierung

Feedback