1. SLUB Dresden
  2. Über uns
  3. SLUBArchiv
  4. Technische Standards für die Ablieferung von digitalen Dokumenten
  5. Langzeitarchivfähige Dateiformate

Langzeitarchivfähige Dateiformate

Release Note 1.0 vom 2016-09-12
Layout-Überarbeitung

Einleitung

LZA-Umgebungen stellen besondere Anforderungen an die verwendeten Dateiformate. Digitale Master müssen offen spezifiziert und leicht konvertierbar sein, um dem Formatwandel über die Jahre Rechnung zu tragen. Gleichzeitig muss dabei der semantische Inhalt auch über mehrere Konvertierungen hinweg erhalten bleiben. Proprietäre Datenformate halten diesen Anforderungen oft nicht stand. Deswegen ist es wichtig, vor der permanenten Archivierung eine Menge an Dateiformaten festzulegen, die für langzeitarchivfähig gehalten wird und deren Einspeisung in das Langzeitarchiv deshalb erlaubt werden darf.

Dieses Dokument listet Dateitypen auf, die nach aktuellem Stand der Bearbeitung ausdrücklich für die dauerhafte Aufnahme in das Langzeitarchiv der SLUB zugelassen sind.

Formate

PDF/A & PDF/UA (Portable Documents Format)

  • archivfähige Formatversionen: PDF/A-1 (ISO 19005-1:2005), PDF/A-2 (ISO 19005-2:2011)

  • PRONOM-Formate: fmt/354, fmt/95

  • Randbedingungen: (keine)

GIF (Graphics Interchange Format)

  • archivfähige Formatversionen: GIF87a, GIF89a

  • PRONOM-Formate: fmt/3, fmt/4

  • Randbedingungen:

    • Bilddaten ausschließlich unkomprimiert

HTML, HTM (HyperText Markup Language)

  • archivfähige Formatversionen: HTML 3.2 (nur Bestandsdaten), HTML 4.01 strict, HTML 5.1 (noch kein Standard / work in progress)

  • PRONOM-Formate: fmt/98 (HTML 3.2), fmt/100 (HTML 4.01)

  • Randbedingungen:

    • nur statische Seiten ohne ausführbaren Code

    • Archivierung nur mit zugehörigem CSS (wenn vorhanden)

    • Archivierung vorzugsweise als WARC

SVG (Scalable Vector Graphics)

  • archivfähige Formatversionen: SVG 1.0, SVG 1.1, SVG 1.2 Tiny

  • PRONOM-Formate: fmt/91, fmt/92, fmt/412

  • Randbedingungen: (keine)

TIF (Tagged Image File Format)

  • archivfähige Formatversionen: TIFF Rev. 6.0 Part 1 (Baseline TIFF)

  • PRONOM-Formate: fmt/10

  • Randbedingungen:

    • Bilddaten ausschließlich unkomprimiert (TIFF-Tag 259, Datentyp SHORT, Wert 1 („no compression“))

WARC (WebARChive)

  • archivfähige Formatversionen: WARC (ISO 28500)

  • PRONOM-Formate: fmt/289

  • ACHTUNG: Die weitere Behandlung dieses Formates ist noch nicht abschließend geklärt (z. B.: Was passiert mit den eingeschlossenen und mglw. nicht archivfähigen Bilddateien?)

XML (eXtensible Markup Language)

  • archivfähige Formatversionen: (alle) (u. a. Alto-XML, METS, MODS, DC)

  • PRONOM-Formate: fmt/101

  • Randbedingungen:

    • UTF-8-codiert

    • well-formed

    • validierbar gegen ein frei zugängliches standardisiertes Schema (RelaxNG, DTD, XML-Schema)

DOCX, XLSX, PPTX (OfficeOpen XML)

  • archivfähige Formatversionen: docx 2013, xlsx 2013, pptx 2013

  • PRONOM-Formate: ExL-Fmt-62, fmt/189

  • Randbedingungen:

    • mit MS Office 2013 oder neuerer Version erstellt (ältere Formate sind nicht standardkonform)

ODF (OASIS Open Document Format for Office Applications)

  • archivfähige Formatversionen: odt (OpenDocument-Text), ods (OpenDocument-Spreadsheet), odp (OpenDocument-Präsentation), odg (OpenDocument-Grafik)

  • PRONOM-Formate: fmt/136, fmt/290, fmt/291, x-fmt/3, fmt/137, fmt/294, fmt/295, fmt/138, fmt/292, fmt/293, fmt/139, fmt/296, fmt/297

  • Randbedingungen: (keine)

PNG (Portable Network Graphics)

  • archivfähige Formatversionen: png

  • PRONOM-Formate: fmt/11, fmt/12, fmt/13

  • Randbedingungen: (keine)

Langzeitarchivfähige Dateiformate

Ansprechpartnernach oben

Dr. Gerald Hübsch

Tel.: +49 351 4677 237
Fax: +49 351 4677 711
E-Mail: Gerald.Huebsch@slub-dresden.de