36
[ Version 1.5 ] 10-5
Dateien sind darüber hinaus mit Struktureinheiten verknüpft. Die Strukturein-
heit, die eine einzelne Buchseite repräsentiert, kann somit mit einer einzelnen
Datei, die ein Image dieser Seite beinhaltet, verknüpft werden. Das „METS-
Abstract-Model“ stellt hierzu eine N:M Verknüpfung bereit. Das bedeutet, daß
eine Datei von mehreren Struktureinheiten (auch aus unterschiedlichen Struk-
tursektionen) aus verknüpft werden kann, genauso wie eine Struktureinheit
mehrere Dateien verknüpfen kann. Im Ergebnis heißt das, daß der Strukturein-
heit vom Typ „Monographie“ sämtliche Imagedateien ein gescanntes Werken
aus direkt unterstellt wird.
Für die Verknüpfung von Dateien sieht das „METS-Abstract-Model“ noch
weitere Möglichkeiten vor. So lassen sich mehrere Verknüpfungen hinsichtlich
ihrer Reihenfolge beim abspielen bzw. anzeigen bewerten. Dateien können ent-
weder sequentiell angezeigt (Images eines digitalisierten Buches) als auch paral-
lel abgespielt (Audio- und Videodateien gleichen Inhalts) werden. Darüber hin-
aus kann nicht nur auf Dateien, sondern auch in Dateiobjekte hinein verlinkt
werden. Diese Verlinkungen sind u.a. dann sinnvoll, wenn Einheiten beschrie-
ben werden, die aus technischen Gründen nicht aus der Datei herausgetrennt
werden können. Das können bestimmte Teile eines Images sein (bspw. einzelne
Textspalten) oder aber konkrete zeitliche Abschnitte einer Audioaufnahme. In
der Praxis lassen sich so einzelne Zeitabschnitte eines Streams markieren und
bspw. mit inhaltlich identischen Abschnitten eines Rede-Manuskriptes taggen.
Das METS-Dokument würde über die Struktureinheit eine Verbindung zwi-
schen den unterschiedlichen Dateien herstellen.
Das METS-Abstract-Model nutzt intensiv die Möglichkeit, einzelne Sektionen
miteinander zu verknüpfen. Da METS überwiegend als XML realisiert ist, wird
diese Verknüpfung über Identifier realisiert. Jede Sektionen verfügt über einen
Identifier, der innerhalb des XML- Dokumentes eindeutig ist. Er dient als Ziel
für die Verknüpfungen aus anderen Sektionen heraus. Aufgrund der XML-Se-
rialisierung muß er weiteren Anforderungen genügen. Außerdem muß dieser
Identifier mit den Regeln für XML-IDs verträglich sein. Ferner muß bei Ver-
wendung von weiteren Extension Schemas darauf geachtet werden, daß die
Eindeutigkeit der Identifier aus dem unterschiedlichen Schema nicht gefährdet
wird, da diese üblicherweise alle im gleichen Namensraum existieren.
Wie deutlich geworden ist, stellt das METS-Abstract-Model sowie des XML-
10 Standards und Standardisierungsbemühungen
36
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
10-6
Serialisierung als METS-XML Schema lediglich ein grobes Modell da, welches
auf den jeweiligen Anwendungsfall angepasst werden muß. Die Verwendung
von Extension Schema sollte genauso dokumentiert werden wie die Nutzung
optionaler Elemente und Attribute in METS. Dabei sollte vor allem auch die
Transformation realer, im zu beschreibenden Dokument vorhandene Objekte
in entsprechende METS-Objekte bzw. METS-Sektionen im Vordergrund ste-
hen. Eine Struktursektion kann bspw. lediglich logische Einheiten (bspw. das
Inhaltsverzeichnis eines Buches) umfassen als auch bestimmte physische Ein-
heiten (bspw. einzelne Seiten) enthalten. Eine weitere Option wäre es, bestimm-
te Einheiten in eine zweite separate Struktur auszugliedern. Jede dieser Opti-
onen mag für bestimmte Arten von Dokumenten sinnvoll sein.
Dokumentation
Damit ein METS-Dokument von unterschiedlichen Personen verstanden wer-
den kann, ist es notwendig, neben den formalisierten METS-Schemas auch eine
weitere Dokumentation der konkreten Implementierung von METS zu erstel-
len. Das METS-Profile-Schema bietet daher eine standarisierte Möglichkeit, eine
solche Dokumentation zu erstellen, in dem sie eine Grobstrukturierung vorgibt
und sicherstellt, daß alle wesentlichen Bereiche eines METS-Dokuments in der
Dokumentation berücksichtigt werden.
Um ein solches Profil auf der offiziellen METS-Homepage veröffentlichen zu
können, wird es durch Mitglieder des METS-Editorial-Board verifiziert. Nur
verifizierte METS-Profile werden veröffentlicht und stehen auf der Homepage
zur Nachnutzung bereit. Sie können von anderen Institutionen adaptiert und
modifiziert werden und somit erheblich zur Reduktion der Entwicklungszeit
einer eigenen METS-Implementierung beitragen.
Fazit
Aufgrund der hohen Flexibilität des METS Abstract Models wird METS in
einer großen Zahl unterschiedlicher Implementierungen für sehr verschiedene
Dokumententypen genutzt. Neben der ursprünglichen Anwendung, digitalisier-
te Büchern zu beschreiben, gibt es heute sowohl METS-Profile für Webseiten-
beschreibungen (aus dem Bereich der Webseitenarchvierung) sowie Audio- und
Videodaten. Während in den ersten Jahren METS überwiegend zum Beschrei-
ben komplexer Dokumente genutzt wurde, um diese dann mittels XSLTs oder
DMS-Systeme verwalten und anzeigen zu können, kommt heute METS gerade
10
[ Version 1.5 ] 10-7
im Bereich der Langzeitarchivierung wachsende Bedeutung zu. METS ist heute
für viele Bereiche, in denen komplexe Dokumente beschrieben werden müssen
ein De-facto-Standard und kann sowohl im universitären als auch im kommer-
ziellen Umfeld eine große Zahl an Implementierungen vorweisen. Ein großer
Teil derer sind im METS-Implementation Registry auf der METS-Homepage
(
http://www.loc.gov/mets
) nachgewiesen.
10 Standards und Standardisierungsbemühungen
46
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
10-8
10.1.3 PREMIS
Olaf Brandt
PREMIS steht für „PREservation Metadata: Implementation Strategies“.
Diese von der
OCLC
(Online Computer Library Center) und
RLG
(Re-
search Library Group) im Jahre 2003 ins Leben gerufene Initiative betreibt
die Entwicklung und Pflege des international anerkannten gleichnamigen
PREMIS-Langzeitarchivierungsmetadatenstandards.
Die Mitglieder von PREMIS sind Akteure aus dem Umfeld von Gedächtni-
sorganisationen wie Archive, Bibliotheken und Museen, sowie der Privatwirt-
schaft. Diese befassen sich in internationalen Arbeitsgruppen mit Problemen
der digitalen Langzeitarchivierung.
Das Hauptziel von PREMIS ist die Entwicklung von Empfehlungen, Vor-
schlägen und best-practices zur Implementierung von Langzeitarchivierungs-
metadaten. Dazu gehört die Schaffung eines Kerns von Langzeitarchivierungs-
metadaten mit größtmöglicher Anwendbarkeit innerhalb unterschiedlichster
Langzeitarchivierungskontexte.
Die Arbeit von PREMIS baut auf den Ergebnissen der
Preservation-Metadata-
Working-Group
auf. Diese Arbeitsgruppe wurde 2001 zur Entwicklung eines
Rahmenkonzeptes für Langzeitarchivierungsmetadaten gebildet. Eine wichtige
Grundlage für PREMIS ist das
Referenzmodell
des Open-Archival-Informati-
on-Systems (OAIS, ISO Standard 14721:2003). Dieses behandelt v.a. organisa-
torische und technische Fragen der digitalen Langzeitarchivierung.
Die Zielsetzung der so genannten Core Elements Group war bis Anfang 2005
die Entwicklung eines Kerns von Langzeitarchivierungsmetadaten, die Erstel-
lung von Mappings und die Anbindung an andere Standards sowie der Aufbau
eines Langzeitarchivierungsmetadatenlexikons. Die Ergebnisse dieser Gruppe
sind in einem Abschlussbericht im Mai 2005 veröffentlicht worden.
Der Bericht beinhaltet das sogenannte PREMIS
Data Dictionary 1.0
, welches
von einem ausführlichen Kommentar begleitet wird. Hierin sind der Kontext,
das Datenmodell und die PREMIS-Grundannahmen aufgeführt. Zudem ent-
hält der Bericht Erklärungen und Erläuterungen zu im Bericht erwähnten The-
men, ein Glossar und erläuternde Beispiele. Das PREMIS-Data-Dictionary ist
die Grundlage für die praktische Implementierung von Langzeitarchivierungs-
metadaten in digitalen Archiven.
52
[ Version 1.5 ] 10-9
Die zweite Arbeitsgruppe widmete sich den eher praktischen Fragen der realen
Implementierung von Langzeitarchivierungsmetadaten. Untersucht wurden
Fragen wie ‚Wie ist der Entwicklungsstand?‘ und ‚Was wird in welcher Weise
implementiert?‘. Darüber hinaus werden Themen über Datenhandling, einge-
setzte Software und rechtliche Fragen erörtert. Erzielt wurden Empfehlungen
zu best-practices auf Basis einer Reihe von Systemumgebungen. Die Ergeb-
nisse flossen in einen im September 2004 veröffentlichten
Untersuchungsbericht
ein.
Implementierung
Aufbauend auf den Ergebnissen der Arbeitsgruppen stehen
XML-Schemas
zur Verfügung, welche in Langzeitarchivsysteme implementiert werden. Weiter-
hin sind die Schemas in Metadaten-Container-Formate (z.B. METS) integriert.
Zu den nächsten Schritten zählen die maschinelle Erzeugung und Verarbeitung
von PREMIS-Metadaten sowie die Integration in Workflows. Eine
Liste von
Institutionen
, die PREMIS implementieren findet sich auf den
PREMIS-Main-
tenance-Activity
-Seiten der Library of Congress in den Vereinigten Staaten von
Amerika. Eine rege Community in der Mailingliste der
PREMIS-Implementors-
Group
diskutiert viele Fragen rund um die Implementierung von PREMIS und
um unterschiedliche Themen der digitalen Langzeitarchivierung.
Die PREMIS-Maintenance-Activity übernimmt die weitere Koordination der
Aktivitäten. Ein Teil davon, das
PREMIS-Editorial-Committee
, widmet sich der
Verbreitung von PREMIS und der weiteren Pflege des Standards. Dazu gehö-
ren z.B. notwendige Anpassungen im Data-Dictionary oder den XML-Schemas.
Diese Anpassungen werden gerade unter dem Eindruck der ersten praktischen
Erfahrungen vorgenommen. Zur Verbreitung von PREMIS werden internatio-
nal unterschiedliche Veranstaltungen angeboten.
Den PREMIS-Aktivitäten wird im Kontext der Langzeitarchivierung über-
einstimmend große Bedeutung im Bereich der Zusammenarbeit und des Da-
tenaustausches beigemessen. Das schlägt sich auch in zwei internationalen
Auszeichnungen nieder: für das Data-Dictionary wurde der PREMIS-Grup-
pe Ende 2005 den
Digital-Preservation-Award
der
Digital-Preservation-Coalition
und im August 2006 den
Preservation-Publication-Award
der
Society of American
Archivists
verliehen.
10 Standards und Standardisierungsbemühungen
How to C#: Special Effects Erase. Set the image to current background color, the background color can be set by:ImageProcess.BackgroundColor = Color.Red. Encipher.
how to delete text in pdf converter professional; how to delete text from a pdf document
30
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
10-10
Datenmodell
Das PREMIS-Datenmodell kennt einen vielseitigen Objektbegriff. Ein Objekt
(Object) kann entweder eine Datei (File), ein Datenstrom (Bitstream) oder eine
Repräsentation (Representation) sein. Ein Datenstrom ist dadurch gekennzeich-
net, dass er sich nicht ohne zu ergänzende Daten oder einer Umformatierung in
eine selbstständige Datei wandeln lässt. Eine Repräsentation ist eine Menge von
Dateien, welche nur zusammenhängend eine sinnvolle und vollständige Darstel-
lung einer intellektuellen Einheit (Intelectual Entity) liefern. Neben intellektu-
ellen Einheiten und Objekten existieren im Datenmodell noch Rechte (Rights),
Agenten (Agents) und Ereignisse (Events). Ereignisse und Rechte stehen in
direkten Beziehungen zu Objekten und/oder Agenten. Zwischen Objekten
können Beziehungen bestehen, die strukturelle Zusammengehörigkeit, Ablei-
tungen oder Abhängigkeiten kennzeichnen.
Object Entity
Zu den Metadaten des Objekts gehören eindeutige Kennungen, Charakte-
ristiken der Datei wie Größe und Format, Beschreibungen der Systemumge-
bungen (Software, Hardware), eine Auflistung der relevanten Eigenschaften der
Objekte, sowie die Beziehungen zu Events und Rechteinformationen.
Event Entity
In der Ereignis-Entität können Aktionen, die in Verbindung mit Objekten oder
Agenten stehen, dokumentiert werden. Dazu gibt es eindeutige Kennungen für
Ereignisse und Aktionen, sowie Informationen über deren Resultate.
Agent-Entity
Ein Agent ist eine Person, eine Organisation oder Software, die Aktionen
mit Objekten durchführt. Agenten werden durch eine eindeutige Kennung
beschrieben.
Rights-Entity
Bei den Rechten werden Genehmigungen zur Durchführung von Aktionen
29
[ Version 1.5 ] 10-11
von Agenten mit Objekten genau definiert.
Für PREMIS gibt es für jeden Entity-Typ ein eigenes XML-Schema, sodass
eine modulare Einbindung in andere Schemas wie METS möglich ist.
Literatur:
Webseite
der
PREMIS
Arbeitsgruppe:
http://www.oclc.
org/research/projects/pmwg/
Webseite der PREMIS Maintenance Activity:
http://www.loc.
gov/standards/premis/
Abschlußbericht der PREMIS Arbeitsgruppe inkl. Data Dictionary for Preser-
vation Metadata:
http://www.oclc.org/research/projects/pmwg/premis-final.
pdf
PREMIS Survey Implementing Preservation Repositories for Digital Materials,
Current Practice and Emerging Trends in the Cultural Heritage Commu-
nity (survey report):
http://www.oclc.org/research/projects/pmwg/surveyreport.pdf
Digital Preservation Award 2005 der DPC:
http://www.dpconline.org/graphics/advocacy/press/award2005.html
Preservation Publication Award 2006 der Society of American Archivists:
http://www.archivists.org/recognition/dc2006-awards.asp#preservation
Preservation Metadata Working Group (PMWG 2002) Framework:
http://www.oclc.org/research/projects/pmwg/pm_framework.pdf
10 Standards und Standardisierungsbemühungen
35
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
10-12
10.1.4 LMER
Tobias Steinke
Die Langzeitarchivierungsmetadaten für elektronische Ressourcen (LMER)
wurden von der Deutschen Bibliothek entwickelt. Das Objektmodell basiert
auf dem „Preservation Metadata: Metadata Implementation Schema“ der Nati-
onalbibliothek von Neuseeland (2003).
Ziele von LMER sind:
• Ergänzung zu existierenden bibliographischen Metadaten, deshalb nur
Beschreibung der technischen Informationen zu einem Objekt und der
technischen Veränderungshistorie
• Praxisrelevante Beschränkung auf Angaben, die größtenteils automa-
tisch generiert werden können
• Identifizierung der Kernelemente, die für alle Dateikategorien und je-
des Dateiformat gültig sind, sowie ein flexibler Teil für spezifische
Metadaten
• Abzubilden als XML-Schema
• Dateiformatidentifikation über Referenz zu einer zu schaffenden
File-Format-Registry
• Modularer Aufbau zur Integration in Containerformate wie METS
Historie
LMER entstand 2003 aus dem Bedarf für technische Metadaten im Vorhaben
LZA-RegBib. Die erste Version 1.0 wurde 2004 als Referenzbeschreibung und
XML-Schema veröffentlicht. 2005 erschien eine überarbeitete Version 1.2, die
auch Grundlage für die Verwendung im Projekt kopal ist. Die Version 1.2 führ-
te eine starke Modularisierung und damit einhergehende Aufteilung in mehrere
XML-Schemas ein, die eine bessere Einbindung in METS ermöglichte. Als Re-
sultat entstand das METS-Profile-Universelles-Objektformat (UOF), das auf
METS 1.4 und LMER 1.2 basiert.
Objektmodell
In LMER meint ein Objekt eine logische Einheit, die aus beliebig vielen Da-
teien bestehen kann. Es gibt einen Metadatenabschnitt zum Objekt und je einen
Metadatenabschnitt zu jeder zugehörigen Datei. Zum Objekt einer jeder Datei
kann es Prozess-Abschnitte geben. Diese beschreiben die technische Verände-
33
[ Version 1.5 ] 10-13
rungshistorie, also vor allem die Anwendung der Langzeiterhaltungsstrategie
Migration. Schließlich gibt es noch den Abschnitt Metadatenmodifikation, der
Änderungen an den Metadaten selbst dokumentiert und sich auf alle anderen
Abschnitte bezieht. Dabei wird davon ausgegangen, dass sich alle relevanten
Metadatenabschnitte in derselben XML-Datei befinden.
Die vier möglichen Abschnittsarten LMER-Objekt, LMER-Datei, LMER-Pro-
zess und LMER-Modifikation werden jeweils durch ein eigenes XML-Schema
beschrieben. Dadurch kann jeder Abschnitt eigenständig in anderen XML-Sche-
mas wie METS eingesetzt werden. Es gibt jedoch auch ein zusammenfassendes
XML-Schema für LMER, das anders als die einzelnen Schemas Abhängigkeiten
und Muss-Felder definiert.
LMER-Objekt
Die Metadaten zum Objekt stellen über einen Persistent Identifier den Bezug
zu bibliographischen Metadaten her. Zugleich finden sich dort u.a. Informati-
onen zur Objektversion und zur Anzahl der zugehörigen Dateien.
LMER-Datei
Zu jeder Datei werden die technischen Informationen erfasst, wie sie auch von
einem Dateisystem angezeigt werden (Name, Pfad, Größe, Erstellungsdatum),
aber auch eine Referenz zu exakten Formatbestimmung. Zudem wird jede Da-
tei einer Kategorie zugeordnet (Bild, Video, Audio, etc.), die insbesondere für
die spezifischen Metadaten relevant ist. Denn in einem speziellen Platzhalterele-
ment des Datei-Abschnitts können dank des flexiblen Mechanismus von XML-
Schemata beliebige XML-Metadaten zur spezifischen Bestimmung bestimmter
Dateicharakteristiken hinterlegt werden. Ein Beispiel dafür ist die Ausgabe des
Dateianalysewerkzeugs JHOVE.
LMER-Prozess
Die Metadaten in einem Prozess-Abschnitt beschreiben die Schritte und Re-
sultate von technischen Veränderungen und Konvertierungen (Migrationen) an
einem Objekt oder einzelnen Dateien eines Objekts. Gehört ein Prozess-Ab-
schnitt zu einem Objekt, so bezeichnet er auch die Versionsnummer und die
Kennung des Objekts, von dem die vorliegende Version abgeleitet wurde.
10 Standards und Standardisierungsbemühungen
12
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
10-14
LMER-Modifikation
Die LMER-Daten werden in der Regel in einer oder mehreren XML-Dateien
gespeichert. Veränderungen (Ergänzungen oder Korrekturen) der XML-Daten
darin können im Modifikationsabschnitt aufgeführt werden.
Literatur
Referenzbeschreibung zu LMER 1.2:
http://nbn-resolving.de/?urn=urn:nbn:de:1111-2005041102
Referenzbeschreibung zum Universellen Objektformat (UOF):
http://kopal.langzeitarchivierung.de/downloads/kopal_Universelles_Objektformat.
pdf
Documents you may be interested
Documents you may be interested