47
[ Version 1.5 ] 13-27
Beschreibungen und Empfehlungen sind in der Form so genannter Requests
for Comments (RFCs) veröffentlicht.
Mit dem Dokument RFC 1737
9
(Functional Requirements for URNs, 1994)
wurden schon sehr früh die grundlegenden Anforderungen an das URN-Sche-
ma spezifiziert. RFC 2141
RFC 2141
10
(URN Syntax, 1997) beschreibt etwa 2 Jahre später
u. a. die Ziele, die mit der Entwicklung dieses PIs verfolgt wurden:
Uniform Resource Names (URNs) are intended to serve as persistent, location-inde-
pendent resource identifiers and are designed to make it easy to map other namespaces
(that share the properties of URNs) into URN-space. Therefore, the URN syntax
provides a means to encode character data in a form that can be sent in existing pro-
tocols, transcribed on most keyboards, etc.
Das URN-Schema ist also ganz bewusst sehr offen konzipiert worden, um
bereits vorhandene Bezeichnungssysteme oder Standardnummern (beispiels-
weise ISBNs), andere Schemata (beispielsweise URLs) oder gängige Protokolle
(beispielsweise http) direkt integrieren zu können. Man wollte einerseits Un-
abhängigkeit vom Ort der Speicherung eines Objekts und dem verwendeten
Zugriffsprotokoll erreichen, andererseits aber auch den Aufwand für die Bereit-
stellung von Gateways so gering wie möglich halten.
Die Einbettung neuer oder auch schon vorhandener Namensschemata in das
URN-Schema erfolgt durch die Registrierung von Namensräumen bei IANA.
11
Ein Namensraum kennzeichnet gewissermaßen den Geltungsbereich eines
URNs und definiert die Menge der Objekte, welche mittels der angewendeten
Systematik identifiziert und adressiert werden sollen. So können – bei Einhal-
tung des durch das generische Schema definierten Rahmens – durchaus sehr
spezifische Konventionen festgelegt werden. Bei der Registrierung sollte aller-
dings auch immer die Verlässlichkeit des PIs nachgewiesen werden (RFC 3406,
URN Namespace Definition Mechanisms)
12
.
IANA verzeichnet gegenwärtig (Stand: Februar 2008) 36 verschiedene Na-
mensräume. Dazu gehören u. a.:
• issn – International Serials Number (RFC 3044),
• isbn - International Standards Books Number (RFC 3187),
• isan – International Standard Audiovisual Number (RFC 4246),
• nbn – National Bibliography Number (RFC 3188),
9 http://www.ietf.org/rfc/rfc1737.txt
10 http://www.ietf.org/rfc/rfc2141.txt
11 http//www.iana.org/assignments/urn-namespaces
12 http://www.ietf.org/rfc/rfc3406.txt
13 Access
41
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
13-28
• pin – Personal Internet Name für Personen und Organisationen (RFC
3043),
• uuid – Universally Unique Identifiers für verteilte Softwaresysteme (RFC
4122).
Zur Auflösung von URNs in Zugriffsadressen werden Resolvingdienste zwi-
schengeschaltet (RFC 2276, URN Resolution)
13
. Die Resolver verwalten Me-
tadaten zu allen im System registrierten Objekten. Um die Objekte zu lokali-
sieren, werden URNs i. d. R. über ein Register in Uniform Resource Locator
(URLs) umgewandelt.
Die zu einem URN-Namensraum gehörenden Resolvingdienste müssen in
der Lage sein, registrierte Informationsressourcen solange nachzuweisen, wie
Exemplare des jeweiligen Objekts oder Referenzen auf das Objekt irgendwo
existieren. Entsprechend ist die Persistenz eines URNs auch immer unmittelbar
davon abhängig, ob eine stabile und leistungsfähige Infrastruktur vorhanden
ist, welche die zugehörigen Dienste zur Vergabe, Verwaltung und Auflösung
registrierter Objekte zuverlässig und langfristig erbringen kann.
Zusammenfassend kann gesagt werden, dass jedes URN-Schema die folgenden
Anforderungen erfüllen muss:
• Gültigkeit des Namens weltweit,
• Eindeutigkeit des Namens weltweit,
• Persistenz: Benutzbarkeit des Namens auf Dauer,
• Skalierbarkeit: das Schema muss beliebig viele Namen aufnehmen
können,
• Ausbau-/Erweiterungsfähigkeit: die Systematik muss eine Weiterent-
wicklung oder Migration zulassen,
• Übertragbarkeit: andere regelkonforme Bezeichnungssysteme müssen
eingebettet werden können,
• Unabhängigkeit: die beteiligten Institutionen selbst legen die Namens-
konventionen fest,
• Auflösbarkeit: die Verfügbarkeit von Resolvingdiensten muss auf Dauer
gewährleistet sein.
Die National Bibliography Number (NBN)
Zu den bei IANA registrierten Namensräumen zählt auch die NBN. Sie wurde
entwickelt, um die rasant anwachsende Zahl und Vielfalt digitaler Publikationen
– beispielsweise elektronische Zeitschriften, Hochschulschriften, Forschungs-
berichte, Lehr- und Lernmaterialien, u. a. – in den Nationalbibliografien bes-
13 http://www.ietf.org/rfc/rfc2276.txt
47
[ Version 1.5 ] 13-29
ser verzeichnen zu können. Das Konzept beruht auf einer Initiative der Con-
Das Konzept beruht auf einer Initiative der Con-
ference of Directors of National Libraries (CDNL) und der Conference of
European National Librarians (CENL). Es wurde von Juha Hakala (Finnische
wurde von Juha Hakala (Finnische
Nationalbibliothek) beschrieben (RFC 3188, 2001)
14
.
Die NBN ist international gültig. Wie in Deutschland übernehmen i. Allg. auch
in anderen Ländern die Nationalbibliotheken das Management des Namens-
raums auf nationaler Ebene. In das internationale Netzwerk der aktiv beteiligten
und untereinander vernetzten Partner sind die meisten skandinavischen Länder,
einige baltische Staaten, die Schweiz, Österreich und Italien eingebunden.
Die DNB betreibt einen Resolving-Dienst für Deutschland, Österreich und
die Schweiz.
15
Zu diesem Dienst gehört auch ein Internetportal, das Informati-
onen und Werkzeuge für die Benutzer zur Verfügung stellt. Der Aufbau erfolgte
im Rahmen eines vom BMBF geförderten Modellprojekts (EPICUR)
16
. Die
Konventionen und Qualitätskriterien des Dienstes sind in der URN-Strategie
der DNB dokumentiert.
Mit diesem Namensraum steht für Autoren, Verlage, Bibliotheken, Archive,
Forschungseinrichtungen und andere Institutionen ein kooperativ anwendbares
Verfahren zur Registrierung und Auflösung von PIs für ihre elektronischen Pu-
blikationen zur Verfügung. Die Nachteile einer standortbezogenen Identifizie-
rung lassen sich damit überwinden. Eine Verweisung auf die genaue Speicher-
adresse eines Objekts im Internet ist i. a. nicht auf Dauer benutzbar. Demge-
genüber behalten URN-basierte Referenzen in Publikationen, Bibliothekskata-
logen, Bibliografien oder Portalen auch dann ihre Gültigkeit, wenn sich der Ort
der Speicherung verändert (beispielsweise bei technischen Umstrukturierungen
oder bei der Verlagerung eines digitalen Archivs). Der zwischengeschaltete Re-
solver ermöglicht es, den Aufwand zur Pflege ungültig gewordener Speicher-
adressen relativ gering zu halten, weil lediglich der Eintrag im Register korrigiert
werden muss.
Die Persistenz des Identifiers ist allerdings keine Eigenschaft an sich. Sie kann
nur in enger Kooperation aller am System beteiligten Institutionen gewährleis-
tet werden und erfordert
• die Vergabe und Registrierung eindeutiger Namen für die
Informationsressourcen,
• eine leistungsfähige Infrastruktur zur Auflösung der Namen
14 http://www.ietf.org/rfc/rfc3188.txt
15 http://nbn-resolving.de/
16 http://www.persistent-identifier.de/
13 Access
33
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
13-30
(Resolving),
• die Einhaltung der festgelegten Regeln,
• unterstützende organisatorische und technische Maßnahmen zur
Qualitätssicherung,
• und die dauerhafte Verfügbarkeit der digitalen Objekte an sich.
Die URN-Struktur
URNs sind streng hierarchisch strukturiert und gliedern sich in einen Präfix
und einen Suffix.
RFC 2141 beschreibt die allgemeine Syntax eines URNs:
urn:[NID]:[SNID]-[NISS]
Präfix:
• NID
Kennzeichnung des Namensraums (Namespace Identifier)
• SNID optional können zusätzlich Unternamensräume definiert wer-
den (Subnamespace Identifier)
Suffix:
• NISS
Kennzeichnung des Objekts (Namespace Specific String)
Das Präfix identifiziert den Geltungsbereich (Namensraum) des URNs sowie
die für die Verlässlichkeit und Auflösung des einzelnen Namens verantwort-
lichen Institutionen.
Ein URN, der mit urn:nbn:de beginnt, drückt immer aus, dass es sich um eine
NBN handelt, die in Deutschland vergeben wurde und die über den Resolver
der DNB aufgelöst werden kann.
Die auf internationaler Ebene eingeleitete hierarchische Strukturierung kann
auf nationaler Ebene durch Gliederung in Unternamensräume weiter fortge-
setzt werden. Institutionen oder Personen, die URNs vergeben wollen, können
einen Unternamensraum beantragen. Die Registrierung von Unternamens-
räumen erfolgt in Deutschland bei der DNB. Bibliotheken wählen i. d. R. ein
Kennzeichen, das sich aus dem Namen des Bibliotheksverbundes und dem Bi-
bliothekssigel zusammensetzt. Für Institutionen oder Personen, die sich nicht
12
[ Version 1.5 ] 13-31
in die organisatorische Struktur der Bibliotheksverbünde einordnen (wie zum
Beispiel Verlage, Forschungseinrichtungen, Verbände oder Firmen), wird i. d.
R. eine vierstellige Zahlenkombination als Identifikator festgelegt.
Das Suffix eines URNs schließlich ist eine Zeichenfolge zur eindeutigen Iden-
tifizierung der Informationsressource selbst und kann aus Buchstaben, Zahlen
und Sonderzeichen bestehen.
Die in Deutschland vergebenen URNs im Namensraum nbn:de haben den
folgenden Aufbau:
13 Access
Beispiel 3: Suche im Katalog der DNB
Beispiel 4: Anzeige der zu einem URN registrierten Adressen
26
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
13-32
urn:nbn:de:[Unternamensraum]-[eindeutige Identifikation des
Objekts][Prüfziffer]
Beispiel 1:
Metadaten-Kernset im Format ONIX
17
, hrsg. von der DNB
urn:nbn:de:101-2007072707
Präfix:
urn:nbn:de
Kennzeichen des Auflösungsdienstes
101
Kennzeichen der URN-Vergabestelle; hier: DNB
Suffix:
200707270
Zeichenfolge zur eindeutigen Identifikation des
Objekts; hier: Aufnahmedatum
7
Prüfziffer (wird automatisch generiert)
Beispiel 2:
Hans-Werner Hilse, Jochen Kothe: Implementing Persistent Identifiers
(hrsg. vom Consortium of European Research Libraries)
urn:nbn:de:gbv:7-isbn-90-6984-508-3-8
17 Online Information Exchange, Datenformat zum Austausch von bibliografischen und Pro-
duktdaten im Buchhandel
28
[ Version 1.5 ] 13-33
Präfix:
urn:nbn:de
Kennzeichen des Auflösungsdienstes
gbv:7
Kennzeichen der URN-Vergabestelle;
hier: SUB Göttingen
Suffix:
isbn-90-6984-508-3- Zeichenfolge zur eindeutigen Identifikation des Objekts
hier: ISBN
8
Prüfziffer (wird automatisch generiert)
Auch innerhalb des Namensraums nbn:de können also lokal oder global be-
reits eingeführte Namensschemata wie z. B. die ISBN als Identifikatoren für ein
Objekt verwendet werden.
Die Auflösung von URNs
URNs werden in nationalen und internationalen Nachweissystemen (z. B.
Bibliografien, Kataloge und Suchmaschinen) nachgewiesen und sind über bi-
bliografische Austauschformate transportierbar.
Nach Möglichkeit sollten URNs bereits im Zuge der Publikation vergeben
werden, weil sie dann direkt in die Publikation mit eingebettet und so veröffent-
licht werden können. Durch die hierarchische Struktur bleibt die Eindeutigkeit
der Namen auch bei einer stark dezentral organisierten Anwendung des URN-
Schemas gewährleistet.
Damit URNs auflösbar sind, müssen sie zuvor im Resolver registriert worden
sein. Erst danach ist ein URN für die Identifizierung und Adressierung einer
Informationsressource benutzbar.
13 Access
38
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
13-34
Ein URN verweist auf mindestens einen URL. In der Regel werden mehrere
Kopien und unterschiedliche Präsentationsformate (zum Beispiel HTML, PDF,
JPEG) eines Objekts verwaltet. Typischerweise verweist der Resolver sowohl
auf die Repräsentationen des Objekts vor Ort – z. B. auf den Dokumentenser-
ver der Hochschule, des Verlags oder der Forschungseinrichtung – als auch auf
eine Kopie in einem Langzeitarchiv (z. B. auf das Langzeitarchiv der DNB).
Für die zeitnahe Übermittlung von Namen und Standortadressen digitaler
Objekte an den URN-Resolver der DNB stehen Frontendsysteme, Transfer-
schnittstellen, standardisierte Datenaustauschformate und automatisierte Über-
tragungsverfahren (Harvesting) zur Verfügung.
Bei Verwaltung mehrerer URLs zu einem URN existiert ein Standardverhalten
des Resolvers. Vorrangig wird der URL mit der höchsten Priorität aufgelöst.
Das kann z. B. der Volltext einer Publikation in einem bestimmten Format (bei-
spielsweise PDF) sein oder eine Webseite mit einer Beschreibung des Objektes
(Frontdoor). Falls dieser URL vorübergehend oder dauerhaft nicht erreichbar
ist, wird der URL mit der nächsten Priorität benutzt. Die Reihenfolge wird bei
der Registrierung des URNs festgelegt. Die Auflösbarkeit eines URNs auf Dau-
er kann allerdings nur dann gewährleistet werden, wenn auch mindestens eine
Kopie in einem vertrauenswürdigen Langzeitarchiv vorhanden ist. Ansonsten
kann ein URN eventuell auch ungültig werden. Der Name bleibt dennoch er-
halten und dem dann nicht mehr vorhandenen Objekt zugeordnet.
Ein URN dient ausschließlich zur Identifizierung eines einzelnen Objekts. Der
Resolver kann keine Informationen über den Kontext verarbeiten, zum Beispiel
Informationen über die Struktur einer elektronischen Zeitschrift mit mehreren
Bänden und darin enthaltenen einzelnen Artikeln. Allerdings darf das Objekt,
auf das sich ein URN bezieht, mehrere inhaltlich selbständige Beiträge beinhal-
ten. So umfasst beispielsweise ein URN, der sich auf die Titelseite einer Zeit-
schrift bezieht, alle veröffentlichten Bände der Zeitschrift. Gleichzeitig können
aber auch alle adressierbaren Teilobjekte ihrerseits einen URN besitzen (z.B. die
einzelnen Bände einer Zeitschrift oder sogar die einzelnen Artikel).
Um einen URN aufzulösen, muss der zugehörige Resolvingdienst gefunden
werden. URNs können – mit der Adresse des Resolvers zu einer http-Adresse
verknüpft – in den Browser eingegeben werden. Der dahinterliegende Resol-
vingdienst führt in diesem Fall die Standardauflösung durch und realisiert den
direkten Zugriff auf das digitale Objekt. Die Angabe nur des URNs genügt i.
d. R. nur dann, wenn spezielle Plugins installiert sind.
18
[ Version 1.5 ] 13-35
Beispiel 5: Auflösung eines URNs über die http-Adresse
http://nbn-resolving.de/urn:nbn:de:bvb:703-opus-3845
http://opus.ub.uni-bayreuth.de/volltexte/2008/384
Benutzer, die einen URN auflösen wollen, können dafür aber auch die Websei-
te des Resolvers benutzen.
18
Beispiel 6: Auflösung eines URNs über die Webseite des Resolvers in der DNB
URNs sind ein Teil der Internet-Architektur
Alle Uniform Resource Identifier (URIs), die im Internet bzw. im WWW ver-
wendet werden – so also auch der URN – müssen dem aktuellen Standard für
URIs, RFC 3986
19
(URI: Generic Syntax, 2005), entsprechen. Die Basisarchi-
tektur des WWW mit URIs als Grundkonzept für die Identifizierung jeglicher
18 http://www.persistent-identifier.de/?link=610
19 http://www.ietf.org/rfc/rfc3986.txt
13 Access
48
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
13-36
Ressourcen (RFC 1630, Universal Resource Identifiers in WWW)
20
stammt
bereits aus dem Jahre 1994 und wurde von Tim Berners Lee entworfen. Das
Prinzip gilt in gleicher Art und Weise für physikalische wie auch für abstrakte
Ressourcen (Zugriff auf Dateien oder Webseiten, Aufruf von Webservices,
Zustellung von Nachrichten, u. a.).
Der jetzt vorliegende Standard spezifiziert den grundsätzlichen Aufbau eines
URIs. Die einzelnen Schemata können allerdings weiterhin sehr unterschied-
lich sein. Gekennzeichnet wird jedes Schema durch seinen Namen, gefolgt von
einem Doppelpunkt.
IANA verzeichnet gegenwärtig (Stand: Februar 2008) mehr als 60 verschie-
dene permanente URI-Schemata
21
. Neben dem URN gehören dazu u. a.:
• ftp – File Transfer Protocol
• http – Hypertext Transfer Protocol
• info – InfoURI
• mailto – E-mail-Adresse
• z39.50r – Z39.50 Retrieval
• z39.50s - Z39.50 Session
Die nachfolgende Tabelle gibt abschließend einen zusammenfassenden Über-
blick über die wichtigsten IETF-Empfehlungen
22
, die in ihrer Gesamtheit den
URN als einen Uniform Resource Identifier beschreiben:
Request for
Comments
(RFC)
Thema
Status
Datum
Grundlage: das URI-Schema
RFC 1630
Universal Resource Identifiers in
WWW
Informational 1994
RFC 3986
Uniform Resource Identifier Ge-
neric Syntax
St a n d a r d s
Track
2005
20 http://www.ietf.org/rfc/rfc1630.txt
21 http://www.iana.org/assignments/uri-schemes
22 http://www.ietf.org/rfc.html
Documents you may be interested
Documents you may be interested