pdf reader library c# : How to delete text from pdf document Library SDK component .net asp.net wpf mvc nestor-handbuch31-part931

[ Version 1.5 ]   15-37
gebung angewiesen. Daraus folgt, dass man zum einen diese Umgebung geeig-
net rekonstruieren muss, um dann in dieser die gewünschten Daten anzusehen 
oder in selteneren Fällen zu bearbeiten. Andererseits wird sich je nach Erstel-
lungsdatum des Objektes die damalige Erstellungs- oder Nutzungsumgebung 
dramatisch von der jeweils aktuellen unterscheiden. In der Zwischenzeit haben 
sich mit einiger Wahrscheinlichkeit die Konzepte des Datenaustausches ver-
ändert. Hier ist nun dafür zu sorgen, dass die interessierenden Primärobjekte 
geeignet in die (emulierte) Nutzungsumgebung gebracht werden können, dass 
die Betrachtung für den  Archivnutzer in sinnvoller Form möglich ist und dass 
eventuell Bearbeitungsergebnisse aus der Nutzungsumgebung in die aktuelle 
Umgebung transportiert werden können.
Das Archiv muss deshalb eine ganze Reihe verschiedener Softwarekomponen-
ten umfassen, so sind:
•  die Emulatoren zu speichern, so dass mit ihrer Hilfe die Wiederherstel-
lung einer  Rechner-Architektur  für bestimmte  Nutzungsumgebungen 
erfolgen kann.
•  die Betriebssysteme abzulegen, die je nach Rechnerplattform einen Teil 
der Nutzungsumgebung ausmachen. 
•  Treiber  der Betriebssysteme  zusätzlich  zu  speichern,  da  sie  den  Be-
triebssystemen  überhaupt  erlauben  mit  einer  bestimmten  Hardware 
umzugehen.
•  die Applikationen zu archivieren, mit denen die verschiedenen digitalen 
Objekte erstellt wurden. Diese Applikationen sind ebenfalls Bestandteil 
der Nutzungsumgebung des Objektes. Sie sind in vielen Fällen auf die 
vorgenannten Betriebssysteme angewiesen.
•  die unter Umständen notwendigen Erweiterungen einer Applikations-
umgebung, wie bestimmte Funktionsbibliotheken, Codecs oder Schrift-
artenpakete zur Darstellung.
•  Hilfsprogramme zu sammeln, welche den Betrieb der Emulatoren ver-
einfachen oder überhaupt erst ermöglichen. Hierzu zählen beispielsweise 
Programme, die direkt mit dem jeweiligen Containerformat eines Emu-
lators umgehen können.
•  je nach Primärobjekt oder gewünschter Nutzungsumgebung sind meh-
rere Varianten derselben Software zu archivieren, um beispielsweise die 
Lokalisierung in eine bestimmte Ein- und Ausgabesprache zu erreichen.
View-Paths und Referenzumgebungen
Digitale Objekte können nicht aus sich alleine heraus genutzt werden, sie 
15 Anwendungsfelder in der Praxis
How to delete text from pdf document - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
how to delete text in pdf using acrobat professional; acrobat remove text from pdf
How to delete text from pdf document - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
how to delete text from pdf; pdf text remover
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
15-38
bedürfen eines geeigneten Kontextes, damit auf sie zugegriffen werden 
kann. Dieser Kontext, Nutzungsumgebung genannt, muss geeignete Hard-
ware- und Softwarekomponenten so kombinieren, dass je nach Objekttyp die 
Erstellungsumgebung oder ein geeignetes Äquivalent abgebildet werden.
Die Wiederherstellung von Nutzungsumgebungen oder geeigneter Äquiva-
lente läßt sich am besten durch sogenannte „View-Paths“, Wege ausgehend 
vom Primärobjekt des Interesses zur Arbeitsumgebung des Betrachters oder 
Anwenders, veranschaulichen und formalisieren. Im Zuge des DIAS Pro-
jekts an der Königlichen Bibliothek der Niederlande
26
wurde dieses Konzept 
vorgestellt. Die Abbildung 15.3.4.3 zeigt einen typischen View-Path ausge-
hend vom Primärobjekt, über seine Erstellungsapplikation, das durch diese 
erforderte Betriebssystem und daraus resultierendem Hardwareemulator.
Abbildung  15.3.4.3:  Verschiedene  Aufgabenstellungen  für  das  Management  eines 
Langzeitarchivs
Für ein digitales Langzeitarchiv erwachsen daraus verschiedene Aufgaben, die 
von der Bestimmung des Objekttyps beim Einstellen in das Archiv, der Gene-
rierung und Ablage der benötigten Metadaten bis zur Überprüfung auf Vor-
handensein oder der Herstellbarkeit einer Ablaufumgebung reichen. Abbildung 
15.3.4.4 zeigt ein digitales Objekt, das für seine Betrachtung eine Reihe von 
26  siehe  dazu  das  Konzept  des  Preservation-Managers  in 
http://www.
kb.nl/hrd/dd/dd_onderzoek/preservation_subsystem-en.html
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
VB.NET PDF - How to Delete PDF Document Page in VB.NET. Visual Basic Sample Codes to Delete PDF Document Page in VB.NET Class. Free
delete text from pdf acrobat; how to delete text from a pdf
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
C#.NET PDF Library - Delete PDF Document Page in C#.NET. Provide C# Users in C#.NET. How to delete a single page from a PDF document.
how to edit and delete text in pdf file online; how to delete text in pdf preview
[ Version 1.5 ]   15-39
Sekundärobjekten braucht - angefangen von der Applikation, mit der es erstellt 
wurde, über das Betriebssystem, das diese ausführen kann. Letzteres wird sich 
je nach Alter nicht mehr auf moderner Hardware ausführen lassen und läuft 
deshalb in einem geeigneten Hardwareemulator ab.
Abbildung 15.3.4.4: �in typischer View-Path ausgehend von einem digitalen Primärobjekt
Für das OAIS-Management leiten sich daraus verschiedene Aufgaben ab. Eine 
Rolle spielt beispielsweise die Klassifikation der Objekte nach ihrem Objekttyp 
(neben ihren Metadaten), da dieser über die später notwendigen Schritte für 
den Zugriff mitbestimmt. Ebenso können je nach Benutzergruppe oder Ein-
richtung verschiedene Kriterien existieren, nach denen View-Paths bestimmt 
werden. Es lassen sich drei wesentliche Phasen voneinander unterscheiden:
•  Notwendige Handlungen bei der Objektaufnahme ins Archiv (Ingest)
•  Regelmäßige Schritte und Arbeitsabläufe während des Archivbetriebs
•  Handlungsanweisungen für den Objektzugriff durch den beziehungs-
weise die Objektausgabe an den Endbenutzer (Digest)
Zur Bestimmung des Objekttyps existieren verschiedene Möglichkeiten; ein 
über das Internet nutzbarer Dienst mit einer breiten Unterstützung ist beispiels-
weise PRONOM. Die Auswahl über die in das Softwarearchiv einzustellenden 
und später zu pflegenden Emulatoren entscheidet wesentlich über die Nach-
nutzbarkeit der Primärobjekte des Langzeitarchivs. Deshalb ist bei der Einstel-
lung eines digitalen Objekts in das Archiv zu bestimmen, ob für diesen Objekt-
typ ein View-Path bestimmt werden kann und auf welche später nachzubilden-
de Rechner-Plattform dieser zeigt. Umgekehrt kann das beim Ingest bedeuten, 
dass ein Objekt zurückgewiesen werden kann oder es nur in Erwartung auf eine 
später verfügbare Lösung eingestellt wird.
Aus Sicht des Archivmanagements unterscheiden sich Emulatoren nicht we-
sentlich von den Primärobjekten. Sie werden je nach Archivstrategie und Re-
ferenzplattform im Laufe der Zeit obsolet, müssen geeignet migriert oder ihre 
Nutzungsumgebung erhalten werden. Zu einem gegebenen Zeitpunkt wird ein 
Primärobjekt von einem Archivbenutzer nachgefragt werden. Dieser erwartet 
15 Anwendungsfelder in der Praxis
C# PDF Text Extract Library: extract text content from PDF file in
Free online source code for extracting text from adobe PDF document in C#.NET class. Ability to extract highlighted text out of PDF document.
pdf editor online delete text; remove text from pdf online
VB.NET PDF Text Extract Library: extract text content from PDF
SharePoint. Extract text from adobe PDF document in VB.NET Programming. Extract file. Extract highlighted text out of PDF document. Image
delete text from pdf preview; erase text in pdf document
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
15-40
typischerweise eine geeignete Umgebung, in der er das Objekt betrachten oder 
benutzen kann. Die Benutzergruppen einzelner digitaler Archive und Samm-
lungen werden sich im Grad ihrer Kenntnisse unterscheiden. Da bei einem 
durchschnittlichen Nutzer nicht zwingend von einem erfahrenen Computer-
anwender auszugehen ist, sind Überlegungen zu treffen, wie dieser geeignet an 
die notwendige Software und ihre Schnittstellen herangeführt werden kann, um 
mit ihr umgehen zu können. Ebenso kann es notwendig werden eine Reihe von 
Hilfsmitteln zu präsentieren.
Während der Ausgangspunkt des View-Paths durch das Primärobjekt festge-
legt ist, wird sich, erzwungen durch den technologischen Fortschritt und die 
sukzessive Obsoleszenz vorhandener Rechnerplattformen, der Endpunkt des 
View-Path im Zeitablauf verschieben. Zudem sind die Längen eines View-Path 
vom Typ des Primärobjekts abhängig. Generell ergeben sich folgende Szenarien 
für View-Paths:
•  Es gibt zum gegebenen Zeitpunkt einen Weg vom Primärobjekt zu sei-
ner Darstellung oder Ausführung.
•  Es existieren mehrere verschiedene View-Paths, diese sind mit geeig-
neten Metriken zu versehen.
•  Es kann Primärobjekte geben, zu denen zu bestimmten Zeitpunkten kei-
ne View-Paths vorhanden sind.
Zur  sinnvollen  Bestimmung der  Existenz von  View-Paths  sollten  sie  sich 
deshalb  auf bestimmte Referenzumgebungen mit jeweils festgelegten Eigen-
schaften aus Hard- und Software beziehen. Einen View-Path kann man sich 
damit als Entscheidungsbaum vorstellen, an dessen Wurzel das Primärobjekt 
steht. Zur Veranschaulichung  des  Aufbaus der benötigten Ablaufumgebung 
läßt sich wiederum ein Schichtenmodell vorstellen.
Viele  Primärobjekte  lassen sich  durch  mehr  als eine  Applikation  (Viewer) 
darstellen. Dabei können die Anzeigeergebnisse in Authentizität, Komplexität 
oder Qualität differieren. Damit ergibt sich eine Pfadverzweigung und auf der 
Schicht der Applikation eine Auswahl. Ähnliches trifft auf die Anforderung der 
Applikation nach einem Betriebssystem zu, so dass in dieser Schicht eine weitere  
Verzweigung auftreten kann. Die Rekursion setzt sich mit dem Betriebssystem 
und einer möglichen Auswahl an geeigneten Hardware-Emulatoren fort. 
Die Modellierung des View-Path in Schichten erfolgt nicht starr: So reduziert 
sich beispielsweise bei einem digitalen Primärobjekt in Form eines Programms 
die Zahl der Schichten. Ähnliches gilt für einfache Plattformen, wie Home-
Computer,  wo  keine  Trennung  zwischen  Betriebssystem  und  Applikation 
vorliegt. Darüber hinaus können Schichten wiederum gestapelt sein, wenn es 
C# PDF insert text Library: insert text into PDF content in C#.net
C#.NET PDF SDK - Insert Text to PDF Document in C#.NET. This C# coding example describes how to add a single text character to PDF document. // Open a document.
how to delete text in pdf document; delete text pdf preview
C# PDF metadata Library: add, remove, update PDF metadata in C#.
C#.NET PDF SDK - Edit PDF Document Metadata in C#.NET. Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata in .NET Project.
remove text from pdf; how to delete text from a pdf document
[ Version 1.5 ]   15-41
erforderlich wird für einen bestimmten Emulator seinerseits eine geeignete Ab-
laufumgebung herzustellen (vgl. Abbildung 15.3.4.1).
Eine  sinnvolle  Erweiterung  des  etwas  unbestimmten  Ansatzes  im  starren 
DIAS-Modell (eine der ersten Realisierungen des View-Path-Konzepts) könnte 
in der Gewichtung der einzelnen View-Path-Optionen liegen, die durch eine 
beschreibende Metrik abgebildet werden könnte. Gerade wenn an einem Kno-
ten mehr als eine Option zur Auswahl steht, wäre es sinnvoll:
•  Präferenzen des Benutzers beispielsweise in Form der Auswahl der Ap-
plikation, des Betriebssystems oder der Referenzplattform zuzulassen.
•  Gewichtungen  (anhand  bestimmter  Metriken)  vorzunehmen,  ob  bei-
spielsweise besonderer Wert auf die Authentizität der Darstellung oder 
eine besonders einfach Nutzung gelegt wird.
•  Vergleiche zwischen verschiedenen Wegen zuzulassen, um die Sicherheit 
und Qualität der Darstellung der Primärobjekte besser abzusichern.
•  Den Aufwand abzuschätzen, der mit den verschiedenen View-Path ver-
bunden ist, um bei Bedarf eine zusätzliche ökonomische Bewertung zu 
erlauben.
Eine Schlussfolgerung könnten mehrdimensionale Metriken sein, die mit den 
Objektmetadaten gespeichert und durch das Archivmanagement regelmäßig 
aktualisiert werden. Da die Entscheidung über die Qualität einer Darstellung 
oder Ausführung eines Primärobjekts oft nur vom Anwender getroffen werden 
kann, sollte man Überlegungen anstellen, wie Benutzerrückmeldungen zur Er-
stellung der Metriken einfließen könnten.
Geeignete Referenzumgebungen, als Bezugspunkte für die Darstellung der Pri-
märobjekte, versuchen in möglichst kompakter und gut bedienbarer Form ein 
ganzes Spektrum von Ablaufumgebungen zur Verfügung stellen zu können. 
Dabei sollte die Basisplattform möglichst der jeweils aktuellen Hardware mit 
jeweils üblichen Betriebssystemen entsprechen. Das verhindert einerseits das 
Entstehen  eines Hardwaremuseums mit hohen Betriebskosten. Andererseits 
findet sich der Benutzer zumindest für das Basissystem in der gewohnten Um-
gebung wieder.
Jede historische Rechnerplattform, bis zu den heutigen, weist ihre eigenen 
Komplexitäten auf, die nicht von jedem durchschnittlichen Computeranwender 
sinnvoll bewältigt werden können. Zudem kann es nicht die Voraussetzung für 
den Zugriff auf ein bestimmtes Primärobjekt sein, dass die interessierte Per-
son sich mit der Erstellungsumgebung und ihrer Einrichtung auskennt. Je nach 
Typus ihrer Benutzer werden deshalb Betreiber digitaler Langzeitarchive nach 
Lösungen suchen, die es erlauben in geeigneter Weise auf ihre jeweiligen Pri-
15 Anwendungsfelder in der Praxis
C# PDF Text Search Library: search text inside PDF file in C#.net
C#.NET. C# Guide about How to Search Text in PDF Document and Obtain Text Content and Location Information with .NET PDF Control.
delete text pdf acrobat professional; delete text from pdf
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
All text content of target PDF document can be copied and pasted to .txt files by keeping original layout. C#.NET class source code
how to delete text in pdf file online; erase pdf text online
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
15-42
märobjekte zuzugreifen. In jedem Fall ist eine gewisse Abstraktionsschicht zu 
schaffen, über die ein Objektzugriff erfolgen kann. Hierfür sind verschiedene 
Varianten denkbar, die an unterschiedlichen Schnittstellen ansetzen:
•  Referenzplattformen aus einer bestimmten Hardware und Software wer-
den als Endpunkte von View-Paths benötigt. Sie können ortsnah zum 
Langzeitarchiv, beispielsweise parallel oder als Erweiterung der üblichen 
Recherchesysteme  der  jeweiligen  Gedächtnisorganisation  aufgestellt 
oder in diese integriert werden.
•  Sie ließen sich in einem gewissen Umfang virtualisieren, um sie per Web-
Browser  oder  anderen  geeigneten  und  allgemein  genutzten  Internet-
Technologien entfernt zur Verfügung zu stellen.
•  Alternativen  bestehen  darin  definierte  virtuelle  Maschinen,  wie  Java, 
zur Ausführung von Emulatoren und ihren enthaltenen Nutzungsum-
gebungen zu verwenden (Dioscuri). Hierdurch erreicht man einerseits 
eine  breitere  Auswahl  von  Referenzumgebungen  bei  einer  stabileren 
Schnittstelle zur virtuellen Maschine. Andererseits verlagert man damit 
das Problem eine Schicht weiter nach unten und hängt nun von der Wei-
terentwicklung virtuellen Maschine ab.
Eine Referenzumgebung sollte in der Lage sein, neben der jeweiligen Nut-
zungsumgebung  zusätzlich  die  notwendigen  Hinweise  zum  Aufsetzen  und 
zur Bedienung bereitzustellen, welche einen geeigneten Zugriff auf die Ob-
jektmetadaten beinhalten. Weitere Kriterien liegen in der Güte der Darstellung 
der Nutzungsumgebung. Wegen ihrer durch die eingesetzten Emulatoren und 
Viewer spezielleren Anforderungen ist es für die Betreiber von Langzeitarchiven 
vielfach sinnvoll eine Referenzplattform selbst zu definieren und bereitzustel-
len. Diese wird sich je nach Anwendung und Gedächtnisorganisation unter-
scheiden: Bibliotheken und Archive benötigen in erster Linie Viewer für mig-
rierte statische Objekte und Emulatoren für die nicht-migrierten Archivinhalte. 
Soweit sinnvoll kann diese Aufgabe auf bereits vorhandenen Recherche- oder 
Anzeigesystemen der Institution untergebracht werden, um den Benutzern ei-
nen leichten Zugriff zu erlauben. Ein Datenaustausch mit der Außenwelt kann 
benötigt werden, wenn Datenarchäologie angeboten werden oder ein Ausdruck 
eines Dokuments erfolgen soll.
Technische Museen oder Ausstellungen leben eher von interaktiven Objekten. 
Die Referenzworkstation ist je nach zu zeigendem Exponat zu bestücken; ein 
Datenaustausch ist üblicherweise nicht vorgesehen. Für Firmen oder Institu-
tionen kann bereits ein X86-Virtualisierer ausreichen, um der Zugreifbarkeit 
auf den Archivbestand Genüge zu tun. Die erwarteten Objekte sind eher sta-
tischer Natur und wurden typischerweise auf PC’s verschiedener Generationen 
[ Version 1.5 ]   15-43
15 Anwendungsfelder in der Praxis
erstellt. Generell muss es sich bei den eingesetzten Referenzworkstations nicht 
um die jeweils allerneueste Hardwaregeneration handeln. Stattdessen sollte die 
Technologie angestrebt werden, die einen optimalen Austausch erlaubt und den 
Anforderungen der jeweiligen Nutzer gerecht wird.
Es muss ein ausreichendes Bedienungswissen vorgehalten werden, welches bei 
speziellen Nutzergruppen wie digitalen Archivaren, auch für recht alte Nut-
zungsumgebungen erwartet werden kann. Auf diese Weise lassen sich zudem 
Versionen der Hardware und Betriebssysteme bei allfälligen Generationswech-
seln der Referenzworkstations überspringen.
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
15-44
15.4  Web-Harvesting  zur  Langzeiterhaltung  von 
Internet-Dokumenten
Hans Liegmann (†)
�überarbeitete Fassung eines Vortrags auf  der 10. Tagung des Arbeitskreises „Archivierung 
von Unterlagen aus digitalen Systemen“ - Planungen, Projekte, Perspektiven – Zum Stand 
der Archivierung elektronischer Unterlagen - Düsseldorf, 14./15. März �006)
1 Web-Harvesting als Sammelmethode für Internet-Dokumente
Unter Web-Harvesting versteht man das automatisierte Einsammeln von In-
ternet-Dokumenten zum Zwecke der Archivierung in einem digitalen Archiv. 
Zentrales Element des Web-Harvesting ist eine Software-Komponente (craw-
ler). Diese sucht ausgehend von einer Liste vorgegebener Web-Adressen (URL 
seed list) die erreichbaren Dokumente auf und speichert sie in einer definierten 
Zielumgebung ab.
Beim selektiven zielgerichteten Web-Harvesting (focused crawl) besteht das 
Ziel darin, möglichst vollständige und konsistente Archivkopien genau derjeni-
gen Websites zu erhalten, deren Adressen in der vorgegebenen Liste enthalten 
sind.
Beim flächigen Web-Harvesting (broad crawl) wird eine vorgegebene Adress-
liste lediglich als Einstieg in ein Sammelverfahren verwendet, das weitergehend 
ist. Flächiges Web-Harvesting hat definierte formale Regeln als Auswahlgrund-
lage der zu archivierenden Websites. Eine typische Regel kann lauten, dass zu 
archivierende  Dokumente  Bestandteil  eines  bestimmten  Internet-Bereiches 
(domain, z.B. „de“) sein müssen, um als archivierungswürdig angesehen zu 
werden.
Unabhängig  vom  Komplexitätsgrad möglicher Regelformulierungen ist die 
Grundlage  des  Sammelverfahrens  die  Verfolgung  von  Hyperlinks:  aus  den 
aufgefundenen Dokumenten werden wiederum die in ihnen enthaltenen Web-
Adressen extrahiert und auf Regelkonformität geprüft. Die Liste der aufzusu-
chenden URLs wird dann ggf. dynamisch erweitert.
[ Version 1.5 ]   15-45
15 Anwendungsfelder in der Praxis
Abbildung 15.4.1
Abbildung 15.4.�
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
15-46
Derzeit gibt es verschiedene Produkte auf dem Markt, die zur Durchführung 
von Web-Harvesting geeignet sind. Das Angebot ist vorrangig auf die Bedürf-
nisse des selektiven Harvesting ausgerichtet. Dazu gibt es kommerzielle, Free-
ware- und Open-Source-Angebote. Diese genügen überwiegend den Anforde-
rungen der Langzeitarchivierung nicht, da sie bei der Archivierung der Daten 
inhaltliche Veränderungen vornehmen.
Flächiges  Harvesting  unter  Berücksichtigung  der  Authentizität  archivierter 
Objekte wird nur von wenigen Softwareprojekten (z.B. der Crawler HERITRIX 
des International Internet Preservation Consortium) unterstützt. Bei der Pla-
nung produktiver Harvesting-Anwendungen im Massenbetrieb ist zu berück-
sichtigen, dass kommerzielle Software-Produkte mit garantiertem Leistungs-
umfang nicht zur Verfügung stehen und ggf. umfangreiche Zusatzinvestitionen 
notwendig sind, um die gewünschte Funktionalität zu erreichen.
Die  aktuelle  Anwendungsbreite  von  Web-Harvesting-Verfahren  ist  in  fol-
gendem Schaubild dargestellt:
Die eingesetzten Verfahren lassen sich in einer Matrix einordnen, die nach 
den  Kriterien „flächig“ bis „fokussiert“  und „nationale/regionale Auswahl“ 
bis „fachlich/institutionelle“ Auswahl aufgebaut ist. Die Aktivitäten von Na-
tionalbibliotheken sind zum Teil flächig angelegt (Sammeln nationaler Adress-
räume) oder auch durch selektives Vorgehen bestimmt (Auswahl der für einen 
bestimmten Kulturkreis als relevant bewerteten Internetpräsenzen). Im Bereich 
der fokussierten Harvesting-Ansätze finden sich fachlich orientierte Beispiele 
wie z.B. das Projekt DACHS
27
, die Vorgehensweise des Deutschen Parlaments-
archivs
28
mit institutioneller Abdeckung und die kooperativen Aktivitäten ei-
niger deutscher Parteienarchive
29
.
Bei der Darstellung der Methode soll nicht unerwähnt bleiben, dass die tech-
nischen Instrumentarien zur Durchführung zurzeit noch mit einigen Defiziten 
behaftet sind:
•  Inhalte des so genannten „deep web“ sind durch Harvester nicht er-
reichbar. Dies schließt z.B. Informationen ein, die in Datenbanken oder 
Content Management Systemen gehalten werden. Harvester sind noch 
27  http://www.sino.uni-heidelberg.de/dachs [DACHS - Digital Archive for Chinese Studios] 
(Juni 2006)
28  http://www.bundestag.de/bic/archiv/oeffent/ArchivierungNetzressourcenKlein.pdf  [An-
gela Ullmann; Steven Rösler: Archivierung von Netzressourcen des Deutschen Bundestages] 
(Juni 2006)
29  http://www.fes.de/archiv/spiegelungsprojekt.htm [Politisches Internet-Archiv] (Juni 2006)
Documents you may be interested
Documents you may be interested