pdf reader library c# : Remove text from pdf acrobat application software tool html windows .net online nestor-handbuch27-part926

[ Version 1.5 ]   14-11
existiert ein älterer, segmentierte Workflow, die nun aufgrund der Anforde-
rungen  seitens  Archivsystem  und  künftiger  Bereitstellung  anzupassen sind. 
Nach Erstellung der Images der Daten und einer Analyse des vorhandenen 
Materials wurde daher ein Änderungs- und Ergänzungsvorschlag für den inte-
grierten Workflow dieser Materialgruppe erarbeitet. 
Ebenso wird der Workflow für genuin online vorliegende Netzpublikationen 
unter Einbeziehung der Anforderungen der Langzeitarchivierung neu gestaltet 
und auf die Schnittstellen des Archivsystems angepasst. Dabei ergeben sich 
eine ganze Reihe von Problemen: So entsprechen fortlaufende Publikationen 
(vor allem elektronische Zeitschriften-Artikel) und die künftigen zu archivie-
renden Objekte häufig nicht der aktuellen Abbildung im Online-Katalog. Bi-
bliografische Metadaten von Archivobjekten müssen aber künftig im biblio-
graphischen System abgebildet werden, um einen einheitlichen Zugang zu ge-
währleisten. Dazu müssen eine Festlegung von Erschließungsvarianten und ein 
Mapping von Archivobjekten auf Katalogobjekte erfolgen, letztlich also eine 
klare Definition der Granularität von Objekten und ihrer Abbildung getroffen 
werden. 
Das URN-Management in der DNB wurde bereits erweitert und vor allem 
technisch so weiterentwickelt, dass eine Einbindung in andere Arbeitszusam-
menhänge erfolgen kann. Da jedes Objekt zum Einspielen in das Archiv einen 
Persistent Identifier benötigt, erfolgt für bereits gesammelte Objekte ohne URN 
eine retrospektive Vergabe der URN. Alle neuen Objekte müssen entweder mit 
URN geliefert werden bzw. bei Eingang/Bearbeitung einen URN erhalten, was 
dem künftigen Verfahren entspricht.
Wesentliche  Voraussetzungen  für  die  Einbindung  des  Archivs  in  die  Ge-
schäftsumgebung der Institution liegen mittlerweile vor oder werden gerade 
geschaffen. Insbesondere die Kernelemente des Produktionssystem laufen, das 
produktive Einspielen von Material wurde und wird erprobt, nötige Weiterent-
wicklungen (z.B. noch fehlende Module zur Auswertung von Dateiformaten) 
wurden und  werden ermittelt und Änderungen / Anpassungen in diversen 
Workflows der traditionellen Bearbeitung wurden bereits angestoßen. Weitere 
14 Technischer Workflow
Remove text from pdf acrobat - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
how to delete text from a pdf; delete text pdf acrobat
Remove text from pdf acrobat - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
how to delete text from pdf document; delete text pdf file
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
14-12
Aufgaben betreffen in hohem Maße die Übergabe des kopal-Systems eine stän-
dige Arbeitseinheit sowie die retrospektive Aufarbeitung des früher bereits in 
die Bibliothek gelangten Materials. 
Hinter diesen Bemühungen steht der Anspruch, die neuen, mit der Gesetzes-
novelle übernommenen Aufgaben, die weit über das Arbeitsfeld der Langzeitar-
chivierung hinausgehen, in einem ganzheitlichen technischen Workflow abzu-
bilden. In dessen Mittelpunkt stehen aktuell die Übernahme von elektronischen 
Objekten mit möglichst breiter Nachnutzung vorhandener Metainformationen 
und die Integration der Abläufe in die Arbeitsumgebung der DNB.
Die praktischen Erfahrungen an der DNB insbesondere für diesen Bereich 
belegen den besonderen Bedarf für eine bewusste Modellierung der Geschäfts-
prozesse, die in der Vergangenheit häufig nur unvollkommen gelungen ist. Im 
Ergebnis standen isolierte, von nur wenigen Personen bediente und bedienbare 
Abläufe mit einem hohem manuellen Eingriffs- und Fehlerbehandlungsbedarf. 
Ohne dass heute  bereits  ein komplettes  Profil  der zukünftigen technischen 
Workflow-Umgebung zitierfähig vorliegt, kann doch gesagt werden, dass ein 
methodisch bewusstes, in enger Kooperation von Bedarfsträger und Informa-
tionstechnik ablaufendes Vorgehen zu deutlich klareren Vorstellungen darüber 
führt, wie die wesentlichen Arbeitsschritte exakt aussehen und wie sie adäquat 
so abgebildet werden, dass die entstehenden Services auch langfristig und damit 
über ihren aktuellen Entstehungshintergrund hinaus genutzt werden.
Dass dabei für eine technische Arbeitsumgebung besondere Anforderungen an 
die Flexibilität und die Orientierung an offenen Standards gelten, liegt auf der 
Hand und hat wesentlich die Entwicklungsleitlinien für kopal mitbestimmt.
12
12  kopal (2008a)
.NET PDF Document Viewing, Annotation, Conversion & Processing
Insert images into PDF. Edit, remove images from PDF. Redact text content, images, whole pages from PDF file. Edit, update, delete PDF annotations from PDF file.
erase pdf text; delete text from pdf file
C# PDF Converter Library SDK to convert PDF to other file formats
Allow users to convert PDF to Text (TXT) file. can manipulate & convert standard PDF documents in other external third-party dependencies like Adobe Acrobat.
how to delete text from a pdf document; delete text pdf document
[ Version 1.5 ]   14-13
Literatur
Clifton, Gerard: Safe Havens In A Choppy Sea: Digital Object Management 
Workflows At The National Library of Australia (2005), Beitrag zur iPRES 
- International Conference on Preservation of Digital Objects, Göttingen 
(September  15,  2005).  In: 
http://rdd.sub.uni-goettigen.de/conferences/
ipres05/download/Safe%20Havens%20In%20A%20Choppy%20Sea%20Digita
l%20Object%20Management%20Workflows%20At%20The%20National%20Li
brary%20of%20Australia%20-%20Gerard%20Clifton.pdf
(Zugriff 6.1.2008)
Keller, Gerhard / Nüttgens, Markus / Scheer, August-Wilhelm (1992): Seman-
tische Prozessmodellierung auf der Grundlage „Ereignisgesteuerter Pro-
zessketten (EPK)“. In: A.-W. Scheer (Hrsg.): Veröffentlichungen des Ins-
tituts für Wirtschaftsinformatik, Heft 89, Saarbrücken. Online in: 
http://
www.iwi.uni-sb.de/Download/iwihefte/heft89.pdf
(Zugriff 28.12.2007)
Königliche Bibliothek der Niederlande (KB): How the e-Depot works (2008) 
In: 
http://www.kb.nl/dnp/e-depot/dm/werking-en.html
(Zugriff 6.1.2008)
Königliche Bibliothek der Niederlande (KB): The e-Depot system (DIAS) 
(2008) In: 
http://www.kb.nl/dnp/e-depot/dias-en.html
(Zugriff 6.1.2008)
Kopal (2008): Projekthompage. In: 
http://kopal.langzeitarchivierung.de/
(Zugriff 
am 6.1.2008)
Kopal (2008a): kopal: Ein Service für die Langzeitarchivierung digitaler Infor-
mationen. In: 
http://kopal.langzeitarchivierung.de/downloads/kopal_Services_
2007.pdf
(Zugriff am 6.1.2008)
Martin, Norbert (1999): Und wie kommt die Dissertation auf den Server? 
Gedanken zum Workflow. Vortrag auf der IuK-Tagung „ Dynamic Do-
cuments „ vom 22.-24.3.1999 in Jena. In: 
http://edoc.hu-berlin.de/epdiss/
jena3/workflow.pdf
(Zugriff am 4.1.2008)
OMG Infrastructure (2007). UML Infrastructure Specification, v2.1.2. OMG 
document  formal/07-11-04.  In: 
http://www.omg.org/docs/formal/07-11-
04.pdf
(Zugriff am 4.1.2008)
OMG Superstructure (2007). UML Superstructure Specification, v2.1.2. OMG 
document  formal/07-11-02.  In: 
http://www.omg.org/docs/formal/07-11-
02.pdf
(Zugriff am 4.1.2008)
Stapel, Johan: The KB e-Depot. Workflow Management in an Operational Ar-
chiving Environment (2005). Beitrag zur iPRES - International Conference 
on Preservation of Digital Objects, Göttingen (September 15, 2005). In: 
http://rdd.sub.uni-goettingen.de/conferences/ipres05/download/Workflow%2
0Management%20In%20An%20Operational%20Archiving%20Environment%
20-%20Johan%20Stapel.pdf
(Zugriff 6.1.2007)
14 Technischer Workflow
C# powerpoint - PowerPoint Conversion & Rendering in C#.NET
documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. PowerPoint to PDF Conversion.
how to erase pdf text; remove text watermark from pdf
C# Windows Viewer - Image and Document Conversion & Rendering in
standard image and document in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Convert to PDF.
pdf text remover; delete text pdf preview
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
14-14
Verwaltungslexikon (2008) - Management und Reform der öffentlichen Ver-
waltung (2008) In: 
http://www.olev.de/w.htm
(Zugriff am 4.1.2008)
Wollschläger, Thomas (2007): „kopal goes live“. In: Dialog mit Bibliotheken 19 
(2007), H.2, S. 17 – 22
Workflow Management Coalition (2008) – Website. In: 
http://www.wfmc.org/
(Zugriff am 5.1.2008)
C# Word - Word Conversion in C#.NET
Word documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Word to PDF Conversion.
delete text from pdf online; acrobat delete text in pdf
JPEG to PDF Converter | Convert JPEG to PDF, Convert PDF to JPEG
It can be used standalone. JPEG to PDF Converter is able to convert image files to PDF directly without the software Adobe Acrobat Reader for conversion.
how to delete text in pdf acrobat; remove text from pdf online
[ Version 1.5 ]   15-1
15 Anwendungsfelder in der Praxis
Einleitung
Regine Scheffel
Die vorangegangenen Kapitel über Strategien, Modelle, Standards u. a. ver-
mitteln  den  (derzeitigen) Kenntnisstand,  der  notwendig  ist,  um  kompetent 
Probleme  der  Langzeitarchivierung  und  Langzeitverfügbarkeit  anzupacken. 
Vielfach treten jedoch Anforderungen zutage, die Praktikerinnen und Praktiker 
in (Kulturerbe-)Institutionen nicht kurzfristig selbst klären, ändern oder erfül-
len können (z. B. policies, Organisationsmodelle oder Hardwareumgebung). 
Dennoch stehen sie unter Handlungsdruck, um die digitalen Objekte in ihrem 
Veranwortungsbereich nutzbar zu erhalten. Hier setzt das folgende Kapitel an, 
das konkrete Anwendungsfelder der genannten Aspekte (z. B. Formate) in der 
Praxis vorstellt. 
Diese Anwendungsfelder beziehen sich nicht auf Handlungsfelder in Biblio-
theken, Museen, Archiven oder Forschungseinrichtungen (z. B. Publikation), 
sondern auf den Umgang mit den unterschiedlichen Medienarten wie Text, 
Bild und Multimedia in seinen diversen Ausprägungen. Darüberhinaus wer-
den Langzeitarchiverung  und Langzeitverfügbarkeit komplexer digitaler Ma-
15 Anwendungsfelder in der Praxis
PDF to WORD Converter | Convert PDF to Word, Convert Word to PDF
PDF to Word Converter has accurate output, and PDF to Word Converter doesn't need the support of Adobe Acrobat & Microsoft Word.
how to edit and delete text in pdf file online; acrobat remove text from pdf
VB.NET PDF: How to Create Watermark on PDF Document within
create a watermark that consists of text or image (such And with our PDF Watermark Creator, users need no external application plugin, like Adobe Acrobat.
how to delete text from pdf; erase pdf text online
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
15-2
terialsammlungen thematisiert, die über den Medienmix hinaus weitere spezi-
fische Anforderungen stellen, z. B. Websites, wissenschaftliche Rohdaten oder 
Computerspiele.
TIFF to PDF Converter | Convert TIFF to PDF, Convert PDF to TIFF
PDF to TIFF Converter doesn't require other third-party such as Adobe Acrobat. speed for TIFF-PDF Conversion; Able to preserve text and PDF file's vector
how to delete text from pdf reader; how to edit and delete text in pdf file
VB.NET PowerPoint: VB Code to Draw and Create Annotation on PPT
other documents are compatible, including PDF, TIFF, MS free hand, free hand line, rectangle, text, hotspot, hotspot more plug-ins needed like Acrobat or Adobe
how to delete text from pdf with acrobat; how to delete text in a pdf file
[ Version 1.5 ]   15-3
15.1 Textdokumente
Karsten Huth 
Definition
Die Definition des Begriffs Textdokument im Bereich der Langzeitarchivie-
rung bzw. die Antwort auf die Frage: “Was ist ein Textdokument?“, ist nicht 
einfach zu beantworten. Kommen doch zwei Ebenen eines digitalen Objekts 
für eine Definitionsgrundlage in Frage
1
. Auf der konzeptuellen Ebene liegt ein 
Textdokument genau dann vor, wenn das menschliche Auge Text erkennen, 
lesen und interpretieren kann. Diese Anforderung kann auch eine Fotografie, 
bzw. das Bild eines Textes erfüllen. Auf der logischen Ebene eines digitalen 
Objektes, der Ebene der binären Codierung und Decodierung liegt ein Textdo-
kument genau dann vor, wenn innerhalb des Codes auch Textzeichen codiert 
sind und dadurch Gegenstand von Operationen werden (z.B. Kopieren und 
Verschieben, Suchen nach bestimmten Worten und Wortfolgen, Ersetzen von 
bestimmten Zeichenfolgen usw.).
Da ein Archiv seine Archivobjekte generell auf der konzeptuellen Ebene be-
trachten muss, insbesondere da sich die technikabhängige logische Ebene im 
Laufe der Zeit durch Migration grundsätzlich ändert
2
, soll für dieses Kapitel die 
erste Definition zur Anwendung kommen: 
Ein Textdokument liegt genau dann vor, wenn das menschliche Auge Text erkennen, 
lesen und interpretieren kann.
Diese Definition ermöglicht die Verwendung von Dateiformaten zur Spei-
cherung von Bildinformationen ebenso wie die speziell auf Textverarbeitung 
ausgerichteten Formate. Welchen Formattyp ein Archiv zur Speicherung wählt, 
hängt von den wesentlichen Eigenschaften des Archivobjekts ab. Die wesent-
lichen Eigenschaften eines digitalen Archivobjekts müssen vom Archiv bei oder 
bereits vor der Übernahme des Objekts in das Archiv festgelegt werden und 
ergeben sich gemäß den Vorgaben des OAIS größtenteils aus den Ansprüchen 
1  vgl. Funk, Stefan, Kap 9.1 Digitale Objekte
2  vgl. Funk, Stefan, Kap 12.2 Migration
15 Anwendungsfelder in der Praxis
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
15-4
und Möglichkeiten der Archivnutzer.
3
Archivierung von Textdokumenten mit Bildformaten:
Die Archivierung von Textdokumenten in Bildformaten empfiehlt sich ge-
nau dann, wenn der optische Eindruck eines Textdokuments eine der wesent-
lichen Eigenschaften des Archivobjekts ist, welches auf das Genaueste erhal-
ten werden muss. Solche Fälle ergeben sich z.B. bei der Digitalisierung von 
amtlichem Schriftgut, bei der anschließend das Original aus Papier vernichtet 
wird, während man die digitale Fassung archiviert. Da bei diesen Objekten das 
originale Schriftbild sowie von Hand aufgetragene Zeichen (z.B. Anmerkungen, 
Unterschriften und Paraphen) für die dauerhafte korrekte Interpretation des 
Archivobjektes unbedingt erhalten werden müssen, ist die Speicherung als Bild 
der beste Weg. In einem Bildformat sind in der Regel nur Informationen über 
Bildpunkte und ihre jeweiligen Farb- und Helligkeitswerte in einem Raster ver-
zeichnet (Bitmap-Grafik). Diese Formate beinhalten von sich aus keinerlei In-
formationen über den abgebildeten Text. Deshalb kann man in einer solchen 
Datei nicht nach bestimmten Textstellen suchen, Textinhalte herauskopieren 
oder verschieben. Die Unveränderlichkeit der inhaltlichen und optischen Dar-
stellung ist für ein Archiv von Vorteil.
Eine Abhandlung zu möglichen Bildformaten im Archiv befindet sich im Ka-
pitel 15.2 „Bilddokumente“.
4
Bildformate werden in diesem Kapitel nicht wei-
ter thematisiert.
Archivierung von Textdokumenten mit Textformaten:
Die Archivierung von Textdokumenten in Textformaten empfiehlt sich genau 
dann, wenn die Erhaltung der Textinformation des Objektes im Vordergrund 
steht. Bei der Archivierung von Textformaten sind grundsätzliche technische 
Abhängigkeiten zu beachten. 
•  Abhängigkeit 1: der Zeichensatz (Character Set)
3  Consaltative Committee for Space Data Systems (Hrsg.) (2002):
Consaltative Committee for Space Data Systems (Hrsg.) (2002): Reference Model for an Open 
Archive Information Sytem: Blue Book. Washington,DC. Page 3-4
Washington, DC. Page 3-4
4  für eine kurze Übersicht über Bildformate s. Rohde-Enslin, Stefan (2004):
für eine kurze Übersicht über Bildformate s. Rohde-Enslin, Stefan (2004): nestor - Ratgeber 
- Nicht von Dauer: Kleiner Ratgeber für die Bewahrung digitaler Daten in Museen. Berlin: nestor, IfM 
. S. 12ff : urn:nbn:de:0008-20041103017
S. 12ff : urn:nbn:de:0008-20041103017
[ Version 1.5 ]   15-5
Einen Zeichensatz kann man sich als Tabelle vorstellen, in der ein numerischer 
einem Zeicheninhalt zugeordnet wird. Die Maschine nimmt den Wert der Zahl 
und sieht in der Zeichensatztabelle an der entsprechenden Stelle nach, in wel-
ches Zeichen die Zahl decodiert werden muss. Dieser Vorgang hat noch nichts 
mit der Darstellung eines Zeichens auf dem Bildschirm oder beim Druckvor-
gang zu tun.
5
Beispiel: Beim ASCII Zeichencode entspricht der Wert 65 (binär 01000001) 
dem Zeichen „A“. 
•  Abhängigkeit 2: Schriften (Font)
Fonts geben den Zeichen eine Gestallt auf dem Bildschirm oder beim Druck. 
Dem Zeichen eines Zeichensatzes ist innerhalb eines Fonts ein Bild (oder meh-
rere Bilder) zugeordnet. Bekannte Schrifttypen sind z.B. Arial, Times New Ro-
man usw. 
Die korrekte Darstellung eines Textes ergibt sich demnach aus einer Kette 
von Abhängigkeiten. Um ein Textdokument mitsamt dem Schriftbild (d.h. For-
matierungen, Absätze und Font) erhalten zu können, benötigt ein Archiv den 
korrekten Zeichensatz und den korrekten Font. Dies ist ein Problem für den 
dauerhaften Erhalt, denn die meisten Dateiformate, die im Bereich der Text-
verarbeitung verwendet werden, sind von Zeichensätzen und Fonts abhängig, 
die außerhalb der Textdatei gespeichert werden. Insbesondere die Zeichensätze 
sind oft ein Teil des Betriebssystems. Das Textverarbeitungsprogramm leistet 
die Verknüpfung von Code-Zeichen-Schriftzeichen und sorgt für die korrekte 
Darstellung des Textdokuments.
Konsequenzen für das Archiv
Für die langfristige Darstellbarkeit eines Textes muss das Archiv zumindest 
den oder die verwendeten Zeichensätze kennen. Die Informationen über die 
Zeichensätze sollten mit Bezug auf die jeweiligen Dateien in den Metadaten des 
Archivs fest verzeichnet sein.
5  für eine gelungene Einführung in das Gebiet der Zeichensätze s. Constable, Peter (2001):
für eine gelungene Einführung in das Gebiet der Zeichensätze s. Constable, Peter (2001): 
Character set encoding basics. Understandingcharacterset encodingsand legacy encodings.
Understanding character set encodings and legacy encodings. In: Implement-
ing Writing Systems: An introduction. 13.06.2001. <http://scripts.sil.org/IWS-Chapter03>
13.06.2001. <http://scripts.sil.org/IWS-Chapter03> 
(Abrufdatum: 12.12.2007)
15 Anwendungsfelder in der Praxis
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
15-6
Bei Neuzugängen sollte das Archiv Dateiformate wählen, die weit verbreite-
te und standardisierte Character Sets unterstützen. Der älteste (seit 1963) Zei-
chensatz ASCII kann beinahe auf allen Plattformen decodiert und dargestellt 
werden. Leider wurde dieser Zeichensatz allein für den amerikanischen Raum 
entwickelt, so dass er keinerlei Umlaute und kein „ß“ enthält. Damit ist ASCII 
für  deutsche  Textdokumente  nicht  ausreichend.  Für  Archive  besonders  zu 
empfehlen sind Dateiformate, die Unicode
6
, speziell UTF-8 (Unicode encoding 
Form neben UTF-16 und UTF-32) unterstützen. UTF-8 ist auch der empfoh-
lene Zeichensatz für Dokumente im HTML, XML oder SGML-Format. Weit 
verbreitet und für Archive geeignet ist der Zeichensatz „Latin-1, Westeuropä-
isch“ ISO 8859-1, der auch ASCII-Texte darstellen kann.
Die gewissenhafte Dokumentation der verwendeten Zeichensätze sollte ein 
Archiv zumindest vor dem Verlust der reinen Textinformation bewahren. Um 
auch die ursprüngliche optische Form zu erhalten, sollten die technischen In-
formationen über die verwendeten Schriftsätze (Fonts) ebenso vom Archiv in 
den Metadaten nachgewiesen werden. 
Bei bereits bestehenden Beständen an Textdokumenten, sollte mit geeigneten 
technischen Werkzeugen der zugrundeliegende Zeichensatz ermittelt werden. 
Sollte der ermittelte Zeichensatz nicht den oben erwähnten weit verbreiteten 
Standards entsprechen, empfiehlt sich auf lange Sicht wahrscheinlich eine Mig-
ration, vorrausgesetzt die geeigneten technischen Werkzeuge sind im Archiv 
vorhanden.
Besonders geeignete Dateiformate für Archive
Da das Archiv alle Informationen über die verwendeten Zeichensätze und 
Fonts sammeln und erschließen muss, sollten nur Dateiformate verwendet wer-
den, aus denen diese Informationen auch gewonnen werden können. Dies ist 
bei Dateiformaten der Fall, wenn ihr technischer Aufbau öffentlich (entweder 
durch Normung oder Open Source) beschrieben ist. Ein Archiv sollte Textfor-
6  Whistler, Ken/ Davis, Mark/ Freytag, Asmus (2004): Unicode Technical Report #17. Character 
Encoding Model. Revision 5. In: Unicode Technical Reports. 09.09.2004. < http://www.uni-
code.org/reports/tr17/> (Abrufdatum: 12.12.2007)
Documents you may be interested
Documents you may be interested