pdf reader library c# : How to delete text from pdf document Library control component .net web page wpf mvc nestor-handbuch26-part925

[ Version 1.5 ]   14-1
14 Technischer Workflow
Reinhard Altenhöner
14.1 Einführende Bemerkungen und Begriffsklärungen
Immer dann, wenn Termini und Methoden zur Beschreibung und zur Model-
lierung von Abläufen aus einem anderen Umfeld in den Kontext eines spezi-
fischen Themas oder spezialisierter Abläufe eingeführt werden, entsteht Bedarf 
für einen der eigentlichen Beschäftigung mit dem Gegenstand vorgehende Defi-
nitions- und Klärungsschritt. Konkret: Die Langzeitarchivierung als relativ neu-
em Arbeitsgebiet, in dem bislang der Schwerpunkt stark auf forschungsnahen 
oder gar experimentellen Ansätzen lag, wird beim Übergang zu produktiven 
Systemen  und  operativen  Ablaufproblemen  mit  neuen  Aufgabenstellungen 
konfrontiert: Jetzt geht es um umfassende Arbeitsabläufe, um die massenhafte 
Prozessierung von (automatisierten) Arbeitsschritten und es scheint sinnvoll, 
hier auf das Erfahrungswissen und die Methodik aus anderen Arbeitsereichen 
und Geschäftsfeldern zurückzugreifen. 
14 Technischer Workflow
How to delete text from pdf document - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
remove text from pdf preview; how to erase in pdf text
How to delete text from pdf document - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
online pdf editor to delete text; delete text from pdf preview
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
14-2
Und da der Bewusstheitsgrad, mit dem Arbeitsprozesse  im kommerziellen 
Kontext – oft über aufwändige Beratungsdienste durch einschlägige Anbieter 
- organisatorisch und technisch modelliert werden, sehr hoch ist, lohnt es sich, 
zunächst auf das methodische und begriffliche Umfeld einzugehen, aus dem 
heraus die Terminologie rund um „Workflow“ entstanden ist. Das gilt sicher 
generell für das Thema (technische) Prozessorganisation, um so mehr aber für 
das Arbeitsfeld der Langzeitarchierung, das insbesondere in Bibliotheken, Ar-
chiven und Museen zunehmend bedeutender wird, das aber bislang bis auf 
wenige Ausnahmen noch nicht in größerem Umfang etabliert und in die all-
gemeinen Arbeitsabläufe generell integriert ist. Es folgen daher hier zunächst 
einige einführende Begriffsklärungen, die dann im nächsten Schritt dann für 
die konkrete Thematik Langzeitarchivierung methodisch/konzeptionell aufge-
griffen werden, um schließlich in einem weiteren Schritt den bislang erreichten 
Praxisstand an einigen Beispielen etwas eingehender zu betrachten. Ergänzend 
noch der Hinweis, dass in diesem Handbuch zwischen dem organisatorischen 
und dem technischen Workflow differenziert wird. 
Der Begriff des Workflow wird im Deutschen im Allgemeinen mit dem Begriff 
des  Geschäftsprozesses  gleichgesetzt.  Aus  der  abstrahierende  Beschreibung 
von Einzelfällen entsteht die Basis dafür, Abläufe systematisch als Arbeits- oder 
Geschäftsprozess zu beschreiben und zum Beispiel daraus Schulungsmaterial 
zu generieren, aber auch Schwachstellen zu identifizieren oder neue Fallgrup-
pen zu integrieren. Mit der darunter liegenden Ebene der Arbeitsschritte – der 
Arbeitsprozess (work process) ist als eine geordnete Folge von Arbeitsschritten 
definiert - wird bereits ein relativ hoher Detaillierungsgrad erreicht, der es er-
laubt, Abläufe differenziert zu verstehen. 
Mit Hilfe einer regelbasierten Beschreibung der Abläufe ergibt sich aber auch 
die Möglichkeit, Geschäftsprozesse zu planen, bewusst in systematischer Weise 
einzugreifen, Teile oder ganze Abläufe neu zu modellieren, also die Abläufe 
zu steuern, zu „managen“. In diesen Prozessen werden Dokumente, Informa-
tionen oder auch Aufgaben von einem Teilnehmer zum anderen gereicht, die 
dann nach prozeduralen Regeln bearbeitet werden. In klassischer Definition 
wird der Workflow übrigens mit der teilweisen oder vollständigen Automatisie-
rung eines Geschäftsprozesses gleich gesetzt.
1
1  Martin (1999), S. 2.
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
VB.NET PDF - How to Delete PDF Document Page in VB.NET. Visual Basic Sample Codes to Delete PDF Document Page in VB.NET Class. Free
remove text from pdf; remove text from pdf preview
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
C#.NET PDF Library - Delete PDF Document Page in C#.NET. Provide C# Users in C#.NET. How to delete a single page from a PDF document.
pdf editor delete text; erase text from pdf
[ Version 1.5 ]   14-3
Enger auf den Bereich der öffentlichen Verwaltung bezogen und so auch in 
Bibliotheken gebraucht ist der Begriff des Geschäftsgangs, hier häufig festge-
macht am Bearbeitungsobjekt, in der Regel Büchern oder auch Akten und dem 
Weg dieser Objekte durch die einzelnen Phasen seiner Bearbeitung. Gemeint ist 
hier – trotz der verwaltungstypischen Fokussierung auf die bearbeiteten Ob-
jekte – der Arbeitsablauf/Geschäftsprozess als Gesamtheit aller Tätigkeiten zur 
Erzeugung eines Produktes bzw. zur Erstellung einer Dienstleistung.
2
Das Workflow-System bezeichnet dagegen die IT-gestützte integrierte Vor-
gangsbearbeitung, in der Datenbank, Dokumentenmanagement und Prozes-
sorganisation  in  einem  Gesamtkonzept  abgebildet  werden.
3
Diese  Abläufe 
werden also technisch unterstützt, wenn nicht sogar überhaupt mit Hilfe tech-
nischer Werkzeuge und Methoden betrieben. Aber auch die Modellierung von 
Geschäftsprozessen selbst kann toolunterstützt erfolgen, solche Geschäftspro-
zeßmanagement-Tools dienen der Modellierung, Analyse, Simulation und Op-
timierung von Prozessen. Die entsprechenden Applikationen unterstützen in 
der Regel eine oder mehrere Methodiken, ihr Funktionsspektrum reicht von 
der Ist-Aufnahme bis zur Weitergabe der Daten an ein Workflow-Management-
System. Im Mittelpunkt stehen dabei Organisation, Aufgaben bzw. Ablauf der 
Aufgaben und die zugrundeliegenden Datenmodelle. Mit der Schnittstelle sol-
cher Tools zum Beispiel zu Workflow-Management-Systemen beschäftigt sich 
die Workflow-Management-Coalition
4
, die sich insbesondere die Austauschbar-
keit der Daten und damit die Interoperabilität zwischen unterschiedlichen, zum 
Teil spezialisierten Tools durch entsprechende Standardisierungsanstrengungen 
auf die Fahnen geschrieben hat. 
Der Begriff des technischen Workflows schließlich wird im Allgemeinen pri-
mär für die Abläufe verwandt, die einen hohen Automatisierungsgrad bereits 
haben oder wenigstens das Potential dazu. Entsprechend bezeichnet man mit 
dem Begriff des Technischen Workflow-Management die Systeme, die durch 
eine geringe Involviertheit von Menschen und eine hohe Wiederholbarkeit bei 
geringen Fehlerquoten gekennzeichnet sind. 
2  Verwaltungslexikon (2008), Eintrag Workflow. Damit der englischen Ausgangsbedeutung 
des Begriffs folgend.
3  Verwaltungslexikon (2008), aaO.
4  http://www.wfmc.org/
14 Technischer Workflow
C# PDF Text Extract Library: extract text content from PDF file in
Free online source code for extracting text from adobe PDF document in C#.NET class. Ability to extract highlighted text out of PDF document.
delete text pdf files; how to erase text in pdf file
VB.NET PDF Text Extract Library: extract text content from PDF
SharePoint. Extract text from adobe PDF document in VB.NET Programming. Extract file. Extract highlighted text out of PDF document. Image
how to remove text watermark from pdf; remove text from pdf reader
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
14-4
Damit ist klar, dass der Begriff des technischen Workflow im Kontext der 
Langzeitarchivierung geradezu programmatischen Charakter hat, da angesichts 
der großen Objektmengen und ihrer prinzipiell gegebenen Eigenschaften als 
digitale Publikation, ein hoher Automatisierungsgrad besonders bedeutsam ist. 
C# PDF insert text Library: insert text into PDF content in C#.net
C#.NET PDF SDK - Insert Text to PDF Document in C#.NET. This C# coding example describes how to add a single text character to PDF document. // Open a document.
how to delete text in pdf file online; how to erase text in pdf online
C# PDF metadata Library: add, remove, update PDF metadata in C#.
C#.NET PDF SDK - Edit PDF Document Metadata in C#.NET. Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata in .NET Project.
how to delete text from a pdf reader; how to delete text in a pdf acrobat
[ Version 1.5 ]   14-5
14.2 Workflow in der Langzeitarchivierung: Methode und 
Herangehensweise
Die  allmähliche Einführung  der  Langzeitarchivierung in das  reguläre Auf-
tragsportfolio von Bibliotheken und anderen Kulturerbeeinrichtungen mit im-
mer höheren Bindungsquoten von Personal und anderen Ressourcen erzeugt(e) 
zunächst neue, häufig isolierte und händisch durchgeführte Abläufe, verändert 
aber auch in einer ganzheitlichen Betrachtung Arbeitsabläufe und die sie model-
lierenden Geschäftsprozesse. So ist schon für sich die Einspielung von Daten 
in ein Langzeitarchiv ein komplexer Vorgang, in dem eine ganze Reihe von 
auf einander bezogenen bzw. von einander abhängenden Aktivitäten ablaufen. 
Vor allem aber die zunehmende Relevanz der technischen und operativen Be-
wältigung der Aufgabe verlangt nach einer systematischen Modellierung der 
Geschäftsprozesse, also dem Einstieg in ein systematisches Workflowmanage-
ment. Es gilt allerdings festzustellen, dass selbst in Einrichtungen, die bereits 
seit einigen Jahren Erfahrungen mit dem Betrieb von Langzeitarchiven und 
ihrer Integration in  die jeweilige Systemlandschaft gesammelt haben, häufig 
noch isolierte Bearbeitungsketten ablaufen, die zudem keinesfalls wirklichen 
Vollständigkeitsgrad haben, also  alle  Anforderungs- /arbeitsfelder abdecken 
und außerdem vielfach noch manuelle Eingriffe erfordern, insbesondere auf 
dem Gebiet des Fehlermanagements. 
Diese Feststellung bedeutet aber auch, dass der Erfahrungshorizont zum tech-
nischen Workflow insgesamt noch relativ gering ist, also hier noch konkrete 
Erfahrungen vor allem im Umgang mit großen Mengen und insbesondere auch 
im automatisierten Qualitätsmanagement gewonnen werden müssen. Insofern 
hat die Beschäftigung mit dem technischen Workflow derzeit noch viele theore-
tische Elemente und hat propädeutischen Charakter. 
Vor allem in einer Situation, in der verschiedene (bereits existente und neu ent-
wickelte) Arbeitsprozesse ineinander greifen und auch verschiedene Organisati-
onseinheiten an ein und demselben Vorgang beteiligt sind, ist die Modellbildung 
ein Beitrag zur umfassenden Optimierung. Damit befinden sich Bibliotheken, 
Archive und Museen in einer Situation, die man mit den Anstrengungen der 
Privatwirtschaft Anfang der 1990er Jahre vergleichen kann, als dort die Model-
lierung von Geschäftsprozessen unter verschärften Wettbewerbs- und Kosten-
14 Technischer Workflow
C# PDF Text Search Library: search text inside PDF file in C#.net
C#.NET. C# Guide about How to Search Text in PDF Document and Obtain Text Content and Location Information with .NET PDF Control.
how to delete text in pdf preview; pdf text watermark remover
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
All text content of target PDF document can be copied and pasted to .txt files by keeping original layout. C#.NET class source code
pull text out of pdf; pdf editor online delete text
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
14-6
druckbedingungen systematischer als zuvor angegangen wurde. Auch wenn im 
öffentlich finanzierten Umfeld in besonderem Maße historisch geprägte Orga-
nisationsformen gegeben sind, die eine vorgangsbezogene Sicht erschweren, 
führt an der grundsätzlichen Anforderung der Neu-Modellierung aus systema-
tischer Sicht kein Weg vorbei. Diese wird im Umfeld des technischen Work-
flow  immer  stark  auch  von der informationstechnischen  Entwicklungsseite 
getrieben sein, denn Ziel der Geschäftsprozessmodellierung ist ihre technische 
Abbildung.
Übergeordnete Ziele dieses Herangehens, also der systematischen Modellie-
rung und eines methodenbewussten Workflowmanagements sind:
•  Verbesserung der Prozessqualität 
•  Vereinheitlichung der Prozesse
•  schnellere und zuverlässigere Bearbeitung von Aufträgen (extern und 
intern) 
•  Reduzierung der Durchlaufzeiten
•  Kostenreduktion 
•  Verbesserte Verfügbarkeit von Information / Dokumentation
•  Erhöhte Prozessflexibilität 
•  Erhöhung der Transparenz der Prozesse (Statusermittlung, Dokumenta-
tion von Entscheidungen), Qualitätssicherung 
•  Automatische Eingriffsmöglichkeiten: Dokumentation, Eskalation bei Zei-
tüberschreitungen, Verteilung von Aufgaben und Verantwortlichkeiten
•  Vermeidung von Redundanz, mangelnder Aktualität und Inkonsistenz 
durch Mehrfachschritte
Natürlich  lassen  sich kleine isolierte Prozesse oder  Prozesselemente durch 
individuelle Programmierung jeweils neu umsetzen. Dies geschah in der Ver-
gangenheit vielfach für einzelne Objektklassen oder auch einzelne Datenüber-
gabe- oder –tauschprozesse. Aber schon beim Zusammenführen bzw. Hinter-
einandersetzen der einzelnen Teilschritte bedarf es einer Gesamtlogik für das 
Management des Ablaufs dieser Schritte. Fehlt diese Logik, verbleiben letztlich 
viele immer wieder manuelle neu anzustoßende Teilkonstrukte mit dazu häufig 
proprietären „Konstruktions“elementen. Schon insofern ist die systematische 
Analyse verschiedener wiederkehrender Arbeitsabläufe ein sinnvoller Ansatz, 
[ Version 1.5 ]   14-7
um so zur Modellierung auch komplexer Vorgänge aus dem Bereich der Lang-
zeitarchivierung zu kommen.
Erst auf dieser Basis wird es möglich, Services zu definieren, die wieder ver-
wendbar sind, weil sie Arbeitsschritte abbilden, die in verschiedenen Umfeldern 
vorkommen, beispielsweise das Aufmachen eines Bearbeitungsfalls für ein Ob-
jekt und die IT-gestützte Verwaltung verschiedener Be-/Verarbeitungsschritte 
dieses Objekts. In dieser Perspektive entsteht der Geschäftsprozess für eine 
Klasse von Objekten aus der Zusammenfügung verschiedener Basisservices, 
die miteinander interoperabel sind. Das diese Herangehensweise sehr stark mit 
dem Modell der Serviceorientierten Architektur (SOA) bei der Entwicklung IT-
basierter Lösungen korrespondiert, ist dabei kein Zufall. Voraussetzung dafür 
ist aber wie angesprochen die Modellierung der Arbeits- oder Geschäftspro-
zesse, die vorgeben, welche Services wann und wie gebraucht werden. Die Pro-
zessmodellierung bildet also die Basis für die Implementierung, die Prozesse 
selbst dienen der Orchestrierung, dem Zusammenspiel und der Aufeinander-
einstimmung der Services. In einem optimalen (Infrastruktur)Umfeld können 
so die Arbeitsschritte als kleinere Einheit eines Geschäftsprozesses verschie-
dene Services lose zusammenbringen.
Die Informatik hat für die Modellierung und Notation von Geschäftsprozes-
sen  verschiedene methodische  Herangehensweisen  entwickelt,  zum  Beispiel 
die Ereignisgesteuerten Prozessketen (EPK), eine von Scheer und Mitarbei-
tern entwickelte Sprache zur Modellierung von Geschäftsprozessen
5
und vor 
allem die Unified Modeling Language (UML) der Object Management Group 
(OMG), die in der Praxis heute dominierende Modellierungssprache für die 
Modellierung von Daten, Verhalten, Interaktion und Aktivitäten.
6
Zur  vorbereitenden  Modellierung von  technischen Abläufen in  der  Lang-
zeitarchivierung wird man sich zunächst am OAIS-Modell orientieren, das die 
prinzipiellen  Aufgaben  im  Umfeld  der Langzeitarchivierung  in funktionaler 
Perspektive beschreibt und an anderer Stelle dieser Enzyklopädie ausführlich 
beschrieben wird.
7
5  Keller (1992)
6  OMG Infrastructure (2007) und OMG Superstructure (2007)
7  Hier Link auf den entsprechenden Artikel ???
14 Technischer Workflow
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
14-8
Einzelne Funktionen lassen sich so vor der Folie bisher bereits gemachter Er-
fahrungen allgemein beschreiben. Beispiele für diese übergreifenden Basispro-
zesse sind (ich nenne nur Beispiele für unmittelbar aus dem Kontext der Lang-
zeitarchivierung heraus relevante Prozesse):
•  Plattform- und Systemübergreifendes Taskmanagement 
•  Daten- und Objekttransfer-Mimik (z.B. OAI, ORE)
•  Extraktion und Generierung von Metadaten (METS, LMER) 
•  Validierung von Dokumentformaten (z.B. JHOVE)
•  Persistente Adressierung und Zugriffsmanagement auf Objektebene
•  Speicherprozesse
•  ID-Management
•  Inhaltsauswahl / Basisrecherche
•  Migrationsprozesse / Formatkonvertierungen
•  On-the-fly-Generierung einer Bereitstellungsumgebung 
[ Version 1.5 ]   14-9
14.3  Technisches  Workflowmanagement  in  der  Praxis: 
Erfahrungen und Ergebnisse
Insgesamt ist wie dargelegt der Umfang praktischer Erfahrungen noch be-
grenzt. Wichtige Erkenntnisse konnte sowohl in der technischen Workflow-
entwicklung als auch in der praktischen Umsetzung die niederländische Natio-
nalbibliothek sammeln, doch auch die Deutschen Nationalbibliothek, die nach 
einer Gesetzesnovelle Mitte des Jahres 2006 die Zuständigkeit für die Erhaltung 
der Langzeitverfügbarkeit deutscher Online – oder Netzpublikationen erhalten 
hat, steht vor sehr konkreten Herausforderungen, die derzeit zu einer umfas-
senden Reorganisation des technischen Workflow führen.
8
Mit dem Inkraft-
treten des neuen Gesetzes und der damit verbundenen deutlich erweiterten 
Verpflichtung, die Aufgabe der Langzeitarchivierung zu erfüllen, stellt sich hier 
die Frage in einer neuen Dimension: Wie wird die Bibliothek die neuen Abläu-
fe organisieren, welche technischen Methoden und Anwendungen werden im 
Massenverfahren eingesetzt? Da gleichzeitig die alten Arbeitsabläufe und –ver-
fahren weiterlaufen, stellt sich die Frage der Integration in ganz anderer Weise. 
Zwar ist die Bibliothek in der glücklichen Situation, für die neuen Aufgaben zu-
sätzliche Ressourcen erhalten zu haben, doch würden diese nicht eine nahtlose 
Imitation des organisatorisch-operativen Workflows auf Basis der existierenden 
Systeme abdecken – das ergibt sich schon aus den Mengen, um die es geht.
Königliche Bibliothek der Niederlande (KB): Die KB betreibt seit dem Jahr 
2003 das OAIS-kompatibles Archivierungssystem DIAS der Firma IBM ope-
rativ und hat im Laufe der gewonnenen Erfahrungen insbesondere organisa-
torisch eine ganze Reihe von Anpassungen unternommen.
9
Technisch gese-
hen wurde eine auch in der KB weitgehend isolierte gesonderte Entwicklung 
aufgesetzt, die über eine nur geringe Anbindung an die sonstigen Abläufe der 
Bibliothek bietet. Schwerpunkt liegt auf dem Ingest-Prozess, also dem Einspie-
len des in der Regel von Verlagen bereitgestellten publizierten Materials in das 
Archiv. Dieses erfolgt weitgehend automatisiert und es ist der Niederländischen 
Nationalbibliothek sehr schnell gelungen, die Fehlerquoten auf minimale Pro-
zentbereiche zu drücken. Inzwischen sind mehr als zehn Millionen Objekte 
8  Es sei angemerkt, dass es eine ganze Reihe von weiteren Publikationen zum Thema gibt. So 
stellte etwa Clifton (2005) Worksflows der australischen Nationalbibliothek vor; diese bezie-
hen sich allerdings auf die manuelle Behandlung von Objekten mittels einzelner Tools.
9  KB (2008)
14 Technischer Workflow
nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung
14-10
eingespielt, darunter auch einige komplexe Objekte wie historische CD-ROMs. 
Für alle Objekte – es handelt sich in der weit überwiegenden Zahl um PDF-Da-
teien – gilt, dass in der eigentlichen Langzeitarchivumgebung rudimentäre Me-
tadateninformationen gespeichert sind; die bibliographischen Informationen 
werden über ein Recherchesystem der KB zur Verfügung gestellt. 
Insgesamt ist es der KB gelungen, den technischen Workflow relativ unkom-
pliziert und damit effizient und für hohe Durchsatzmengen geeignet zu halten. 
Dies war auch deswegen möglich, weil die Zahl der Lieferanten in das System 
in den Niederlanden klein ist, da wenige große Verlage bereits einen überwie-
genden Anteil am Publikationsvolumen der Niederlande haben.
In Deutschland stellt sich die Situation anders dar: Hier bestimmen viele in 
einer zum Teil noch sehr traditionell geprägten Veröffentlichungslandschaft 
Verleger  das Bild.  Ausgangspunkt  für die  Deutsche  Nationalbibliothek  war 
eine Situation, in der für die Verarbeitung von Online-Dokumenten bereits eine 
Vielzahl von mehr oder weniger halbautomatische Verfahren für für Netzpu-
blikationen,  Online-Dissertationen  und  weitere Materialien existierte.  Diese 
historisch gewachsenen Strukturen standen nebeneinander, d.h. – nicht unty-
pisch für Gedächtnisorganisationen im öffentlichen Kontext – die einzelne Ob-
jektklasse war der definitorische Ausgangspunkt für einen hochspezialisierten 
Workflow. Ziel war und ist daher die Schaffung eines automatischen, einheit-
lichen Verfahrens mit der Übergabe der Archivobjekte an das im Rahmen des 
Projekts kopal entstandene Archivsystem und die dort entstandenen Verfah-
ren.
10
Sowohl Ingest wie auch der Zugriff auf die Objekte sehen die Übergabe 
aus der Langzeitarchivlösung kopal am Arbeitsplatzrechner vor oder an das 
neu entstehende Bereitstellungssystem. Dabei sind zahlreiche Arbeitsbereiche 
in der DNB involviert: neben dem bibliographischen System sind dies die Fach-
bereiche, externe Ablieferer, aber auch die für die digitalen Dienste der DNB 
Verantwortlichen. Insofern ist hier vieles noch offen und ein Werkstattbericht 
mag dies illustrieren:
11
Für den Transfer und das Angebot von Objekten auf elektronischen Materi-
alien auf physischen Datenträgern (d.h. CD- bzw. DVD-Veröffentlichungen) 
10  kopal (2008)
11  Wollschläger (2007), S. 18ff.
Documents you may be interested
Documents you may be interested