open pdf from windows form c# : How to delete text in a pdf acrobat application SDK tool html wpf .net online redp52353-part1723

31
Figure 29   Routing ruleset
The Batch rule uses a ProcessChildren() action to capture the preverify value and position of 
each field and to store it as a field-level variable. The preverify position variable is used to 
determine if a field was zoned by the data entry operator. You can use the preverify value to 
capture statistics on the number of fields that a data entry operator changed, but it is not 
available immediately.
The page-level rule called Mark Pages marks pages that can be shown to an operator. The 
first function checks whether the document has been deleted.
Deletion of the document can only happen if a page in the document is not recognized. If the 
page is not recognized, the page is marked with a status of 
deleted
All other Main_Pages are marked with a status of 1, meaning that the data entry operator 
sees every Main_Page in the batch. Many organizations prefer carrying out a visual check on 
every page to make sure that everything is working before exporting the data and the image.
If a document is new to the system, the Vendor field is populated with the value <New> during 
the Lookup ruleset. The Clear field rule erases this text from the field and leaves it blank. It 
also increments a batch variable so that you can have a record of how many new fingerprints 
were in this batch.
The Invoice Type rule defaults the Invoice_Type field to a value of PO. The POLineItemRule 
copies the POLR variable for the PO Number to the text property of the appropriate field.
The Verification process
Several rulesets run under task profiles during the verification process. In verification, task 
profiles can be set up to run automatically or when a data entry operator clicks a button. This 
How to delete text in a pdf acrobat - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
pdf text watermark remover; how to erase text in pdf file
How to delete text in a pdf acrobat - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
delete text pdf; how to delete text from a pdf
32
IBM Datacap Accounts Payable Capture
section highlights the following rulesets that can run under task profiles called by the 
verification process:
 The DynamicDetails ruleset
 The CheckForSticky ruleset
 The AutoCalc ruleset
The DynamicDetails ruleset
The DynamicDetails ruleset is a way to find, at verify time, all of the line item fields in a 
document. You click the line-item subfields of the first detail line on the invoice and click the 
Find Details button. This ruleset sets up the Lineitem and Detail zones automatically. 
The DynamicDetails ruleset runs under the Find Details task profile and is called by the 
FindDetails button on the Verify tab. Figure 30 shows the Find Details task profile.
Figure 30   Find Details task profile
The DynamicDetails ruleset (Figure 31) is identical to the rules that are associated with the 
Detail level and LineItem rules in the Locate ruleset. However, special actions are needed to 
read from a CCO that is loaded dynamically at verify time. The actions function identically to 
their non-dynamic counterparts.
Figure 31   DynamicDetails ruleset
The Clean and Filter rulesets called in the task profile are the same rulesets that are called in 
the Batch Profiler task profile.
The CheckForSticky ruleset
The CheckForSticky ruleset runs in the Sticky task profile as shown in Figure 32 on page 33. 
As explained previously in this paper, you must be familiar with the other rulesets that are 
called in this task profile.
.NET PDF Document Viewing, Annotation, Conversion & Processing
Redact text content, images, whole pages from PDF file. Annotate & Comment. Edit, update, delete PDF annotations from PDF file. Print.
how to remove highlighted text in pdf; acrobat delete text in pdf
C# PDF Converter Library SDK to convert PDF to other file formats
Allow users to convert PDF to Text (TXT) file. can manipulate & convert standard PDF documents in other external third-party dependencies like Adobe Acrobat.
pdf editor online delete text; delete text pdf acrobat professional
33
Figure 32   The Sticky task profile
The Sticky task profile runs automatically from Datacap Desktop when it detects that a new 
fingerprint is being processed and another of the same new fingerprint was processed 
previously in the same batch. For example, a vendor sends in two invoices with a new format. 
The first one creates a fingerprint, and the second one matches that same new fingerprint. At 
verify time, the operator zones the first invoice. When the second invoice is displayed, the 
Sticky task profile copies and adjusts the zones from the first invoice to the second invoice. 
Then, it automatically populates with data.
If you are reading this paper from the beginning, you are familiar with all of the rulesets called 
by Sticky, except for the CheckForSticky ruleset (Figure 33). 
Figure 33   CheckForSticky ruleset
The Sticky variable must be blank when this ruleset is run. The first two functions fail, and the 
CheckForSticky action runs. This action checks whether any previous documents in the batch 
can be used to zone the current document. If there are such documents, this action adjusts 
and copies the zones to the new document. It also sets the Sticky variable to 
Yes
or 
No
depending on what it detected when it analyzed the batch. If the variable is
Yes
, the other 
rulesets in the task profile run, and the data is populated. If the variable is set to 
No
, the other 
rulesets do nothing.
The first two functions of this rule are there in case Sticky is run for a second time for some 
reason. If the Sticky variable is already set to 
Yes
or
No
instead of blank, the CheckForSticky 
rule does not run.
The AutoCalc ruleset
The AutoCalc ruleset (Figure 34) runs in the CalculateBlank task profile. It is called when the 
verify operator clicks a button. Because the Qty, Price, and LineTotal fields are mathematically 
related, this ruleset enters a single missing value if it is detected on a line item.
Figure 34   The CalculateBlank task profile showing the AutoCalc ruleset
The CalculateBank task profile calls a single ruleset to do the analysis and automatic 
correction of a blank Qty, Price, or LineTotal field on a LineItem (Figure 35 on page 34).
C# powerpoint - PowerPoint Conversion & Rendering in C#.NET
documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. PowerPoint to PDF Conversion.
erase text from pdf; how to edit and delete text in pdf file online
C# Word - Word Conversion in C#.NET
Word documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Word to PDF Conversion.
delete text from pdf; delete text pdf acrobat
34
IBM Datacap Accounts Payable Capture
Figure 35   The AutoCalc ruleset
The Character allowed Rule rule is applied to each field to ensure that the values in them are 
normalized to the proper localization. Then, the DetailFix() action is applied to calculate a 
single missing value on each line item.
The Export task profile
The Export task profile consists of five rulesets that are ready for immediate use. However, it 
does not contain rulesets to export the data to your imaging system or to your business 
application system. Because these rulesets are highly variable, the demo writes the data to 
an XML file. You must add additional rulesets to this task profile for a production installation.
Not all of the rulesets in this task profile are used to export data. Many of them prepare the 
data for export. Others handle the disposition of problem documents, such as those 
documents that must be reviewed or rescanned.
The Export task profile includes the rulesets (Figure 36):
 The SetStatuses ruleset
 The PreExport ruleset
 The Export ruleset
 The ExportClose ruleset
 The RoutingNotification ruleset
Figure 36   Export task profile
The SetStatuses ruleset
There are two methods for marking documents for deletion, rescan, and review. The Datacap 
Desktop Verify task does this through user keystrokes and sets statuses on the documents 
and the pages for you. The thin client verify panels rely on a drop-down list in the 
Routing_Instructions
field to mark documents. The SetStatuses ruleset (Figure 37 on 
page 35) consolidates the two methods. This way, at export time, you only have to check the 
statuses or the Routing_Instructions field to determine whether you want to export them or 
send a notification to someone. 
VB.NET PDF: How to Create Watermark on PDF Document within
create a watermark that consists of text or image (such And with our PDF Watermark Creator, users need no external application plugin, like Adobe Acrobat.
how to delete text from pdf reader; delete text from pdf file
C# Windows Viewer - Image and Document Conversion & Rendering in
standard image and document in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Convert to PDF.
erase pdf text; how to delete text in pdf document
35
Figure 37   The SetStatuses ruleset
The first rule, Check Routing_Instructions, runs on the Routing_Instructions field. It looks at 
any value other than the default value of 
None
and sets the statuses on the page and 
document accordingly.
The second rule runs at page level and checks the current page status that a thick verify client 
might have set. If the current page status is set, the rulesets the Routing_Instructions field to 
the appropriate value.
Because of this ruleset, you only need to check one of the methods for marking documents 
for special handling with the rest of the Export ruleset.
The PreExport ruleset
The PreExport ruleset is a catch-all for everything that needs to be done before exporting the 
documents and images. It is also where you can find 
Intellocate
, one of the most important 
features of learning applications.
Intellocate is the technique that allows Datacap applications to “learn”. Documents that have 
never before been processed by the system are added to the fingerprint library. Locate rules 
are then used to attempt to find some of the data from these documents by using keyword 
searches or regular expressions. However, data that cannot be found automatically can be 
identified and captured quickly and easily by a verify operator by using the Click N Key 
capability. 
After this task is done, Intellocate saves the zones for the fingerprint. Then, the next time a 
similar document is encountered, the fingerprint is matched, and all of the data is read by the 
zones.
Figure 38 on page 36 shows the non-Intellocate rules that are associated with the PreExport 
ruleset.
C# Excel - Excel Conversion & Rendering in C#.NET
Excel documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Excel to PDF Conversion.
how to delete text from a pdf reader; pdf editor delete text
VB.NET PowerPoint: VB Code to Draw and Create Annotation on PPT
other documents are compatible, including PDF, TIFF, MS free hand, free hand line, rectangle, text, hotspot, hotspot more plug-ins needed like Acrobat or Adobe
remove text from pdf; delete text pdf file
36
IBM Datacap Accounts Payable Capture
Figure 38   Non-Intellocate rules in the PreExport ruleset
The document-level rule uses the Nuance recognition engine to make a text searchable PDF. 
This PDF is stored in the batch directory and is named with the DocumentID property and a 
.pdf extension.
The empty currency rule attaches to each field that contains currency and defaults the value 
to 0.00 if the field is blank. This rule might need to be changed to 0,00 if a comma is used as 
a decimal value in the system to which you are exporting.
The Prep Vendor Field for XML Syntax rule checks the vendor field for an apostrophe (‘) or an 
ampersand (&) and replaces those characters with the XML equivalents to those characters. 
The PO LineNum rule ensures that the PO LineNumber field is populated with data from a 
POLR lookup.
The Intellocate ruleset makes up the bulk of the processing in the PreExport task profile. 
Figure 39 on page 37 shows the first part of the ruleset, Page Rule - Intellocate rule. The rule 
runs on the Main_Page object.
37
Figure 39   First part of the Intellocate ruleset
The first two functions control what happens if a data entry operator adds a new fingerprint 
based on the current image. Normally this is only done if there is a fingerprint mismatch. 
However, sometimes data entry operators mistakenly add a fingerprint when the fingerprint is 
already in the 
<New>
classification, which is created anyway. 
For the first function to complete successfully, the operator must choose NewFingerprint 
when it is presented to them. The fingerprint is in <New> to correct a misunderstanding that 
some operators have. If the fingerprint is in <New>, Intellocate saves the zones for the 
fingerprint. We do not want to create an additional new fingerprint. If this happens, the 
SetFingerprint action classifies the fingerprint (moves it out of the <New> classification) into a 
classification that matches the Vendor name. The iloc_SetZones sets the header fields, and 
the iloc_SetDetailSimple sets the zones of the detail fields.
Important: These actions write the zones to the Setup DCO. If you want to use FPXML, 
unhook this rule from the page and replace it with the unattached rule in this ruleset for 
FPXML.
38
IBM Datacap Accounts Payable Capture
In its essence, Intellocate is done with three actions: SetFingerprint, which moves the 
fingerprint out of <New> and classifies it, and the two iloc actions that save the zones. The 
rest of these actions ensure that these actions need to be done.
The second function runs if the data entry operator clicked the NewFingerprint button 
correctly this time because the document matched an existing fingerprint erroneously. When 
this happens, we want to dynamically create a fingerprint in the library from the existing 
image, run Intellocate on it to classify it, and save the zones. 
Because the page might have a multi-CCO (MCCO), we re-recognize the page to ensure that 
it creates a single page CCO for the first page. We also indicate where to store the new 
fingerprint that it creates. We use CreateFingerprint to create the fingerprint before we use 
Intellocate.
The DCO Status 75 function handles deleted documents. If an operator indicates that a 
document does not belong in the system, we want to delete any fingerprint that it created. 
This function can return a value of 
false
if the fingerprint was somehow already deleted. 
Therefore, the trailing function checks this value and returns 
true
so that the rule does not 
continue.
The same process is done for rotated documents. You do not want to store inverted 
fingerprints. Therefore, this function deletes them.
If a fingerprint remains in <New> after these functions have checked for special processing, 
the New Fingerprint function runs (Figure 40).
Figure 40   Remaining part of the Intellocate rule
As you can see, this process takes any fingerprint that is still in <New>, automatically 
classifies it, and saves the zones.
If a fingerprint is not in <New>, the LearnZones action examines the PreVerify Position 
variable that was created in the Routing ruleset and the current position of the field in the 
runtime DCO. If the PreVerify Position was 0,0,0,0 and the operator provided a zone for the 
data, the position of that field is added to the other fingerprint positions.
The Export ruleset
When you demo Accounts Payable Capture, you might not have access to a business 
application system or an imaging system. Therefore, for demo purposes, we write out a 
standard text file with XML tags. Because this ruleset is not commonly used for production, it 
is not explained here. This file writes the text searchable PDF documents and data in XML 
format in the APT\Export directory.
The ExportClose ruleset
The ExportClose ruleset (Figure 41 on page 39) writes the XML tags to complete the XML file 
and closes the file. This ruleset is not used in production.
39
However, you might want to add the SetFPStats() action in the ExportClose ruleset to your 
own custom export. This action returns the number of times, as well as the most recent time, 
that a particular fingerprint was used. This information helps you manage the fingerprint 
library, so you can remove fingerprints that are no longer in use.
Figure 41   UpdateFPStats action that must be in your export
The RoutingNotification ruleset
The RoutingNotification ruleset is also altered for production. This ruleset must be in place if 
you want to notify someone that the batch had documents in it that could not be processed 
(Deleted, Rescan, or Review).
Figure 42 shows the RoutingNotification ruleset.
Figure 42   RoutingNotification ruleset
The first function checks the Routing_Instructions field. If it is not set to 
None
, it fails. The 
failed document is then processed by SendOutlookNotification, which sends an email to a 
person specified in the settings.ini file and attaches the multipage PDF file. 
The reason this action is not used in production is that it requires Microsoft Outlook to be set 
up on the background machines. The version of Microsoft Outlook must support sending 
email messages programmatically, but not all versions do. You might need to replace this 
action with another email action to send the documents. Alternatively, develop another 
method of informing someone of problem documents, for example using an entry in a 
database that is polled or, which triggers an alert of some sort.
Authors
This paper was produced by a specialist working at the International Technical Support 
Organization, San Jose Center.
Jan den Hartog is an Enterprise Content Management Technical Sales Specialist in the 
United States. Jan has over 18 years experience in product management, technical pre-sales, 
system integration, single-source publishing, and document transformation and migration. His 
experience, together with time spent in a support role, has taught him how to explain complex 
technical concepts in a clear and understandable manner. 
40
IBM Datacap Accounts Payable Capture
Tom Stuart is the IBM Executive Enterprise Content Manager Capture Alchemist and is part 
of the IBM North America Software Advanced Technology (SWAT) team. He is responsible for 
developing easy-to-replicate techniques that help customers rapidly deploy complex data 
capture applications, most of which are integrated with other business applications. Tom is 
also closely involved with refining prototype solutions and has the application developer 
responsible for IBM Datacap Taskmaster Accounts Payable Capture and the IBM Datacap 
product Taskmaster Flex. He previously directed the pre-sales engineering activities of 
Datacap. Tom has a dual background in education and product development. He is widely 
quoted on technical issues and frequently addresses industry conferences.
Thanks to the following people for their contributions to this project:
Whei-Jen Chen
LindaMay Patterson
International Technical Support Organization, San Jose Center
Now you can become a published author, too!
Here’s an opportunity to spotlight your skills, grow your career, and become a published 
author—all at the same time! Join an ITSO residency project and help write a book in your 
area of expertise, while honing your experience using leading-edge technologies. Your efforts 
will help to increase product acceptance and customer satisfaction, as you expand your 
network of technical contacts and relationships. Residencies run from two to six weeks in 
length, and you can participate either in person or as a remote resident working from your 
home base. 
Find out more about the residency program, browse the residency index, and apply online at:
ibm.com/redbooks/residencies.html
Stay connected to IBM Redbooks
 Find us on Facebook:
http://www.facebook.com/IBMRedbooks
 Follow us on Twitter:
https://twitter.com/ibmredbooks
 Look for us on LinkedIn:
http://www.linkedin.com/groups?home=&gid=2130806
 Explore new IBM Redbooks® publications, residencies, and workshops with the IBM 
Redbooks weekly newsletter:
https://www.redbooks.ibm.com/Redbooks.nsf/subscribe?OpenForm
 Stay current on recent Redbooks publications with RSS Feeds:
http://www.redbooks.ibm.com/rss.html
Documents you may be interested
Documents you may be interested