opening pdf file in asp.net c# : Delete text pdf acrobat SDK control service wpf web page .net dnn Kofax_Administrators_Guide_v1012-part442

The Administration Module
Kofax Capture Administrator's Guide
121
Page recognition cannot be used to separate eDocuments. In this case, eDocuments are passed
through as if they were blank pages. Image files are separated correctly.
Kofax Capture Export Library
When the Export module detects an eDocument, it sends that document straight to the export
destination without alteration. In the case of a multipage image file, eDocuments are saved in
a subfolder. Doing this helps organize the files in an easily accessible structure.
PDF Support
Kofax Capture can import PDF files as either eDocuments, or as .tif image files.
Batch Classes Import and Export - An Overview
Kofax Capture allows you to import and/or export your batch classes. This makes your batch
classes portable, and allows you to share batch classes with other sites.
When you export a batch class, all the elements configured for one or more batch classes
(such as field types, document classes, batch properties, sample pages, scripts, and more) are
compressed into a .cab file (Microsoft cabinet file). You can send the .cab file to another site,
where it can be imported into that system.
Importing a Batch Class
1 From the Administration module, on the Home tab, in the Batch Class group, click
Import.
The Open window appears.
2 Browse to the folder where your .cab files are located.
(Batch classes are exported as .cab files.)
3 Select a .cab file and click Open.
The Import/Export window appears. As soon as the Import/Export window appears,
the .cab file is unpacked and prepared for import. The results of this process appear
in the Unpacking results area on the window. When done, the “Unpacking done.
Complete” message appears.
4
When the message “Unpacking done. Complete” appears, click OK.
The Import window appears.
5 On the Import window, select the batch classes to import from the list of Available Batch
Classes. Click the Add button to add them to the list of Selected Batch Classes.
The list contains all the batch classes that were exported into the .cab file you unpacked.
6 Select a Transfer Mode. You can choose one of the following:
▪ Do not import duplicates: Does not overwrite duplicate batch class settings.
▪ Save duplicates to new name: Saves duplicate batch class settings to a new name.
▪ Replace duplicates with items imported: Overwrites duplicate batch class elements
(such as index fields) with the ones you are importing.
7 Click Import.
Once the batch class is imported, it cannot be used until you publish it. In addition, you
may need to recompile any custom scripts associated with the batch class.
The Import/Export window lists the import results.
Delete text pdf acrobat - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
how to edit and delete text in pdf file; how to edit and delete text in pdf file online
Delete text pdf acrobat - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
pdf text remover; delete text from pdf acrobat
The Administration Module
122
Kofax Capture Administrator's Guide
Importing Batch Classes that Export Index Data to a Database: In some cases, you may need
to set up your export connectors again after you import batch classes. Consider this scenario:
You import a batch class that was set up at another site. The export connector for the batch
class uses field IDs to reference a back-end database, and the field IDs match the ones for the
database at the other site. If the field IDs in your database do not match the field IDs from
the other site, you are not able to export the index data. For this case, you do not get errors or
warnings when you publish the imported batch class. However, you do get errors at export
time. As a workaround, you should run a test batch through to export after you publish your
imported batch classes. If problems occur at export time, set up the export connector again
and republish the batch class.
Partial Batch Export - An Overview
The Partial Batch Export feature offers an alternate approach to exception processing,
whereby a batch with documents or pages in error is not automatically routed to Quality
Control for repair. Instead, a batch with errors is processed through the modules in the order
originally defined for the batch class. Once the batch reaches the Export module, the error-
free documents and pages are exported. The exception documents and pages are routed back
to Quality Control for repair and then processed through the batch class workflow, starting
with the first module after Scan. This approach is helpful if you do not want to delay batch
processing for error-free documents or pages that exist in the same batch with exception
items.
How Partial Batch Export Works
Select Partial Batch Export in the Administration module on the Batch Class Properties -
Advanced tab. On the Advanced tab, you select the processing module at which Partial Batch
Export should first go into effect. Starting with the specified module, rejected documents and
pages are forwarded along with error-free items to the next module. The feature remains in
effect for any modules in the workflow that follow the specified module.
For example, you might have Scan, Recognition Server, Validation, Verification, and Export
set up as the processing modules for a batch class. Beginning with the Validation module, you
specify that batches in error be advanced to the next module.
As a result, Partial Batch Export is not enabled for the batch if errors occur in the Scan or
Recognition Server modules. If a bad document is detected in these modules, the batch is
sent to Quality Control for repair. If a bad document is detected after the batch reaches the
Validation module, the batch in error is forwarded through the workflow in the module order
designated on the Batch Class Properties - Queues tab. After reaching the Export module,
the error-free items are exported and the bad document is routed back to Quality Control for
repair. The repaired item is then processed through the batch class workflow, starting with
the first module after Scan.
Page Registration
Sometimes, registration differences exist between a form image and its sample page. For
example, a form image might be shifted horizontally or vertically from the sample pages.
This might occur if different scanners are used to scan the form image and sample page. This
might also occur because the paper slips as the documents enter the scanner’s mechanical
feeder or optical differences in scanner mechanisms.
To account for these differences, Kofax Capture supports a page-level registration feature.
Page-level registration involves comparing a newly scanned image with its sample page.
.NET PDF Document Viewing, Annotation, Conversion & Processing
Redact text content, images, whole pages from PDF file. Annotate & Comment. Edit, update, delete PDF annotations from PDF file. Print.
how to delete text in pdf acrobat; how to delete text from a pdf reader
C# PDF Converter Library SDK to convert PDF to other file formats
Allow users to convert PDF to Text (TXT) file. can manipulate & convert standard PDF documents in other external third-party dependencies like Adobe Acrobat.
how to delete text from pdf; how to delete text in pdf using acrobat professional
The Administration Module
Kofax Capture Administrator's Guide
123
Then, zones on the image are automatically adjusted based on any horizontal or vertical
shifting introduced by the scanner. (The adjustment process is called registration.)
Page-level registration is defined at the form type level and is selected by default. You can
edit the settings for page-level registration from the Image tab on the Create Form Type
window or the Form Type Properties window. You can specify:
▪ A confidence threshold that indicates the minimum acceptable confidence returned by the
registration process. Kofax Capture does not consider the form image registered unless the
confidence returned is greater than or equal to the specified confidence level. The default
confidence is set to 1 percent, which works for a wide variety of forms. You can adjust the
confidence to a higher setting.
Note  The page-level registration feature is very sensitive to differences between images
and their sample pages. Adjusting the confidence to higher values could cause images
that don’t look like the samples to be rejected. This might be useful for catching a variety
of problems such as incorrect pages, inadequate scans, and so on because the images
won’t match the samples. On the other hand, it could cause more images to be rejected.
Therefore, you should try several settings in some test batches before you use your settings
in production.
▪ Whether all pages should be registered. Typically, you would select this option to verify
registration for all the pages in your documents. You should set the confidence threshold to
75 percent or more to force a stricter match between images and the sample pages. 
Tip  Optionally, you can define an OCR registration zone or a shape registration zone to
augment page-level registration.
Turning Off Page Registration
The page registration feature is very robust and can correctly register a wide variety of forms.
In some cases, though, you may get better results by turning off page registration and using a
registration zone instead.
You can turn off page registration from the Create Form Type window - Image tab or the
Form Type Properties window - Image tab by setting the Page Registration confidence to 0.
Registration Zones
A registration zone can be used to augment or replace page-level registration. Page-level
registration attempts to offset all zones based on how far large features on the page are offset
from the same features on the sample page. This works extremely well in most cases, but
produces invalid results in others.
Page-level registration may not give you the desired results if your images are different from
the sample pages, zone locations vary on the pages, or the scanned images are stretched or
distorted. If page-level registration is not working, you may get better results by using one or
more registration zones.
Registration zones include the following elements:
▪ A registration point, represented on the sample page by a cross.
▪ A recognition profile based on an OCR recognition engine or the Shape engine.
▪ A specification that tells the engine what to search for (text or type of shape).
C# powerpoint - PowerPoint Conversion & Rendering in C#.NET
documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. PowerPoint to PDF Conversion.
erase pdf text online; how to delete text in pdf converter professional
C# Word - Word Conversion in C#.NET
Word documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Word to PDF Conversion.
delete text in pdf file online; erase pdf text
The Administration Module
124
Kofax Capture Administrator's Guide
Note  You can test your zones using the QuickZones feature to make sure that your
registration zone is being processed with high confidence.
OCR Registration Zones
An OCR registration zone is an area on an image containing text data that is “fixed” in
relation to index data on a form. For example, your form may have a company name in the
same spot on each page. OCR Registration zones are used to correctly position index zones on
your images, which could enhance the automatic capture of index data.
OCR Requirements
To get reliable results, your OCR registration zones must meet the following minimal
requirements. Zones that do not meet these requirements may still yield acceptable results,
but performance of the recognition engine cannot be predicted in such cases.
OCR registration zones include the following Kofax Capture elements:
▪ A registration point. The point is typically located at the lower-left corner of the first
character of the text in the zone on your sample page.
▪ A recognition profile that uses OCR as the method of recognition.
▪ Search text (optional). As a rule of thumb:
▪ The first character must match the raw OCR results.
▪ The remaining characters are compared against the processed OCR results (after any
recognition script has been run). A match occurs if about half the characters match, or if
the search text is contained in the results.
▪ For best results, search text should be as short as possible.
▪ You can test your zones with the QuickZones to make sure that your search text is being
recognized with high confidence.
Note  The use of search text is recommended in most situations. If there is no suitable text for
a registration zone, you may want to create a registration zone without search text. In that
case, the registration process is based on the position of the first text character detected in the
zone at runtime.
Page Registration
Sometimes, registration differences exist between a form image and its sample page. For
example, a form image might be shifted horizontally or vertically from the sample pages.
This might occur if different scanners are used to scan the form image and sample page. This
might also occur because of paper slippage as the documents enter the scanner’s mechanical
feeder or optical differences in scanner mechanisms.
To account for these differences, Kofax Capture supports a page-level registration feature.
Page-level registration involves comparing a newly scanned image with its sample page.
Then, zones on the image are automatically adjusted based on any horizontal or vertical
shifting introduced by the scanner.
Page-level registration is defined at the form type level and enabled by default. You can edit
the settings for page-level registration from the Image tab on the Create Form Type window
or the Form Type Properties window. You can specify:
▪ A confidence threshold that indicates the minimum acceptable confidence returned by the
registration process. Kofax Capture does not consider the form image registered unless the
VB.NET PDF: How to Create Watermark on PDF Document within
create a watermark that consists of text or image (such And with our PDF Watermark Creator, users need no external application plugin, like Adobe Acrobat.
how to delete text from a pdf document; how to delete text in a pdf file
C# Windows Viewer - Image and Document Conversion & Rendering in
standard image and document in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Convert to PDF.
how to erase pdf text; pdf editor online delete text
The Administration Module
Kofax Capture Administrator's Guide
125
confidence returned is greater than or equal to the specified confidence level. The default
confidence is set to 1 percent, which works for a wide variety of forms. You can adjust the
confidence to a higher setting.
Note  The page-level registration feature is very sensitive to differences between images
and their sample pages. Adjusting the confidence to higher values could cause images
that don’t look like the samples to be rejected. This might be useful for catching a variety
of problems such as incorrect pages, inadequate scans, and so on because the images
won’t match the samples. On the other hand, it could cause more images to be rejected.
Therefore, you should try several settings in some test batches before you use your settings
in production.
▪ Whether all pages should be registered. Typically, you would select this option to verify
all pages in some way. Therefore, you should set the confidence threshold to 75 percent or
more to force a stricter match between images and the sample pages.
Tip  Optionally, you can define an OCR registration zone to enhance page-level registration.
Augmenting Page Registration
You can augment page registration with registration zones.
Registration zones contain data to be read for registration purposes. This type of zone is
typically used with Kofax Advanced OCR or Kofax Shape Zonal processing to ensure that
other zones on the page are correctly aligned. To use Kofax Advanced OCR or Kofax Shape
Zonal registration, you define one or more registration zones.
If you create only one registration zone on a page, it should be positioned near the index
zones. The search text for a single registration zone should be clear and distinct so that it
yields good results.
You can define multiple registration zones per page.
Shape Registration Zones
A shape registration zone is a type of registration zone that (instead of text) uses geometric
patterns that are “fixed” in relation to the data on a form. A shape registration zone is used
to accurately position recognition zones on your images, which could enhance the automatic
capture of the data.
Shape Types
Kofax Capture is capable of recognizing a variety of geometric shapes on a form. These
shapes may be used for shape registration zones as well as other zones that use shape
recognition profiles. The following shapes can be recognized.
Table 2-7. Shape Table
Name
Icon
ID*
Definition
Line Intersection
1
A shape that resembles a “plus” sign. However, the
intersection point does not need to be in the center of
either of the lines.
Top Intersection
10
A vertical line whose highest point meets a horizontal
line between its endpoints.
C# Excel - Excel Conversion & Rendering in C#.NET
Excel documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Excel to PDF Conversion.
erase text from pdf file; delete text from pdf
VB.NET PowerPoint: VB Code to Draw and Create Annotation on PPT
other documents are compatible, including PDF, TIFF, MS free hand, free hand line, rectangle, text, hotspot, hotspot more plug-ins needed like Acrobat or Adobe
how to delete text in pdf acrobat; how to remove highlighted text in pdf
The Administration Module
126
Kofax Capture Administrator's Guide
Name
Icon
ID*
Definition
Bottom Intersection
11
A vertical line whose lowest point meets a horizontal
line between its endpoints.
Left Intersection
12
A horizontal line whose leftmost point meets a vertical
line between its endpoints.
Right Intersection
13
A horizontal line whose rightmost point meets a
vertical line between its endpoints.
Lower-left Corner
20
A vertical line whose lowest point meets a horizontal
line at its leftmost point.
Lower-right Corner
21
A vertical line whose lowest point meets a horizontal
line at its rightmost point .
Upper-left Corner
22
A vertical line whose highest point meets a horizontal
line at its leftmost point.
Upper-right Corner
23
A vertical line whose highest point meets a horizontal
line at its rightmost point.
Lower-left Edge
30
The lower left quadrant of a solid rectangle.
Lower-right Edge
31
The lower right quadrant of a solid rectangle.
Upper-left Edge
32
The upper left quadrant of a solid rectangle.
Upper-right Edge
33
The upper right quadrant of a solid rectangle.
General
100
Any shape that cannot be classified as one of the
preceding shapes.
*The ID number is returned if the shape is found. It is seen in index fields or windows (such
as the Zone Test window) where the results of the shape recognition process are reported.
The ID number can also be used in scripts.
Shape Requirements
To get reliable results, your shapes should meet the following minimal requirements. Shapes
that do not meet these requirements may still yield acceptable results, but performance of the
recognition engine cannot be predicted in such cases. If you have a shape that falls outside of
these guidelines, you may need to experiment to see if you can use it.
Note that the skew of any shape cannot be greater than 1 in 5 (approximately 11 degrees). For
example, the Line Intersection shape cannot be rotated so that it resembles an “X”.
Note  These requirements are specified in pixels because shape recognition happens at the
pixel level. At 200 pixels per inch, 20 pixels is 0.1 inches or 2.5 mm.
▪ For lines:
▪ The line thickness must be least 2 pixels.
▪ All line lengths must be at least 20 pixels.
▪ The length of the line must be at least 5 times the thickness, but cannot be less than 20
pixels.
▪ For edges:
▪ The edges of a solid rectangle must be at least 20 pixels in both the vertical and
horizontal directions.
▪ The edges of a solid rectangle must be at least 20 pixels in both the vertical and
horizontal directions.
The Administration Module
Kofax Capture Administrator's Guide
127
▪ General
▪ The general shape must contain at least 1400 black pixels and no more than 10% white
pixels.
Special Tip
You can also assign a shape recognition profile to separator zones, form identification zones,
and index zones.
For index zones, Kofax Capture examines the content of the zone and attempts to find a
corresponding shape. If a shape is found, its ID number is placed in the associated field. These
results are then available in the Validation and Verification modules. They can also be used in
your custom recognition scripts or custom modules. If you assign a shape recognition profile
to an index zone, you cannot specify a specific search shape. All shapes are examined and the
closest match used.
Multiple Registration Zones on a Single Page
Registration zones contain data to be read for registration purposes. This type of zone is
typically used with OCR or shape processing to ensure that other zones on the page are
correctly aligned. You can define one or more OCR or shape registration zones on a single
page.
You can define multiple registration zones per page. To achieve optimal results, follow these
guidelines.
Zone Placement - Single Registration Zone
If you create only one registration zone on a page, it should be positioned near the index
zones. The shape for a single registration zone should be clear and distinct so that it yields
good recognition results.
Zone Placement - Multiple Registration Zones
You can define multiple registration zones per page. To achieve optimal results, refer to the
table.
Note  While results improve with multiple registration zones on a page, be aware that an
increased number of zones may adversely affect the time it takes to process your batch.
The Administration Module
128
Kofax Capture Administrator's Guide
Number of Zones
Placement Suggestions
Placement Example
One Zone
Place as close to index zones
as possible.
Two Zones
Place the two registration
zones in diagonally opposite
corners of the page.
The Administration Module
Kofax Capture Administrator's Guide
129
Number of Zones
Placement Suggestions
Placement Example
Three Zones
Place the registration zones
so that the registration points
form a triangle on the page.
Four or more
zones
Place the registration zones
near the data that is to be
processed on the page. Also,
do not rely on the success
of a single registration point.
For example, if you have
several registration zones
near the top of a page, and a
single registration point near
the bottom, the registration
alignment could be poor if
the registration fails for the
bottom zone.
Multiple Export
Normally, the final step for Kofax Capture is exporting a batch (including captured data) to
a long-term storage system. This is handled by the Export module, which relies on export
connectors to govern the process.
The Administration Module
130
Kofax Capture Administrator's Guide
In most cases, the batch is exported to a single destination, such as a text file, database, or
document management system. There may be occasions when you want to export a batch to
more than one destination (back-end). The multiple export feature makes this possible.
The multiple export feature uses the concept of an “assigned export connector” in Kofax
Capture. This refers to an export connector that has been assigned to a document class
and which contains the various settings that pertain to that assignment. Consequently, if
you repeatedly use the same export connector, each becomes a different “assigned export
connector.” When you assign an export connector to a document class, it may be given a
name (if supported by the export connector type). This is called the “assigned name.”
You can assign up to 99 export connectors to a document class.
Other
When setting up a document class for multiple exports, keep the following in mind:
▪ The multiple export feature can support up to 99 assigned export connectors within a
document class.
▪ If all the assigned export connectors for a batch have been successfully processed, the batch
is automatically deleted.
▪ When you upgrade or import a batch class from Ascent Capture 4.x or earlier, the included
export connectors are assigned default values for the multiple export settings. This is
necessary since earlier versions did not support multiple exports. The original export
connector remains assigned to the batch class, but the following defaults are added:
▪ RemainLoaded is set to “Yes” in the .inf file.
▪ “Export batch by document order” is selected in the Export Properties window.
▪ “Export image files” is selected in the Kofax Export Connector - Text Setup window -
Image Format tab.
▪ “Export full text files” is selected in the Kofax Export Connector - Text Setup window -
Document Storage tab.
▪ When you upgrade or import a batch class with one or more document classes from Ascent
Capture 4.x or earlier, each document class has zero or one assigned export connectors.
▪ Once an export connector is assigned, it may then cause problems if batch fields or index
fields are added, deleted, or modified. Therefore, assign export connectors only after you
are sure that changes are final.
▪ On-screen log messages in the Export module include the assigned export connector
number and assigned name (if any).
▪ Multiple export publish checks occur as they do for single export connectors. If a document
class has multiple assigned export connectors, then any publish checks occur in the order
specified on the Export Connectors window.
▪ If some documents could not be exported to all their destinations during processing, those
documents are rejected with a partial export error. When you open the batch in the Quality
Control module, the partially exported documents are displayed in the Partial Export
Errors window for your review.
Using Multiple Export
With the multiple export feature, you can export the same document within a batch to more
than one destination. This feature also includes some settings that allow you to optimize the
export process.
Before you can use an export connector in Kofax Capture, the connector must be registered.
Documents you may be interested
Documents you may be interested