opening pdf file in c# : How to delete text in pdf preview software SDK project winforms wpf web page UWP Kofax_Administrators_Guide_v104-part471

The Administration Module
Kofax Capture Administrator's Guide
Figure 2-5. Tables in the Index Field Panel
In the preceding figure, Line Item is a three-column table (Name, ItemNo, and Price) with two
rows.  All tables have one row by default. Use the Field menu to add additional rows.
The Field menu for this panel contains the items Insert Row Above, Insert Row Below, and
Delete Row for adding rows above or below the current row, and for deleting the current
Page Level Bar Codes
Table fields can be associated with the bar codes found on a page. As with index zones,
results are written to the first row of the table field only.
Field Types
As with single value index fields, field types used by one or more table fields may not be
Batch Class Import
Importing batch classes is largely unaffected by table fields. However, when importing batch
classes generated with versions of Kofax Capture prior to 7.0, special rules are applied if that
batch class has a field type called 
is reserved for table fields, if an imported batch class contains 
as a
field type, the field type is imported and renamed (regardless of the Transfer Mode setting).
In this case, the following line displays in the Import Progress control of the Import/Export
entertainment window:
Warning: Field type (TABLE) renamed: <new name>.
Note  The algorithm for determining the new name is similar to that of renamed items
during batch class import. The base of the new name is 
, with a suffix that guarantees
Database Validation
Use the Table Settings tab on the Database Validation Properties window to specify a table
field as the index field to validate. This feature is used to look up information in a database
to provide values for index fields. The following rules summarize the behavior of a database
validation using tables.
The specific table row value validated depends on the trigger setting for the database
validation on the Options tab on the Database Validation Properties window in the
How to delete text in pdf preview - delete, remove text from PDF file in, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
remove text watermark from pdf online; how to delete text from pdf document
How to delete text in pdf preview - VB.NET PDF delete text library: delete, remove text from PDF file in, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
how to erase pdf text; pdf editor online delete text
The Administration Module
Kofax Capture Administrator's Guide
Administration module. If the trigger is “Document preprocess” or “Document post-process,”
the first row of the table field is validated. If the trigger is “Field preprocess” or “Field post-
process,” the current row of the table field is validated.
When a table field is auto-filled from the database validation results, the behavior is modified
▪ If the trigger is “Document preprocess” or “Document post-process,” the first row of the
table field is automatically filled.
▪ If the trigger is “Field preprocess” or “Field post-process” and the table field is from the
same table as the index field being validated, the current row is automatically filled.
▪ If the trigger is “Field preprocess” or “Field post-process” and the table field is not from the
same table as the index field being validated, the first row of the table field is auto-filled.
Suppose your form has the following table.
Figure 2-6. Table in a Form
You might start by adding a table definition in the Document Class Properties window. The
following example also includes display labels.
How to C#: Preview Document Content Using XDoc.Word
How to C#: Preview Document Content Using XDoc.Word. Get Preview From File. You may get document preview image from an existing Word file in
erase pdf text online; deleting text from a pdf
How to C#: Preview Document Content Using XDoc.PowerPoint
How to C#: Preview Document Content Using XDoc.PowerPoint. Get Preview From File. You may get document preview image from an existing PowerPoint file in
how to delete text in pdf preview; delete text pdf acrobat professional
The Administration Module
Kofax Capture Administrator's Guide
Figure 2-7. Table Definition in the Document Class Properties Window
Once your table structure is in place, you can draw 5 manual index zones around the table
contents, as shown below:
Figure 2-8. Index Zones in a Table
When you process a batch, the table data appears in the index field panel in the Validation
VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
a preview component enables compressing and decompressing in preview in ASP images size reducing can help to reduce PDF file size Delete unimportant contents:
how to remove text watermark from pdf; how to erase in pdf text
C# WinForms Viewer: Load, View, Convert, Annotate and Edit PDF
Add text to PDF document in preview. • Add text box to PDF file in preview. • Draw PDF markups. Search PDF text in preview. • View PDF outlines.
erase text in pdf document; delete text pdf acrobat
The Administration Module
Kofax Capture Administrator's Guide
Figure 2-9. Tables in the Index Field Panel
The validation operator can enter the data from the table by manually adding or deleting
rows as necessary.
Width Alignment
Width alignment forces the width of an image to be aligned on a specific boundary. This is
useful when your images are rotated 90 degrees (the length becomes the new width), and the
application requires image widths to be even multiples of 8 or 16.
Pad Width to Byte Boundary
Pads image width up to the next multiple of 8.
Pad Width to Word Boundary
Pads image width up to the next multiple of 16.
The default is no width alignment.
Batch Totaling
Batch totaling is a quality assurance technique in which the sum of certain index fields is
compared against an expected value.
You specify that an index field is to be used in a batch totaling process when you define
your index fields for a document class. During production, the scan operator is asked for
an expected batch total by the Scan module. Typically, the operator manually computes the
value from data on the documents in the batch, enters the expected batch total, and then
processes the batch. Then, at the Validation module and Verification module (if specified),
Kofax Capture computes the sum of the selected index fields.
The computed sum is compared to the expected value entered by the scan operator. If the
values match, the batch is accepted. If the values do not match, a batch total error is reported.
An index field set up for batch totaling applies only to its specific document class. If you have
an identical index field in several document classes, and you want to total all of them, you
must set each index field individually in all the document classes that use it.
OMR Settings
When drawing a zone around an area for OMR processing, you should include only the OMR
shape (usually a square, rectangle, or circle) with little white space outside the shape.
C# WinForms Viewer: Load, View, Convert, Annotate and Edit
PowerPoint Conversion. • Convert Microsoft Office PowerPoint to PDF (.pdf). Delete annotations from PowerPoint. Select PowerPoint text contents for edit.
delete text pdf; how to delete text from a pdf in acrobat
C# PDF insert text Library: insert text into PDF content in
Supports adding text to PDF in preview without adobe reader installed in ASP.NET. Powerful .NET PDF edit control allows modify existing scanned PDF text.
pdf text watermark remover; how to delete text in a pdf acrobat
The Administration Module
Kofax Capture Administrator's Guide
When setting up the zone, keep the following in mind.
▪ If you draw a large zone box around an OMR item, the percentage of black pixels is
relatively small. Consequently, if a user makes a small check mark, it may not significantly
change the percentage of black pixels. If this small change does not put the percentage over
the threshold, then the OMR engine detects it as “unmarked.” Therefore, the smaller the
zone box around the OMR item, the easier it is to detect a mark.
▪ There are always slight differences in registration (paper position) as documents are fed
through a scanner. If your zone box is very close in size to the OMR item, then the paper
may shift so that part (or all) of the item is no longer in the zone, leading to detection
errors. Therefore, the smaller the zone box around the OMR item, the greater the chance of
registration problems.
▪ For best results, make the zone boxes as small as you can. If registration errors turn out to
be a problem, gradually increase the size of the box until the errors are minimized.
Make sure that zone boxes around similar OMR items are all the same size. This ensures
consistent results.
The following confidence settings are available for the OMR engine.
Pixel Percentage Threshold
This is the default setting. The confidence is calculated as the percentage of black pixels in the
OMR zone. For example, a confidence of 32% means that 32% of the pixels in the OMR zone
were black. The higher the number, the more likely the box has been checked.
The following graph shows the relationship between pixel percentage and confidence for the
“pixel percentage filled” method of determining confidence. In this case, the threshold is set
to 50%, but it could be set anywhere between 0% and 100%.
How to C#: Preview Document Content Using XDoc.excel
How to C#: Preview Document Content Using XDoc.Excel. Get Preview From File. You may get document preview image from an existing Excel file in
erase text from pdf; delete text from pdf acrobat
C# PDF replace text Library: replace text in PDF content in
Description: Delete specified string text that match the search option from specified PDF page. Parameters: Name, Description, Valid Value.
acrobat delete text in pdf; how to remove highlighted text in pdf
The Administration Module
Kofax Capture Administrator's Guide
Figure 2-10. Pixel Percentage Threshold
Probability that zone is marked
The confidence is calculated based on the probability that the zone has been marked. Typical
confidences for marked zones fall in the 80%-90% range and unmarked zones in the 0-20%
range. This method is well-suited for zones used in groups when “Pick best” is checked in the
Index Group Zone Properties window.
The following graph shows the relationship between pixel percentage and confidence
for the “probability that zone is marked” method of determining confidence. In this case,
the threshold is set to 50%, but it could be set anywhere between 0% and 100%. Moving
the threshold displaces the center of the curve left or right, but the basic shape remains
The Administration Module
Kofax Capture Administrator's Guide
Figure 2-11. Probability Marked Threshold
100% if Marked, 0% if Not
This is similar to the preceding option. The confidence is set to either 100% or 0% (no
intermediate values) depending on whether the zone is marked or not.
The following graph shows the relationship between pixel percentage and confidence for the
“100% if marked, 0% if not” method of determining confidence. In this case, the threshold is
set to 50%, but it could be set anywhere between 0% and 100%.
The Administration Module
Kofax Capture Administrator's Guide
Figure 2-12. Confidence Set to 100% or 0% Threshold
Difference from Threshold
The confidence is calculated on how far the pixel percentage is from the threshold point.
Consequently, a completely blank zone and a completely filled zone would both have a
confidence of 100%. On the other hand, if the threshold is set to 30% and the number of black
pixels is 29% or 31%, the confidence level would be very low, since a small error in scanning
could flip the results. This method indicates how certain the OMR engine is of its results, not
the pixel percentage.
This setting is a good choice for “yes/no” check boxes that are not part of a group. In general,
using this setting in a group does not produce useful results and is not recommended. In
groups, you may need the recognition engine to pick the best result. Since this method can
yield 100% confidence for both a blank and a checked item, your “pick best” results cannot be
The following graph shows the relationship between pixel percentage and confidence for the
“difference from threshold” method of determining confidence. In this case, the threshold
is set to 50%, but it could be set anywhere between 0% and 100%. Moving the threshold
displaces the center of the curve left or right, but the basic shape remains unchanged.
The Administration Module
Kofax Capture Administrator's Guide
Figure 2-13. Difference from Threshold
For best results, verify your settings with image files representative of the images you plan to
User Dictionaries
The recognition engines included with Kofax Capture can make use of dictionary files to
improve the accuracy of your index field data.
Only a single dictionary can be used with a document class. The dictionary can support a
single language. If you have selected multiple languages, only the first language in the list
of the selected languages uses the dictionary. User-defined dictionaries are not supported if
you select Chinese, Japanese, or Korean as the primary language. All the following rules for
dictionaries apply, regardless of the language.
Full Text Dictionary
This dictionary is used by the PDF Generator module and by OCR Full Text recognition. You
can create an ASCII text file to be used as a dictionary with any ASCII text editor, and note
that each word must be on a separate line in the ASCII text file.
The Full Text dictionary should contain terminology specific to the document class, although
output from the recognition engine may contain words not found in the dictionary.
The dictionary file must be in a folder accessible to the recognition engines or modules that
use it. This may be either on the local workstation, via a mapped drive, or a UNC path.
The Administration Module
Kofax Capture Administrator's Guide
Zonal Dictionary
Zonal dictionaries are the same as Full Text dictionaries. However, with a zonal dictionary,
each field type can have only one dictionary, but a dictionary can be used by one or more
field types. For example, you could have seven field types and five dictionaries, with one
dictionary shared by three field types.
OCR Dictionaries
You can specify a dictionary to be used for OCR processing. If specified, the dictionary is used
by the Kofax Capture OCR recognition engines at data capture time and could be useful for
checking unrecognized words.
There are several types of dictionaries you can use.
You can specify an OCR dictionary at the field type level and/or the document class level:
▪ If specified at the field type level, the dictionary is used for zonal OCR processing. The
dictionary should contain terminology specific to the field type. The field type level
dictionary must be accessible to the Recognition Server module.
▪ If specified at the document class level, the dictionary is used by the PDF Generator or the
OCR Full Text modules. It should contain terminology specific to the document class. The
document class level dictionary must be accessible to the modules that use it.
Using a dictionary does not guarantee that the output from the recognition engine will match
an entry in the dictionary. The dictionary is used as an aid to help the engine make the best
possible decision it can, but does not control the engine's final output.
Note  For multiple languages, only words not found in the dictionary are flagged. If the
selected language does not have a dictionary, the word is not flagged.
You specify a field type level dictionary from the Create Field Type window or Field Type
Properties window.
You specify a document class level dictionary from the Create Document Class window or
Document Class Properties window.
Zone Display at Validation Time
Zones for which data is automatically captured (for example, with OCR, ICR, or other
recognition technologies) are displayed for your validation operators as either “confident” or
“non-confident” zones. A “confident” zone is one that is marked as having a high probability
of accuracy. A “non-confident” zone is one that is marked as having a low probability of
By default, confident zones are displayed at validation time with green borders, while non-
confident zones are displayed with red borders. (You can specify a different color scheme
from the Validation module.) While all zones should be carefully validated, your validation
operators should pay special attention to “non-confident” zones.
Once you visit a zone (place the cursor in the index field) and then leave it, the zone displays
as “confident” (green), even if you do not change the contents.
Zone display behaves a little differently when the zone is part of a group. In that case, by
default, the display zooms to the group rather than the specific zone. This setting can be
Documents you may be interested
Documents you may be interested