opening pdf file in asp.net c# : How to delete text in pdf using acrobat professional control Library system azure .net web page console Kofax_Administrators_Guide_v108-part475

The Administration Module
Kofax Capture Administrator's Guide
81
Tips for Removing Vertical Lines
For best results, follow these guidelines:
▪ Set the minimum height to a large enough value so that text objects (such as the vertical bar
of a capital “T”) are not mistaken for vertical lines. Setting a larger value also allows the
vertical line removal algorithm to work faster because many objects (such as text) can be
ignored when searching for lines.
▪ Set the maximum gap to a maximum value of 2 or 3 pixels (at 200 dpi). Doing so helps
prevent text characters from being considered vertical lines to remove.
▪ Use QuickZones to evaluate your settings while creating your zones. This improves results
during processing.
Tips for Removing Shaded Areas
For best results, follow these guidelines:
▪ Set the minimum width and minimum height as large as possible without making the
values larger than the smallest shaded area to detect. For example, if all shaded areas to be
removed are 5 inches wide and 2 inches tall, you can set the minimum height to 1.5 inches
(any value less than 2 inches) and the minimum width to 4.5 inches (any value less than 5
inches). Setting the values too small (for example, less than 1 inch) could cause the deshade
algorithm to detect text objects as shaded areas.
▪ Leave the Max speckle width and Max speckle height at their default values. The defaults
should be sufficient to detect most shaded areas.
▪ Leave the Horizontal adjust and Vertical adjust at their default values. The defaults should
be sufficient for most speckles in detected shaded areas.
▪ Use QuickZones to evaluate your settings while creating your zones. This improves results
during processing.
Streak Removal
Sometimes, streaks are captured on an image when it is scanned as a result of the following:
▪ Marks on the original page
▪ Dust in the scanner assembly
▪ Faulty scanner CCD (camera)
You can use the streak removal feature to eliminate these streaks.
To remove streaks, you must define the maximum width of the streaks to remove.
How to delete text in pdf using acrobat professional - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
erase text from pdf file; how to edit and delete text in pdf file
How to delete text in pdf using acrobat professional - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
delete text in pdf file online; delete text pdf files
The Administration Module
82
Kofax Capture Administrator's Guide
Figure 2-19. Streak Removal
Note that the streak removal feature processes each horizontal scan line on the image to
detect runs of black pixels. Any series of black pixels less than or equal to the streak width are
removed. Even though streak removal processes the image from left to right, its main purpose
is to eliminate vertical streaks.
You specify streak removal settings on the Image Cleanup Profiles window. The settings
become part of an image cleanup profile, which you can then include in a recognition profile.
Tips for Removing Streaks
For typical images, set the width of the streaks to remove to a value of 1 or 2 pixels. Since
streak removal looks for any series of pixels that are alike and also less than or equal to the
streak width, setting the width too high could have an adverse effect by eliminating data from
the image.
Use QuickZones to evaluate your settings while creating your zones. This improves results
during processing.
Horizontal Line Removal
If your images contain unwanted horizontal lines, you can remove them with the horizontal
line removal feature. You can optionally select character reconstruction to repair text that
intersects the lines that are removed. Removing lines and repairing characters improves the
readability of your images.
To remove horizontal lines, define the characteristics of the lines to remove. You must
define the minimum length and maximum height of the lines to remove, along with other
characteristics such as an edge clean factor and the characteristics of the characters to repair.
C# PDF Converter Library SDK to convert PDF to other file formats
users to convert PDF to Text (TXT) file. can manipulate & convert standard PDF documents in NET class applications independently, without using other external
how to delete text from pdf with acrobat; erase pdf text
.NET PDF Document Viewing, Annotation, Conversion & Processing
Redact text content, images, whole pages from PDF file. Annotate & Comment. Edit, update, delete PDF annotations from PDF file. Print.
how to delete text in pdf using acrobat professional; how to delete text in pdf converter professional
The Administration Module
Kofax Capture Administrator's Guide
83
Figure 2-20. Example of Horizontal Line Removal
Specify your line removal settings on the Image Cleanup Profiles window. Your settings
become part of an image cleanup profile, which you can include in a recognition profile.
Tips for Removing Horizontal Lines
For best results, follow these guidelines:
▪ Set the minimum length to a large enough value so that text objects (such as the horizontal
bar of a capital “T”) are not mistaken for horizontal lines. Setting a larger value also allows
the algorithm to work faster because many objects (such as text) can be ignored when
searching for lines.
▪ Set the maximum gap to a maximum value of 2 or 3 pixels (at 200 dpi). Doing so helps
prevent text characters from being considered horizontal lines to remove.
▪ Use QuickZones to evaluate your settings during zone setup. This improves results during
processing.
Despeckle
Speckles on an image are groups of black pixels surrounded by white pixels (or white pixels
surrounded by black pixels). Removing unwanted speckles provides a cleaner image for OCR
processing and also helps reduce compressed file sizes.
To remove speckles from an image, you define the characteristics of the speckles to remove.
You must specify the maximum height and width of the unwanted speckles, and all speckles
that satisfy the defined characteristics are removed.
C# powerpoint - PowerPoint Conversion & Rendering in C#.NET
other external third-party dependencies like Adobe Acrobat. Using this .NET professional PowerPoint document conversion library PowerPoint to PDF Conversion.
remove text from pdf acrobat; remove text watermark from pdf online
C# Word - Word Conversion in C#.NET
using other external third-party dependencies like Adobe Acrobat. Using this .NET professional Word document conversion library toolkit Word to PDF Conversion.
how to delete text from pdf with acrobat; delete text pdf file
The Administration Module
84
Kofax Capture Administrator's Guide
Figure 2-21. Example of Speckles on an Image
You specify despeckle settings on the Image Cleanup Profiles window. Your settings become
part of an image cleanup profile, which you can include in a recognition profile.
Tips for Removing Speckles
For best results, follow these guidelines:
▪ Set the maximum width and maximum height to appropriate values for your image. Using
large values for these properties could remove portions of the image that you want to keep.
▪ Check your image to ensure that punctuation marks (such as commas, periods, and
quotation marks) are not being removed. If they are, adjust the values of the maximum
width and maximum height.
▪ Use QuickZones to evaluate your settings during zone creation. This improves results
during processing.
Black Border Removal / Cropping
Black borders can appear on images as a result of capturing the images on scanners that have
black belts or drums. If black borders exist on your images, you can remove them with the
black border removal or black border cropping feature.
▪ With black border removal, the black border pixels are changed to white pixels on the
image. This cleans up the image without changing the height and width of the image.
▪ With black border cropping, the black border pixels are removed from the image. This
cleans up the image and reduces the height and width of the image by the size of the black
border.
To remove a black border, the software starts at the outer left and right edges of the image
and works inward, turning black pixels into white until it detects a white pixel. When it
detects a white pixel, the software determines whether the white pixel is part of white noise
in the border or the edge of the image. When the software detects the edge of the image, the
black border removal process stops.
To crop a black border, the software starts at the outer left and right edges of the image
and works inward, removing black pixels. As soon as it detects a white pixel, the software
determines whether the white pixel is part of white noise in the border or the edge of the
image. When the software detects the edge of the image, the cropping process stops.
C# Windows Viewer - Image and Document Conversion & Rendering in
without using other external third-party dependencies like Adobe Acrobat. By using the Windows Viewer, you can convert word files as follows: Convert to PDF.
delete text pdf preview; how to delete text in pdf preview
C# Excel - Excel Conversion & Rendering in C#.NET
using other external third-party dependencies like Adobe Acrobat. Using this .NET professional Excel document conversion library Excel to PDF Conversion.
erase pdf text online; how to erase in pdf text
The Administration Module
Kofax Capture Administrator's Guide
85
You specify black border removal/cropping settings on the Image Cleanup Profiles window.
Your settings become part of an image cleanup profile that you can include in a recognition
profile.
White Noise in a Black Border
White noise can be any white pixel or series of white pixels in a black border, and all black
borders contain a certain amount of it. White noise is not necessarily visible to the naked eye,
but it could impact the process for black border removal or black border cropping.
You can specify a value called “white noise gap,” which determines how much white noise
the software ignores during a black border removal or black border cropping process.
▪ If a series of white pixels in the black border is less than or equal to the value of the white
noise gap, it is considered white noise. The white noise is ignored, and the black border
removal/cropping process continues.
▪ If the number of consecutive white pixels is greater than the value of the white noise gap, it
is considered the end of the border and the black border removal/cropping process stops.
Figure 2-22. White Noise Gap
For best results, set the white noise gap to a large enough value to remove/crop the entire
black border; setting it too low prematurely stops the black border removal/cropping
process.
Deshade
Shaded areas on an image are rectangular areas made up of a pattern of black speckles. You
can remove shaded areas from your image with the deshade feature. The deshade process
removes the speckles that make up the shaded areas while preserving the text inside the
shaded areas.
To remove shaded areas from an image, you must define the characteristics of the shaded
areas to remove. You specify the height and width of the areas and the size of the speckles in
them. All shaded areas that satisfy the defined characteristics are removed. Any text within
the shaded areas is preserved.
VB.NET PDF: How to Create Watermark on PDF Document within
to Add Image Watermark to PDF. Besides text, users also Image__1.LoadImageFromFile(" C:\1.pdf") End Using If True 2)) image__2.Save("C:\1-watermark.pdf") End If.
delete text pdf acrobat professional; pdf text watermark remover
VB.NET PowerPoint: VB Code to Draw and Create Annotation on PPT
other documents are compatible, including PDF, TIFF, MS on what are needed for using our reliable free hand, free hand line, rectangle, text, hotspot, hotspot
how to delete text in pdf converter; how to erase text in pdf file
The Administration Module
86
Kofax Capture Administrator's Guide
Figure 2-23. Definition of a Shaded Area
You specify deshade settings on the Image Cleanup Profiles window. Your settings become
part of an image cleanup profile, which you can include in a recognition profile.
Hardware-Based Image Enhancement
Kofax Capture provides access to image enhancement algorithms available with Adrenaline
hardware accelerator products. The algorithms are similar to the deshade and edge
enhancement filters available for cleaning up images, but running them on the hardware is
faster.
The following algorithms are available.
Descreening
A shade removal algorithm, which is especially useful for removing halftones from
photographs.
Image Smoothing
An image smoothing algorithm, which is especially useful for smoothing characters and lines
that seem jagged on your image.
The default is no image enhancement algorithm enabled.
Note  The image enhancement algorithms are not available when using scanners (such as
Kodak scanners) that return compressed images.
The Administration Module
Kofax Capture Administrator's Guide
87
Deskew
Because of the mechanical feeding action of scanners, documents may shift out of alignment
during the scan process. The varying amounts of misalignment are referred to as “skew.”
The deskew feature can calculate and correct skew angles up to 12 degrees. Correcting
an image for skew can be useful for making the image more readable and for improving
operations such as bar code recognition and OCR.
Note  The deskew process scales images slightly, and the amount of scaling is greater at
higher degrees of skew. If the image is skewed more than 10 degrees, the scaling of the image
is noticeable.
You specify your deskew settings on the Image Image Cleanup Profiles window. Your
settings become part of an image cleanup profile, which you can include in a recognition
profile.
Field Types
A field type is a global definition for an index field. An index field is a keyword used to
retrieve a document after it has been exported to permanent storage.
Field types provide an efficient way to set up index fields and their validation criteria. You
can define a pool of field types, and then select from this pool when you define document
classes.
For example, a field type named “Address” can be defined once, and then be used by all
varieties of document classes requiring an address for an index field. When the index field for
the address information is defined, it is simply a matter of selecting “Address” from the list of
defined field types.
You create new field types on the Create Field Types window.
You edit field types on the Field Type Properties window.
Data Types
Kofax Capture supports 11 ODBC-compliant data types for your field types, as shown in the
Data Types table.
You specify the data type for a new field type on the Create Field Types window.
You edit the data type for an existing field type on the Field Type Properties window.
Table 2-4. Data Types
Data Type
Description
CHAR
Variable-length character string. You can specify up to 25,000 characters.
DATE
Date string. Note that validation of date fields is sometimes dependent on the
regional date format settings specified from Windows Control Panel.
The Administration Module
88
Kofax Capture Administrator's Guide
Data Type
Description
DECIMAL
Signed, numeric value with the number of numeric digits greater than or equal
to 1, and less than or equal to 15, and the number of decimal places greater
than 0, but less than or equal to the number of numeric digits.
DOUBLE
Signed, floating-point value with the number of digits equal to 15.
FLOAT
Signed, floating-point value with the number of digits equal to 15.
INTEGER
Numeric value with the number of numeric digits equal to 10, and the number
of decimal places equal to 0. The range is -2,147,483,648 to 2,147,483,647.
NUMERIC
Signed, numeric value with the number of numeric digits greater than or equal
to 1 and less than or equal to 15, and the number of decimal places greater
than 0 but less than or equal to the number of numeric digits.
REAL
Signed, single-precision value with the number of numeric digits equal to 7.
SMALLINT
Numeric value with the number of numeric digits equal to 5, and the number of
decimal places equal to 0. The range is -32,768 to 32,767.
TIME
Time string.
VARCHAR
Variable length character string. When defining a field type as a CHAR or
VARCHAR data type, you must specify the maximum number of characters
for the field type. For example, if you specify 25 as the number of characters,
data for that field can be up to 25 characters in length. You can specify up to
25,000 characters. However, the maximum length of known values for field
types based on CHAR or VARCHAR is 254 characters.
The DATE Data Type
When defining a field type as a DATE data type, you must consider the date settings specified
from Windows Control Panel. These settings affect the format of the date field and impact
validation of the date field as shown in the table.
The standard validation for DATE checks for the short date format. In addition, the standard
validation does not allow dates earlier than 1930. To use a long date format (such as Tuesday,
December 22, 1998) or a date earlier than 1930, you must update your validation scripts.
With this Windows regional
setting:
You can use this format for
Validation:
Notes:
mm/dd/yy
Any date format
m/dd/yy
Any date format
m/d/yyyy
Any date format
mm/dd/yyyy
Any date format
yy/mm/dd
yy/mm/dd
dd-mmm-yy
yyyy-mm-dd
Other formats could cause
validation errors.
yyyy-mm-dd
yy/mm/dd
dd-mmm-yy
yyyy-mm-dd
Other formats could cause
validation errors.
dd-mmm-yy
yy/mm/dd
dd-mmm-yy
yyyy-mm-dd
Other formats could cause
validation errors.
The Administration Module
Kofax Capture Administrator's Guide
89
Default Validation and Formatting
Kofax Capture provides basic data type validation of index field data. For each index field,
the default validation code checks that the string generated by a recognition engine or typed
in by a validation operator is an acceptable value for the data type of the field type.
The default formatting code uses the SBL Format function to format dates, times, and numeric
values.
When you create a field type macro or a document class validation script, the default
validation and formatting code for each data type in your script is copied into the script. You
can edit the code, as needed, to validate your index fields. The default validation code for
each data type appears in the table.
Data Type
Description and Default Processing
Char
Varchar
Variable Length String. Validation code tests whether the length of index field
string (excluding leading and trailing spaces) does not exceed the specified
maximum number of characters.
Smallint
16-bit integer. Validation code trims spaces, checks for numeric digits, uses the
KfxRoundSmallInteger function in KfxValid.dll to round the index string, and tests
whether the index string can be converted into an Integer.
Integer
32-bit integer. Validation code trims spaces, checks for numeric digits, the
KfxRoundInteger function in KfxValid.dll to round the index string, and tests
whether the index string can be converted into a Long.
Decimal
Numeric
Floating-point number. Validation code trims spaces, checks for numeric digits,
uses the KfxValidateDecimal function in KfxValid.dll to test whether the index field
string can be converted into a decimal number with the specified total number of
numeric digits and precision.
Double
Float
Double-precision floating-point number. Validation code trims spaces, checks for
numeric digits, and uses the SBL IsNumeric and Val functions to test whether the
index string can be converted into a Double.
Real
Single-precision floating-point number. Validation code trims spaces, checks for
numeric digits, and uses the SBL IsNumeric and Val functions to test whether the
index string can be converted into a Single.
Date
Validation code trims spaces and uses the SBL IsDate function to test whether
the index field string can be converted into a short date. The function uses the
date settings in the registry to identify a valid short date. To process dates in other
formats, you need to modify the Date validation code.
Time
Validation code trims spaces and uses the SBL TimeValue function to test whether
the index string can be converted into a Time.
Valid Maximum Values Table
This table lists the values supported as field length maximums.
The values listed in these columns specify the minimum and maximum values you can set for
the maximum length of a field. For example, you can set the maximum length for an index
field to be any value from 7 to 32. If you set the maximum length to a value of 10, you can use
index field names of 1 to 10 characters in length.
The Administration Module
90
Kofax Capture Administrator's Guide
Field
Minimum
Max Value
Maximum
Max Value
Notes
Batch class name
1
32
Document class name
1
32
Form type name
1
32
Batch field name
7
32
Index field name
7
32
Field type name
1
32
Field type description
1
80
Field type length for known
values
1
254
VARCHAR and CHAR types only
Force Match and Case-Sensitive Attributes
In addition to specifying known values for a field type, you can assign the “force match”
and/or “case-sensitive” attributes to the values. The attributes you select apply to all the
known values for a field type.
▪ With force match selected, the list of known values is sent to the recognition engine (OCR,
ICR, bar code recognition, etc.) processing the index field. In addition, the validation and
verification operators are required to select from the list of values.
▪ With case-sensitive selected, the known value must be matched exactly by the recognition
engine. This forces a distinction between upper and lowercase characters.
You select these attributes from the Create Field Type window or the Field Type Properties
window.
Known Values for Field Types
You can specify known values for a field type. Then, for all index fields based on that field
type, the known values are available to enhance validation operations. 
▪ At data capture time: If automatic recognition is specified, the recognition engine is
provided with a list of values to resolve unrecognized words. This improves the accuracy
of the engine. Note that the “force match” attribute for the field type controls which
recognition engines can use the known values:
▪ If force match is selected, the values are provided to any automatic recognition engine
specified (OCR, ICR, bar code recognition, etc.).
▪ If force match is not selected, the values are provided to Kofax Capture’s OCR and ICR
engines only.
▪ At validation time: The validation and verification operators are provided with a list of
the known values to select. This makes validation and verification easier, and potentially
increases validation accuracy.
▪ If force match is selected, the validation and verification operators are required to select
or accept a value from the list of known values.
▪ If force match is not selected, the validation and verification operators are able to select a
value from the list or enter a different value.
You specify known values for a new field type on the Create Field Type window.
Documents you may be interested
Documents you may be interested