opening pdf file in asp.net c# : Acrobat remove text from pdf control software utility azure windows wpf visual studio Kofax_Administrators_Guide_v1024-part455

Kofax Capture Administrator's Guide
241
Chapter 6
The Recognition Server and OCR Full
Text Modules
This chapter gives an overview of the Recognition Server and OCR Full Text modules.
Recognition Server Module Overview
The Recognition Server module separates batches into documents, identifies form types,
performs image cleanup, and extracts index data from images. It is required for any batch that
uses automatic form identification, automatic document separation, automatic image cleanup,
or automatic validation.
The Recognition Server module is an unattended module. Batches are processed in this
module, and then automatically passed to the next module specified for the batch.
While batches are processed at this module, the results of the processing appear on the main
screen.
This module requires no additional setup.
Note  Single document processing is not available when document separation does not occur
automatically in the Scan module.
OCR Full Text Module Overview
This module performs Optical Character Recognition (OCR) on an entire document and stores
the results in a specified output format such as Microsoft Word or ASCII. The output format
is specified in the document class associated with the document. The folder where the files are
exported is specified in the export connector associated with a document class/ batch class. 
OCR Full Text is an unattended module that requires no additional setup. While batches are
processed at this module, the results of the processing appear on the main screen.
OCR Full Text Processing
OCR Full Text is used to capture an entire page and save the results as a text or word
processing file. It is usually used in conjunction with full text search engines. 
You enable OCR Full Text processing from the Create Document Class window or the
Document Class Properties window.
The settings for OCR Full Text processing are defined within an OCR Recognition profile.
Acrobat remove text from pdf - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
how to erase text in pdf; how to delete text from pdf
Acrobat remove text from pdf - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
delete text in pdf file online; remove text from pdf acrobat
The Recognition Server and OCR Full Text Modules
242
Kofax Capture Administrator's Guide
OCR Full Text Log File
The results of processing a batch at the OCR Full Text module can be tracked in a log file.
This log file can be useful for reviewing how the batch was processed. When this feature is
selected, the log file is created in your Kofax Capture installation folder:
\IMAGES\<BatchNumber>\LOG\OCR.txt
where <BatchNumber> is the number of a batch. A separate log file is available for each
batch.
The log files are temporary; they are automatically deleted when the batch is exported. You
can review the log file for a batch as long as the batch is available to Kofax Capture. You can
copy the file to a different folder to review it after the batch is exported.
The Logging feature is available on the Tools menu.
Using Kofax Advanced OCR Full Text
This procedure shows how to set up your batch classes to use the Kofax Advanced OCR Full
Text engine.
The following procedure assumes that your document and batch classes already exist. If not,
you can make these selections while creating new classes.
1 Open the Batch Class Properties window.
a Click the Queues tab.
b Add OCR Full Text and other required modules.
c Click OK.
2 Open the Document Class Properties window.
a Click the OCR tab.
b Select Enable OCR full text.
c Select a dictionary file.
d In the Recognition Profile drop-down list, select Kofax Advanced OCR Full Text.
e Select Skip first page of each document.
f Click OK.
3 Open the Export Connector window.
a Select the Kofax Capture Text export connector.
b Click the Document Storage tab.
c Select Export OCR full text files.
d Select an export folder.
e Click OK.
f Click Close.
4 Publish the batch class.
.NET PDF Document Viewing, Annotation, Conversion & Processing
Insert images into PDF. Edit, remove images from PDF. Redact text content, images, whole pages from PDF file. Print. Support for all the print modes in Acrobat PDF
how to delete text in a pdf file; pdf text watermark remover
C# PDF Converter Library SDK to convert PDF to other file formats
independently, without using other external third-party dependencies like Adobe Acrobat. If you need to get text content from PDF file, this C# PDF to
how to delete text in pdf acrobat; delete text from pdf preview
Kofax Capture Administrator's Guide
243
Chapter 7
The XML Import Connector Module
Kofax Capture supports a feature to import XML files. The Kofax Capture XML Import
Connector module provides this capability. Like standard Auto Import, XML Import
Connector gives you the ability to create batches by reading batch information from special-
purpose files. XML Import Connector differs from the standard Auto Import in several ways,
and delivers a more robust method of importing batches.
Note  Although XML Import Connector is available in this version of Kofax Capture, the
feature has been deprecated. As a result, XML Import Connector will be removed in a future
product release.
With XML Import Connector, you can do the following:
▪ Run XML Import Connector as a Kofax Capture unattended module, a Kofax Capture
Service, a process, or on demand.
▪ Create batches in Kofax Capture without launching the Scan module. Note that the Scan
module must be added to your batch class in order to use XML Import Connector.
▪ Supply an XML file to read batch information that provides all the benefits of a
standardized and widely used input format (XML).
▪ Automatically poll a specified folder for XML files to process.
▪ Create batches based on batch classes that contain multiple document classes.
▪ Create batches based on batch classes that contain multiple form types.
▪ Perform document separation and form identification during the import process.
▪ Create batches based on batch classes that contain batch fields with values that you specify.
▪ Create batches that contain index fields for which batch totaling is selected.
How XML Import Connector Works
Use the XML Import Connector module to import batches of loose pages and documents
into your Kofax Capture system without launching the Scan module. It can be run as an
unattended module, a service, a process, or on demand. Depending upon the command
line arguments used, the application either polls for XML Import Connector files or opens
a specified XML file. After opening an XML file, XML Import Connector reads the batch
information, creates the batches, and makes them available to Kofax Capture. Once the
batches are created, they can be processed through the Kofax Capture workflow just like
batches created with the Scan module.
Note  XML Import Connector does not support the Single Sign On feature, or linked users.
You can also import index field and batch field values. The XML Import Connector process
automatically validates batch field values according to the data type and length settings for
the fields, as specified in the batch class. Index field values are not validated. You can also
process index fields for which batch totaling is enabled.
C# powerpoint - PowerPoint Conversion & Rendering in C#.NET
documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. PowerPoint to PDF Conversion.
how to copy text out of a pdf; how to edit and delete text in pdf file online
C# Windows Viewer - Image and Document Conversion & Rendering in
standard image and document in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Convert to PDF.
how to remove highlighted text in pdf; erase text from pdf file
The XML Import Connector Module
244
Kofax Capture Administrator's Guide
As events or errors occur during the XML Import Connector process, they are written to an
XML Import Connector log file used to monitor the batches imported into the system. Errors
are also written to the standard Kofax Capture error log and the XML Import Connector file.
For details, see Event Logging
and Error Handling
.
You can use a customized program that gathers batch information and stores it in special-
purpose XML files to utilize XML Import Connector. If running as an unattended module, a
service, or a process, you can place the XML files in a folder that is polled at a specified time
interval. If running XML Import Connector on demand, you can process a specific XML file
by incorporating the command line into your program.
XML Import Connector is useful if you have a program that can generate XML files for you
and/or if you need to import your batches asynchronously. If this is not the case, it may be
easier to import data into Kofax Capture directly by writing a custom application using the
Kofax Capture Module Type Library.
License Requirements
Even though the XML Import Connector feature does not launch the Scan module, it requires
at least a Scan/Quality Control License for the workstation from which the XML Import
Connector process is started. Note the following:
▪ Multiple instances of XML Import Connector can run on the same workstation at the same
time.
▪ You can run the Scan module and XML Import Connector on the same workstation at the
same time.
Scan and XML Import Connector share page count. Pages imported with XML Import
Connector decrement page count, and are reflected in the “Remaining” count displayed on
the Scan Controls in the Scan and Quality Control module.
If your license runs out during polling, the current batch is deleted. The current XML file;
however, is not affected. A message box appears or, if running as a service, an error is
logged, indicating that the application cannot import any additional pages. The application is
automatically shut down or the service is stopped, as appropriate.
Setting a Polling Interval
1 On the Tools menu, click Polling Interval.
The Polling Interval window appears.
2
Enter or select a polling interval. You can specify from 1 to 86,400 seconds (24 hours).
XML Import Connector Command Line Arguments
To run Kofax Capture XML Import Connector as a service, process, or on demand, you must
use command line arguments. You can also run XML Import Connector as an unattended
module by using command line arguments. The name of the XML Import Connector
application is Acxmlai.exe, and it is installed to 
<Kofax Capture installation>\Bin
.
Command Line Argument Syntax
The general syntax for the XML Import Connector command line is as follows:
C# Word - Word Conversion in C#.NET
Word documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Word to PDF Conversion.
how to delete text in pdf file online; how to delete text in a pdf acrobat
JPEG to PDF Converter | Convert JPEG to PDF, Convert PDF to JPEG
It can be used standalone. JPEG to PDF Converter is able to convert image files to PDF directly without the software Adobe Acrobat Reader for conversion.
remove text from pdf; how to delete text from pdf with acrobat
The XML Import Connector Module
Kofax Capture Administrator's Guide
245
Acxmlai [Options]
All command options must be preceded by a hyphen. With the exception of the 
-Install
option, which must be used first if you are running XML Import Connector as a service, you
can specify the options on the command line in any order.
Note  Command line options are case-insensitive.
Command Line Option
Description
-Install
Installs the XML Import Connector application as a service.
With this option, the 
-Poll
option is implied. The service
name is “Kofax Capture Import Connector - XML” and uses the
LocalSystem account as the default user.
To install XML Import Connector as a service, it must be the first
option on the command line. All command line options for the
service must be listed after the 
-Install
option. Example:
Acxmlai -Install -Poll:60 -PollDir:"C:\Polling
Dir"
A message appears regarding the success or failure of the 
-
Install
option. This message is also written to the Windows
Event Viewer application log. Note that the installation fails if
the service is already installed. To change the options, you must
uninstall and then reinstall the service.
Tip 
Remember to start the service manually or configure it to
auto start after using the 
-Install
option.
-GUI
Launches the XML Import Connector module. Example:
Acxmlai -GUI -PollDir:"C:\Polling Dir"
With this option, the 
-Poll
option is implied. See The XML Import
Connector Module
for more information.
-i:FileName.xml
Specifies an XML Import Connector file to process immediately
(on demand). It can be specified with an absolute, relative, or
UNC path. File names/paths containing spaces must be enclosed
in quotation marks. Example:
Acxmlai -i:"C:\My Files\XMLFile.xml"
The XML Import Connector file must be opened exclusively during
the entire auto import session. If this is not possible (for example,
the file does not exist or is open by another user), the error “XML
file cannot be opened” is generated.
The XML Import Connector file should have an extension of “xml”.
If no file name is specified, the default file name (AutoImp.xml) is
assumed.
PDF to WORD Converter | Convert PDF to Word, Convert Word to PDF
PDF to Word Converter has accurate output, and PDF to Word Converter doesn't need the support of Adobe Acrobat & Microsoft Word.
how to delete text in pdf converter; pdf text remover
VB.NET PDF: How to Create Watermark on PDF Document within
create a watermark that consists of text or image (such And with our PDF Watermark Creator, users need no external application plugin, like Adobe Acrobat.
how to delete text from a pdf reader; how to delete text in pdf document
The XML Import Connector Module
246
Kofax Capture Administrator's Guide
Command Line Option
Description
-Poll:seconds
Polls the control directory specified with the 
-ControlDir
option, if applicable, or the polling folder specified with the 
-
PollDir
option at the specified time interval. Specify the polling
time interval in seconds. Example:
Acxmlai -Install -Poll:120 -PollDir:"C:\Polling
Dir"
If the control folder and/or polling folder options are not specified,
the application polls the default folder (
C:\Acxmlaid
).
If the polling time interval is not specified and this is the first time
the 
-Poll
option has been invoked, the default polling interval
of 60 seconds is used. Otherwise, the most recently used polling
interval is used.
This option is implied if the 
-Install
or 
-GUI
option is specified.
-Uninstall
Removes the XML Import Connector application service.
Example:
Acxmlai -Uninstall
A message appears regarding the success or failure of the 
-
Uninstall
option. This message is also written to the Windows
Event Viewer application log.
-PollDir:directory
Specifies the XML Import Connector polling directory. It can be
specified with an absolute, relative, or UNC path. File names/
paths containing spaces must be enclosed in quotation marks.
Example:
Acxmlai -Poll:60 -PollDir:"C:\Polling Dir"
The files located in the polling directory should have an extension
of “xml”. All other files are ignored. Note that files in subdirectories
are also ignored.
If not specified, the application polls the default directory (
C:
\Acxmlaid
). If the specified or default directory cannot be found,
it is created. If the directory is invalid and cannot be created, the
application automatically shuts down or stops the service, as
appropriate. If you launch the XML Import Connector module
from the Start menu shortcut, the default directory is used as the
polling directory.
This option is ignored if the 
-Poll
option is not specified or
implied with the 
-Install
or 
-GUI
options.
TIFF to PDF Converter | Convert TIFF to PDF, Convert PDF to TIFF
PDF to TIFF Converter doesn't require other third-party such as Adobe Acrobat. speed for TIFF-PDF Conversion; Able to preserve text and PDF file's vector
erase text in pdf document; remove text from pdf reader
VB.NET PowerPoint: VB Code to Draw and Create Annotation on PPT
other documents are compatible, including PDF, TIFF, MS free hand, free hand line, rectangle, text, hotspot, hotspot more plug-ins needed like Acrobat or Adobe
how to delete text from a pdf document; how to erase text in pdf online
The XML Import Connector Module
Kofax Capture Administrator's Guide
247
Command Line Option
Description
-ControlDir:directory
Specifies the XML Import Connector control directory. The control
directory can be specified with an absolute, relative, or UNC
path. File names/paths containing spaces must be enclosed in
quotation marks. Example:
Acxmlai -Poll:60 -ControlDir:"C:\Control Dir" -
PollDir:"C:\Polling Dir"
If used, the XML Import Connector application polls the specified
control directory. If a file is found, the application then attempts
to locate a file with the same name and an “xml” extension in
the polling directory. If found, the XML file in the polling directory
is opened and processed. Note that files in subdirectories are
ignored.
This option is useful when another process is submitting XML
files to the polling directory. It prevents the XML Import Connector
application from reading XML files in a partially written state.
To use this feature, have your process write the XML file to the
polling directory first and then write a file to the control directory.
This indicates that the XML file is complete and ready to be
polled. Note that the control directory file contents are ignored and
may be of zero length.
After the XML file has been completely processed, theXML
Import Connector application deletes the file located in the control
directory. This occurs whether or not the XML file was processed
successfully.
If the specified control directory cannot be opened, it is created.
If not specified, the default directory (
C:\Acxmlaic
) is used.
If the directory is invalid and cannot be created, the application
automatically shuts down or stops the service, as appropriate.
This option is ignored if the 
-Poll
option is not specified or
implied with the 
-Install
or 
-GUI
options.
-NoLogo
Prevents the Kofax Capture splash screen from displaying when
the user interface is invoked with the 
-GUI
option. Example:
Acxmlai -GUI -NoLogo
This option is ignored if the 
-GUI
option is not specified.
-u:"UserID"
Specifies the Kofax Capture user ID. If specified, the user ID must
be enclosed in quotation marks. Example:
Acxmlai -Install -u:"Joe" -p:"abcd" -Poll
If the Kofax Capture User Profiles feature is enabled, the specified
user must have privileges to run the Scan module and all of
the batch classes used in the XML Import Connector file. In
addition, the password option must be specified with the 
-p
option
described below. If this is not the case, the error “User not found”
or “User not privileged” is generated.
Note that the user ID and password are not shared with other
processes on the same computer. This is different from other
Kofax Capture modules where the user logged in can open other
modules for which he has rights.
If specified, and User Profiles is not enabled, this option is
ignored. The batches are imported and no message regarding
User Profiles is generated.
If not specified, and User Profiles is enabled, the error “User not
found” is generated.
The XML Import Connector Module
248
Kofax Capture Administrator's Guide
Command Line Option
Description
-p:"Password"
Specifies the password for the operator specified with the 
-
u
option described above. If specified, the password must be
enclosed in quotation marks. A password must be specified if a
user ID is specified. Example:
Acxmlai -Install -u:"Joe" -p:"abcd" -Poll
Passwords specified in the XML Import Connector file are not
protected. To preserve the integrity of the password, you can
protect your files with operating system features. For example,
you can store the files in folders where only specific users have
read/write privileges.
-n
Specifies that batches with errors are rejected and sent to the
Quality Control module. Example:
Acxmlai -Install -Poll -n
If not specified, batches with errors are deleted. For more
information about deleting batches, see Error Handling
.
For some fatal errors, the current batch is always deleted, even if
the 
-n
command line option is used.
-v
Causes more details to be logged to the specified XML Import
Connectorlog file. Example:
Acxmlai -Install -Poll -v
If the 
-v
command line option is not used, only basic event
information is logged, which includes batch/file start and end
information and error messages. If 
-v
is used, page and
document events is also logged, which provides more verbose log
information.
Using this option could cause the log file to grow large quickly.
You should carefully monitor your log files and remove them as
necessary.
-l:logfile.txt
Specifies the XML Import Connector log file name. It can be
specified with an absolute, relative, or UNC path. File names/
paths containing spaces must be enclosed in quotation marks.
Example:
Acxmlai -i:XMLFile.xml -l:"C:\My Logs\Mylog.txt"
If not specified, or if the specified file cannot be opened, events
are logged to the default log file (
C:\Acxmlail.txt
).
If the 
-LogMonthly
option is specified, then this option is
ignored.
-LogMonthly:directory
Specifies the directory where the log file is to be written. All log
information is written to a file called 
XML_yymm.txt
, where yy
is the last two digits of the year and mm is the current month.
A new log is created when an XML file is processed for a new
month or year. It can be specified with an absolute, relative, or
UNC path. File names/paths containing spaces must be enclosed
in quotation marks. For example:
Acxmlai -LogMonthly:"C:\XML Log"
This option overrides any log file specified with the 
-l
option.
If a directory is not specified, the default directory (
C:\Acxmlail
)
is used. If the directory is invalid and cannot be created, the
application automatically shuts down or stops the service, as
appropriate.
The XML Import Connector Module
Kofax Capture Administrator's Guide
249
Command Line Option
Description
-MoveSuccess:directory
Specifies the directory to send XML files if batches in the XML
file were processed without errors. Note that any associated
image files are not moved. It can be specified with an absolute,
relative, or UNC path. File names/paths containing spaces must
be enclosed in quotation marks. Example:
Acxmlai -MoveSuccess:"C:\XML Success"
If a directory is not specified, the default directory (
C:\Acxmlai
\Success
) is used. If the directory is invalid and cannot be
created, the application automatically shuts down or stops the
service, as appropriate.
-MoveError:directory
Specifies the directory to send XML files if errors occur while
processing the XML file. Note that any associated image files are
not moved. It can be specified with an absolute, relative, or UNC
path. File names/paths containing spaces must be enclosed in
quotation marks. Example:
Acxmlai -MoveError:"C:\XML Error"
If a directory is not specified, the default directory (
C:\Acxmlai
\Errors
) is used. If the directory is invalid and cannot be
created, the application automatically shuts down or stops the
service, as appropriate.
-DelSuccess
Deletes the XML file and associated image files if all batches in
the XML file are processed without errors. Example:
Acxmlai -Poll -DelSuccess
This option overrides the 
-MoveSuccess
option, if specified.
-w:hWnd
This is the window handle of the application to receive an “auto-
import is complete” message. Specify the handle in decimal
format, rather than hexadecimal. This option is not required, but if
specified, it requires a message ID.
Note 
This form of notification is preserved for older applications.
Newer applications can use Windows process synchronization
facilities to achieve the same effect.
-m:MsgID
Specifies the ID of an “auto-import is complete” message,
which is sent to the window handle when the application is shut
down. Specify the message ID in decimal format, rather than
hexadecimal. Windows requires that this number be greater than
1024. This option is required if a window handle is specified with
the 
-w
option.
XML Import Connector Time-Out Setting
When shutting down Windows, Kofax CaptureXML Import Connector must be terminated
cleanly if it is running as a service and actively processing a batch. By default, the time-out
setting is set to 20000 milliseconds (20 seconds). Usually this default setting is acceptable.
However, if you have a computer that is slow or has numerous services running on it, you
may need to increase the default time-out setting. This can be changed by editing a key in the
Windows registry. With this key, you can modify the time-out setting.
To modify the time-out setting, change the 
WaitToKillServiceTimeout
value in the
following registry key:
The XML Import Connector Module
250
Kofax Capture Administrator's Guide
HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control
Note  Do not edit the registry unless you are qualified to do so. You can easily render your
system inoperable if you inadvertently corrupt the registry.
Elements and Attributes
The following sections provide reference information for the elements and attributes that
make up a Kofax Capture XML Import Connector file. Note the following:
▪ All element and attribute names are case-sensitive, which conforms to XML standards.
▪ Some of the attributes supported by the XML elements are read during the XML Import
Connector process, while others are written by the operation.
▪ The attributes that are read contain batch information, such as the name for the batch,
the batch class to use, and more.
▪ The attributes that are written contain error messages and process status information.
If the XML Import Connector process can be started for a batch, the 
<Batch>
element's
Processed attribute is set to “1”. If errors occur, error attributes will also be written.
When the XML Import Connector process is complete, you can examine the XML file for
errors and the status information.
<ImportSession> ... </ImportSession>
The 
<ImportSession>
element is the top-level element for the XML Import Connector file,
and serves as a container for all other elements. It is required, and supports the following
attributes. Note that some of the attributes are read during the XML Import Connector
operation. Other attributes are written by the operation.
Note  Some of the functionality supported by the 
<ImportSession>
attributes can be enabled
with command line options. However, the attributes set for the 
<ImportSession>
element
override the command line setting.
Attribute Name/
(Read/Write)
Type
Description
UserID
(Read)
String
Specifies a user ID for the XML Import Connector operation;
used if the Kofax Capture User Profiles feature is selected. It
behaves the same as the command line option for specifying
a user ID (the 
-u
option).
Note that if the user ID is specified for the
<ImportSession>
element and on the command line, the
user ID specified for 
<ImportSession>
is used.
Password
(Read)
String
Specifies a password for the XML Import Connector
operation; used if the Kofax Capture User Profiles feature is
enabled and a user ID is specified. It behaves the same as
the command line option for specifying a password (the 
-p
option).
Note that if a password is specified for the
<ImportSession>
element and on the command line, the
password specified for 
<ImportSession>
is used.
Documents you may be interested
Documents you may be interested