load pdf file asp.net c# : Extract images pdf acrobat control Library system azure asp.net winforms console DocuXplorer-Manual28-part1472

© Copyright 1995 - 2016 Archive Power Systems Inc./ DocuXplorer Software 
Optical Character Recognition 
Optical Character Recognition 
This Help topic refers to the following editions: 
Enterprise 
Professional 
Personal 
 
Small Business 
DocuXplorer provides an effective method to convert scanned documents to text via Optical Character Recognition technology. 
This technology is provided two methods. The first is to OCR an entire document or to OCR specific areas of a document called 
Zonal OCR. 
OCR a Document: 
The primary purpose of this feature is to allow users to locate document by their content but we highly recommend that Index 
Sets be used to identify documents accurately for long term storage and retrieval. DocuXplorer provide Taxonomy service to 
insure you'll be able to locate your documents today and years from now with ease. 
Zones OCR: 
Zonal OCR is the process by which Optical Character Recognition "read" specifically zoned text from a scanned image. This 
process allows the end user to identify and draw a "zone" on a image to be recognized. Once the zone has been established on 
the image, this zone will be applied to each image processed so that the data can be extracted from the image file and converted 
to a ASCII format. 
Tip: 
PDF documents can only be OCR'd in Adobe Acrobat. The OCR text from a PDF document is proprietary and not full text 
searchable. 
Extract images pdf acrobat - Select, copy, paste PDF images in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
how to extract a picture from a pdf; extract images from pdf
Extract images pdf acrobat - VB.NET PDF Image Extract Library: Select, copy, paste PDF images in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract image from pdf in; extract images pdf acrobat
© Copyright 1995 - 2016 Archive Power Systems Inc./ DocuXplorer Software 
OCR a Document 
This Help topic refers to the following editions: 
Enterprise 
Professional 
Personal 
 
Small Business 
Requirement: 
To OCR a document the files should be a .tiff file with a resolution of 200dpi or higher in Black & White or Gray Scale. 
To OCR an Image Document: 
Open the Image Document Window 
If the document has more than one page select the page or pages to be process via thumbnail viewer 
From the Tools Menu select OCR selected Pages 
Once the information has been processed the OCR Text tab will automatically be selected so you can see the result of 
the OCR process 
The quality of the OCR results can be improved by scanning at a higher resolution or changing the contrast levels. Scanning 
resolution levels should be between 200 and 300dpi. 
Document OCR helps to automate data extraction from digital images. However, zonal OCR, and OCR in general, is not entirely 
accurate and review of the extracted data will be required. 
.NET PDF Document Viewing, Annotation, Conversion & Processing
Extract hyperlink inside PDF. PDF Write. Redact text content, images, whole pages from PDF file. Edit, update, delete PDF annotations from PDF file. Print.
pdf extract images; pdf image text extractor
C# PDF Converter Library SDK to convert PDF to other file formats
other external third-party dependencies like Adobe Acrobat. NET supports file conversion between PDF and various documents and images, like Microsoft
extract photos from pdf; extract image from pdf
© Copyright 1995 - 2016 Archive Power Systems Inc./ DocuXplorer Software 
C# Windows Viewer - Image and Document Conversion & Rendering in
in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Convert to PDF. Convert to Various Images.
extract pictures pdf; extract image from pdf acrobat
C# powerpoint - PowerPoint Conversion & Rendering in C#.NET
without using other external third-party dependencies like Adobe Acrobat. 2003, 2007 and above versions, raster images (Jpeg, Png PowerPoint to PDF Conversion.
how to extract pictures from pdf files; how to extract a picture from a pdf
© Copyright 1995 - 2016 Archive Power Systems Inc./ DocuXplorer Software 
Select an area on a page for OCR 
This Help topic refers to the following editions: 
Enterprise 
Professional 
Personal 
 
Small Business 
In the Image Document Window: 
To OCR a selected area in an image document: 
Use the OCR Zone Cursor to select the area of text on the page you wish to convert to text. 
Drag your mouse over the area to be converted 
C# Word - Word Conversion in C#.NET
without using other external third-party dependencies like Adobe Acrobat. document, including Jpeg, Png, Bmp, Gif images, .NET Graphics PDF to Word Conversion.
extract pdf pages to jpg; extract images from pdf online
JPEG to PDF Converter | Convert JPEG to PDF, Convert PDF to JPEG
Features and Benefits. Powerful image converter to convert images of JPG, JPEG formats to PDF files; No need for Adobe Acrobat Reader; Seamlessly integrated into
extract text from image pdf file; how to extract images from pdf
© Copyright 1995 - 2016 Archive Power Systems Inc./ DocuXplorer Software 
In the Tools menu click OCR 
In the Page Range section of the OCR dialog box choose Selection 
PDF to WORD Converter | Convert PDF to Word, Convert Word to PDF
No need for Adobe Acrobat and Microsoft Word; Has built-in wizard to guide your Open PDF to Word Convert first; Load PDF images from local folders in "File" in
extract color image from pdf in c#; extract photos pdf
C# Excel - Excel Conversion & Rendering in C#.NET
without using other external third-party dependencies like Adobe Acrobat. PPT) 2003, 2007 and above versions, raster images (Jpeg, Png Excel to PDF Conversion.
extract image from pdf java; extract image from pdf online
© Copyright 1995 - 2016 Archive Power Systems Inc./ DocuXplorer Software 
Click OK 
Notes 
When you OCR text in text zones only, the converted text is single-column, 
The sequence number in the upper left corner of the zone indicates the order in which text zones are 
processed by OCR, and therefore the order in which they appear in the converted document. You can change 
the sequence number to reorder text block processing and output. Select the zone and click the right mouse 
button, then click Properties. 
If zones overlap, shared areas are processed with the top zone, that is, the zone with the lower zone number. 
If you are converting a scanned black and white document, remove speckles before you convert. 
GIF to PDF Converter | Convert GIF to PDF, Convert PDF to GIF
and convert PDF files to GIF images with high quality. It can be functioned as an integrated component without the use of external applications & Adobe Acrobat
extract jpg pdf; how to extract images from pdf file
DICOM to PDF Converter | Convert DICOM to PDF, Convert PDF to
organized interface, allowing users to convert DICOM (DICOM) images to, from PDF documents with converters, users do not need to load Adobe Acrobat or any
some pdf image extract; online pdf image extractor
© Copyright 1995 - 2016 Archive Power Systems Inc./ DocuXplorer Software 
Specifying an OCR Training File 
This Help topic refers to the following editions: 
Enterprise 
Professional 
Personal 
 
Small Business 
To specify an OCR training file: 
From the Tools item of the Menu Bar, and click Optical Character Recognition. 
Click Options. 
In the Training file box, click the file you want to use, or click Browse to specify another file. If you specify 
None as the training file, training does not occur. 
Tips: 
The Standard training file is empty when Imaging is installed, and so initially contains no data for effective 
training. You can add words to the file during interactive training. 
The training file you specify is used to improve recognition every time you do OCR. However, to do interactive 
training and to add words to the training file, you must first enable interactive training and then initiate OCR on 
the Tools menu. 
OCR is faster when training is not occurring. To speed up the OCR process, specify None as the training file. 
A training file compares characters, while an OCR dictionary compares words. To further improve conversion 
results, also specify an OCR dictionary to verify acronyms and special terminology. 
© Copyright 1995 - 2016 Archive Power Systems Inc./ DocuXplorer Software 
Training OCR 
This Help topic refers to the following editions: 
Enterprise 
Professional 
Personal 
 
Small Business 
Training the OCR process: 
To improve OCR results, train the OCR process to recognize characters more consistently each time they are encountered. To 
train the OCR process, specify a training file that contains training information. 
A training file matches patterns. The contents of a training file are special characters that are difficult to recognize during OCR. 
To improve conversion results, the reliable characters of a training file are compared with questionable characters in the input 
document. 
The Standard training file that is included with DocuXplorer is initially empty. To place training information in it, you add to it 
interactively, during the OCR process. You can also create a new training file , and add to it during interactive training. In fact, it 
can be useful to build several training files, containing different information, for recognizing distinctive fonts or special characters 
in different categories of files. 
Interactive training consists of specifying a training file, enabling interactive training , then monitoring the OCR process and 
seeing the words that are designated as questionable. When a highlighted questionable word appears, you can correct it and 
add it to the training file, and so continue to improve word recognition in subsequent OCR sessions. 
After you have information in a training file, and you specify that file for training , training occurs each time you do OCR, whether 
or not you do interactive training. For example, when you OCR from the toolbar or from the Edit menu, with Copy As Text, 
training occurs automatically in the background, although data is not added to the training file. That is, when you specify a 
training file, the contents of the file are always used for comparison during OCR of the input document. 
© Copyright 1995 - 2016 Archive Power Systems Inc./ DocuXplorer Software 
Enable Interactive Training in the OCR Process 
This Help topic refers to the following editions: 
Enterprise 
Professional 
Personal 
 
Small Business 
To enable interactive OCR training: 
From the Tools item of the Menu Bar, click Optical Character Recognition. 
Click Options. 
Verify that a file name appears in the Training file box. If you specify None, you cannot enable training. 
Click the Enable interactive training box to check it. 
Tips: 
To do interactive training and to add words to the training file, you must Initiate OCR from the Tools menu. 
The training file you specify is used to improve recognition every time you do OCR, regardless of how you 
initiate the process, and whether or not you do interactive training. 
© Copyright 1995 - 2016 Archive Power Systems Inc./ DocuXplorer Software 
Create an OCR Training File 
This Help topic refers to the following editions: 
Enterprise 
Professional 
Personal 
 
Small Business 
To create an OCR training file: 
From the Tools item of the Menu Bar, click Optical Character Recognition. 
Click Options. 
In the Save in box, click the location where you want to keep the training file. 
Below the Save in box, double-click the folder you want for the training file. 
Type the name of the new, empty training file in the File name box, and click Save. 
Tips: 
You can add training information to a training file during interactive training. You cannot edit the file. 
You can improve conversion results by creating and using different training files for different categories of 
documents with similar terms or special characters. For example, if you regularly scan documents with 
distinctive font styles, include samples of them in a training file. 
Documents you may be interested
Documents you may be interested