devexpress pdf viewer asp.net mvc : Copying a pdf page into word Library software component .net winforms azure mvc Alt%20Media%20Workflow%20Strategies%20for%20PDF%2020123-part86

29 
The Basics of ABBYY FineReader 
ABBYY USA  
47221 Fremont Boulevard 
Fremont, CA 94538  
510-226-6717  
www.abbyyusa.com 
Understanding Blocks 
When FineReader analyzes the layout of a document, it will create blocks, which are areas 
of text or images or tables. You can choose which blocks to include in your final 
document, giving you excellent control over how to handle graphics, sidebars, captions, 
and other text not part of the main flow of the document.  
Creating a Template 
If you have a book with a standard layout, you can save your block configuration as a 
template and use that template to OCR the book. Setting up a template in the first place 
takes a bit of time, but in the long run, it will save you more time with a standard project. 
Templates do not work well if the layout differs greatly from one page to another. 
Reading aPDF 
FineReader can read PDFs. It treats PDFs in the same way it would any image file. After you 
have run optical character recognition on the file, you can save it as ASCII or Word or 
HTML. The full version FineReader is fine; you do not need to purchase the special PDF 
reader. Taht functionality is built into the OCR program. 
Processing an Image (TIFF or PDF) File 
Step One: Open an Image 
Copying a pdf page into word - Library software component:C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Easy to Use C# Code to Extract PDF Pages, Copy Pages from One PDF File and Paste into Others
www.rasteredge.com
Copying a pdf page into word - Library software component:VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Detailed VB.NET Guide for Extracting Pages from Microsoft PDF Doc
www.rasteredge.com
30 
Step Two: Analyze Layout 
Use the Analyze Layout option (under Process) first on complex layouts then read the 
pages. Otherwise, if you read first then make adjustments to the blocks, you will have to 
read the page again for all the changes to take affect. 
Library software component:C# PDF copy, paste image Library: copy, paste, cut PDF images in
etc. High quality image can be saved after cutting, copying and pasting into PDF page in .NET console application. Guarantee high
www.rasteredge.com
Library software component:VB.NET PDF copy, paste image library: copy, paste, cut PDF images
DNN (DotNetNuke), SharePoint. High quality image can be saved after cutting, copying and pasting into PDF page. Empower to cut, copy
www.rasteredge.com
31 
Step Three: Adjust Blocks 
Use the tools to add to or delete blocks. To reorder zones, right click and change the 
properties. 
Library software component:C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
C# source code is available for copying and using in with specified zoom value and save it into stream zoomValue, The magnification of the original PDF page size
www.rasteredge.com
Library software component:C# PDF File & Page Process Library SDK for C#.net, ASP.NET, MVC
Copying and Pasting Pages. to copy and get a specific page of PDF file; you can also copy and paste pages from a PDF document into another PDF file Rotating Page.
www.rasteredge.com
32 
Step Four: Read All 
Library software component:C# PDF File Permission Library: add, remove, update PDF file
Copy, Paste, Cut Image in Page. Link: Edit passwordSetting.IsExtract = true; // Copying is allowed. passwordSetting.IsCopy = true; // PDF document assembling is
www.rasteredge.com
Library software component:VB.NET PDF File & Page Process Library SDK for vb.net, ASP.NET
PDF Pages Extraction, Copying and Pasting. use specific APIs to copy and get a specific page of PDF also able to copy and paste pages from a PDF document into
www.rasteredge.com
33 
Step Five: Check Spelling 
Step Six: Save the Document 
Note that you can adjust your settings for a specific format by clicking on “Formats 
Settings.” To avoid text boxes, save the layout as “Tables, paragraphs, fonts.” 
Library software component:VB.NET PDF File Permission Library: add, remove, update PDF file
PDF Page. Image: Copy, Paste, Cut Image in Page. passwordSetting.IsExtract = True ' Copying is allowed passwordSetting.IsCopy = True ' PDF document assembling is
www.rasteredge.com
Library software component:C# HTML5 PDF Viewer SDK to view, annotate, create and convert PDF
Able to protect PDF document from editing, printing, copying and commenting by in ASP.NET, edit images on PDF document, edit PDF document page in ASPX
www.rasteredge.com
34 
FineReader Tips 
Zoom window: FineReader has a zoom window (View > Zoom Window) that allows you 
to enlarge selected areas of the image or text. 
Stop spell check: To tell the program just to find OCR errors and not unknown words, go 
to Tools > Options > Check Spelling. Uncheck "Stop at words not found in dictionary." 
Reordering blocks: To make reordering blocks simple, add the shortcut to the Image 
Tools. Go to View > Toolbars > Customize. Choose as Categories "Image" and as Toolbar 
"Image Tools." Under "Commands" choose Renumber blocks. Click the arrow to move it 
onto the toolbar. Click close. 
Save to file: Use the Save to file option to save as PDF, HTML, etc. 
Formats settings: Tools > Format settings gives you access to a lot of controls designed to 
customize how your documents will export. Note especially the choice to delete optional 
hyphens before going to Word. 
Eraser: The eraser tool allows you to edit the underlying TIFF file by deleting pixels (i.e., 
changing black to white). If you wish to save the changes, go under File to Save Image As. 
Library software component:C# TIFF: C#.NET Code to Process TIFF, RasterEdge XDoc.Tiff for .
TIFF, JPEG, GIF, BMP, PNG, PDF, Word and DICOM. inserting, deleting, TIFF file page reordering, merging still supports rotating, resizing, copying and pasting
www.rasteredge.com
35 
The Basics on OmniPage Pro 
OmniPage Pro 
Nuance  
1 Wayside Road 
Burlington, MA 01803 
United States 
Tel: 781-565-5000 
Fax: 781-565-5001 
http://www.nuance.com/omnipage/ 
Understanding zones 
Zones allow you to tell OmniPage where on the page you want it to recognize text and 
where you want it to ignore text. This process allows you to strip out headers and footers 
while keeping the page numbers. It also allows you to tell the program not to look for text 
in graphics. 
You can save your zone configuration as a template, and use that template to scan a book. 
Setting up a template in the first place takes a bit of time, but in the long run, it will save 
you more time. 
Creating a template 
We start out by scanning a few test pages using the manual setting. Once the scanning is 
complete, just say "No" to the save as window. 
If you let OmniPage find the zones itself, it will see each block of text as a separate entity. 
You want it to view the text as a continuous stream.  
The template will have areas for the page number on left-hand pages, the page number on 
right-hand pages, the main block of text, and the area where we tell the program to ignore 
what is in that space (the header).  
When you scan the rest of the book, you load the template you have created, and the text 
blocks come through very cleanly with very little editing required. 
Reading PDF 
OmniPage can read PDFs. It runs a virtual scan on them and recognizes the text. Once you 
have the text in OmniPage, you can save it as an ASCII or Word file. 
36 
Creating PDFs 
One of the tools that OmniPage provides is the option to schedule OCR processing. If you 
have Adobe Acrobat on the machine, this same tool can be used to schedule automatic 
conversion of documents to PDF. 
Creating TIFFs 
You can load a PDF file into OmniPage (step one > load files) and then save it directly to a 
TIFF files (step 3 > save to file > Image > TIFF). You do not run OCR (step 2). This trick 
can be helpful if you want to load TIFFs into Kurzweil, rather than PDFs. Kurzweil can 
sometimes create very, very large KESI files when the initial format is a PDF. Changing 
the PDF to a TIFF before processing with Kurzweil circumvents that problem and reduces 
the size of the final file. In addition, the KESI Automater works quite well with TIFF files 
and less well with PDF files. 
37 
Using OmniPage Pro 
Interface 
Step One: Load a File 
Step Two: Run the OCR 
Be sure to select the pages before running the OCR. Click on the first thumbnail and use 
CTRL + A to select all. 
38 
Step Three: Adjust Zones 
Use the "on-the-fly" tool to redraw zones.  
Documents you may be interested
Documents you may be interested