working with pdf in c# : How to add bookmarks to pdf document application Library utility html asp.net wpf visual studio Alt%20Media%20Workflow%20Strategies%20for%20PDF%2020123-part498

29 
The Basics of ABBYY FineReader 
ABBYY USA  
47221 Fremont Boulevard 
Fremont, CA 94538  
510-226-6717  
www.abbyyusa.com 
Understanding Blocks 
When FineReader analyzes the layout of a document, it will create blocks, which are areas 
of text or images or tables. You can choose which blocks to include in your final 
document, giving you excellent control over how to handle graphics, sidebars, captions, 
and other text not part of the main flow of the document.  
Creating a Template 
If you have a book with a standard layout, you can save your block configuration as a 
template and use that template to OCR the book. Setting up a template in the first place 
takes a bit of time, but in the long run, it will save you more time with a standard project. 
Templates do not work well if the layout differs greatly from one page to another. 
Reading aPDF 
FineReader can read PDFs. It treats PDFs in the same way it would any image file. After you 
have run optical character recognition on the file, you can save it as ASCII or Word or 
HTML. The full version FineReader is fine; you do not need to purchase the special PDF 
reader. Taht functionality is built into the OCR program. 
Processing an Image (TIFF or PDF) File 
Step One: Open an Image 
How to add bookmarks to pdf document - add, remove, update PDF bookmarks in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your C# Project with Rapid PDF Internal Navigation Via Bookmark and Outline
export pdf bookmarks to text; bookmark pdf in preview
How to add bookmarks to pdf document - VB.NET PDF bookmark library: add, remove, update PDF bookmarks in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your VB.NET Project with Rapid PDF Internal Navigation Via Bookmark and Outline
creating bookmarks in a pdf document; how to add bookmarks on pdf
30 
Step Two: Analyze Layout 
Use the Analyze Layout option (under Process) first on complex layouts then read the 
pages. Otherwise, if you read first then make adjustments to the blocks, you will have to 
read the page again for all the changes to take affect. 
C# PDF File Compress Library: Compress reduce PDF size in C#.net
Bookmarks. Comments, forms and multimedia. Flatten visible layers. C#.NET DLLs: Compress PDF Document. Add necessary references: RasterEdge.Imaging.Basic.dll.
how to create bookmark in pdf automatically; add bookmarks pdf
VB.NET PDF File Split Library: Split, seperate PDF into multiple
Add necessary references: how to split a PDF file into multiple ones by PDF bookmarks or outlines Split PDF Document into Multiple PDF Files Demo Code in VB.NET.
bookmarks in pdf files; creating bookmarks in pdf files
31 
Step Three: Adjust Blocks 
Use the tools to add to or delete blocks. To reorder zones, right click and change the 
properties. 
C# PDF File Split Library: Split, seperate PDF into multiple files
Add necessary references: codes explain how to split a PDF file into multiple ones by PDF bookmarks or outlines Split PDF Document into Multiple PDF Files in C#.
add bookmarks to pdf reader; bookmark pdf acrobat
VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
Compress & decompress PDF document file while maintaining original content of target PDF document file. Remove bookmarks, annotations, watermark, page labels
create bookmarks pdf; adding bookmarks to pdf document
32 
Step Four: Read All 
.NET PDF SDK - Description of All PDF Processing Control Feastures
Full page navigation, zooming & rotation; Outlines, bookmarks, & thumbnail display; Insert and add text to any page of PDF document with defined location;
bookmarks pdf reader; export pdf bookmarks to text file
C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
toolkit SDK, preserves all the original anchors, links, bookmarks and font How to Use C#.NET Demo Code to Convert PDF Document to HTML5 Add necessary references
create bookmarks in pdf; add bookmark pdf
33 
Step Five: Check Spelling 
Step Six: Save the Document 
Note that you can adjust your settings for a specific format by clicking on “Formats 
Settings.” To avoid text boxes, save the layout as “Tables, paragraphs, fonts.” 
How to C#: Basic SDK Concept of XDoc.PDF for .NET
Document Protect. You may add PDF document protection functionality into your C# program. OutLines. This class describes bookmarks in a PDF document.
excel hyperlink to pdf bookmark; bookmarks pdf files
XDoc.Excel for .NET, Comprehensive .NET Excel Imaging Features
page navigation, zooming & rotation; Outlines, bookmarks, & thumbnail Convert Excel to PDF; Convert Excel to HTML5; Convert Add a blank page or multiple pages to
creating bookmarks in pdf from word; create bookmarks pdf files
34 
FineReader Tips 
Zoom window: FineReader has a zoom window (View > Zoom Window) that allows you 
to enlarge selected areas of the image or text. 
Stop spell check: To tell the program just to find OCR errors and not unknown words, go 
to Tools > Options > Check Spelling. Uncheck "Stop at words not found in dictionary." 
Reordering blocks: To make reordering blocks simple, add the shortcut to the Image 
Tools. Go to View > Toolbars > Customize. Choose as Categories "Image" and as Toolbar 
"Image Tools." Under "Commands" choose Renumber blocks. Click the arrow to move it 
onto the toolbar. Click close. 
Save to file: Use the Save to file option to save as PDF, HTML, etc. 
Formats settings: Tools > Format settings gives you access to a lot of controls designed to 
customize how your documents will export. Note especially the choice to delete optional 
hyphens before going to Word. 
Eraser: The eraser tool allows you to edit the underlying TIFF file by deleting pixels (i.e., 
changing black to white). If you wish to save the changes, go under File to Save Image As. 
35 
The Basics on OmniPage Pro 
OmniPage Pro 
Nuance  
1 Wayside Road 
Burlington, MA 01803 
United States 
Tel: 781-565-5000 
Fax: 781-565-5001 
http://www.nuance.com/omnipage/ 
Understanding zones 
Zones allow you to tell OmniPage where on the page you want it to recognize text and 
where you want it to ignore text. This process allows you to strip out headers and footers 
while keeping the page numbers. It also allows you to tell the program not to look for text 
in graphics. 
You can save your zone configuration as a template, and use that template to scan a book. 
Setting up a template in the first place takes a bit of time, but in the long run, it will save 
you more time. 
Creating a template 
We start out by scanning a few test pages using the manual setting. Once the scanning is 
complete, just say "No" to the save as window. 
If you let OmniPage find the zones itself, it will see each block of text as a separate entity. 
You want it to view the text as a continuous stream.  
The template will have areas for the page number on left-hand pages, the page number on 
right-hand pages, the main block of text, and the area where we tell the program to ignore 
what is in that space (the header).  
When you scan the rest of the book, you load the template you have created, and the text 
blocks come through very cleanly with very little editing required. 
Reading PDF 
OmniPage can read PDFs. It runs a virtual scan on them and recognizes the text. Once you 
have the text in OmniPage, you can save it as an ASCII or Word file. 
36 
Creating PDFs 
One of the tools that OmniPage provides is the option to schedule OCR processing. If you 
have Adobe Acrobat on the machine, this same tool can be used to schedule automatic 
conversion of documents to PDF. 
Creating TIFFs 
You can load a PDF file into OmniPage (step one > load files) and then save it directly to a 
TIFF files (step 3 > save to file > Image > TIFF). You do not run OCR (step 2). This trick 
can be helpful if you want to load TIFFs into Kurzweil, rather than PDFs. Kurzweil can 
sometimes create very, very large KESI files when the initial format is a PDF. Changing 
the PDF to a TIFF before processing with Kurzweil circumvents that problem and reduces 
the size of the final file. In addition, the KESI Automater works quite well with TIFF files 
and less well with PDF files. 
37 
Using OmniPage Pro 
Interface 
Step One: Load a File 
Step Two: Run the OCR 
Be sure to select the pages before running the OCR. Click on the first thumbnail and use 
CTRL + A to select all. 
38 
Step Three: Adjust Zones 
Use the "on-the-fly" tool to redraw zones.  
Documents you may be interested
Documents you may be interested