open pdf file c# : How to add text fields to a pdf document software SDK dll windows wpf asp.net web forms 09_chapter%2024-part263

Chapter 2 
56 
3. 
CustomOCR 
CustomOCR read text from scanned documents, webcam images of  license 
plates or photo camera images of bank checks [95]. 
CustomOCR solutions can be installed in two variants, local and cloud-hosted, 
each of which has its own advantages. 
Local Installation: - It allows to install CustomOCR solution locally, to ensure 
the best performance in time-critical applications and the tightest integration 
with  application  components.  For  local  installations  a  compiled  executable 
(Windows or Linux) file is used, which is a console application. It has very 
light-weight  startup  code,  so  it  can  be  run  for  every  image  separately  and 
multiple instances can be run in parallel. Input parameters and image names 
can be specified via command line or a config file, or taken from a specified 
directory on the hard drive or from a network location [95]. 
Cloud-hosted Installation: - This type of installation fits well for applications 
which allow for longer response times, and boasts unlimited scalability in the 
sense of processing power. In this case, text extraction solution is hosted on 
our server located in the Amazon EC2 cloud. Application will communicate 
with the CustomOCR server via the Internet using a Restful protocol, which is 
in fact no more than a set of ordinary HTTP requests. To send an image, you 
Figure 2.19 Screenshot of i2OCR  
How to add text fields to a pdf document - insert text into PDF content in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
XDoc.PDF for .NET, providing C# demo code for inserting text to PDF file
add text pdf acrobat; add text to pdf in acrobat
How to add text fields to a pdf document - VB.NET PDF insert text library: insert text into PDF content in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Providing Demo Code for Adding and Inserting Text to PDF File Page in VB.NET Program
adding text to a pdf; add text pdf file
Chapter 2 
57 
will need to wrap it into a POST request and send it to the CustomOCR server. 
To obtain results, you'll  send one or more GET  requests and download the 
files containing your processing results [95]. 
4. 
WeOCR 
WeOCR  is  a  platform  for  Web-enabled  OCR  (Optical  Character 
Reader/Recognition) systems that enables people to use character recognition 
over networks [92]. OCRextrACT is an online access  to the tesseract  via a 
WeOCR interface. 
2.3.2  GOCR Tool 
GOCR is again a Command based tool same as Tesseract, it is also used as a 
backend to other programs. GOCR is an OCR (Optical Character Recognition) 
Figure 2.20 Screenshot of CustomOCR
Figure 2.21 Screenshot of WeOCR 
VB.NET PDF Form Data Read library: extract form data from PDF in
featured PDF software, it should have functions for processing text, image as Add necessary references Demo Code to Retrieve All Form Fields from a PDF File in
how to insert text into a pdf with acrobat; how to add text to a pdf file
C# PDF Form Data Read Library: extract form data from PDF in C#.
Able to retrieve all form fields from adobe PDF file in C# featured PDF software, it should have functions for processing text, image as Add necessary references
add text box to pdf file; how to insert text in pdf using preview
Chapter 2 
58 
program,  developed  under  the  GNU  Public  License.  It  converts  scanned 
images to text files. Joerg Schulenburg started the program, and now leads a 
team of developers [96]. GOCR program is written in C language and it runs 
on Linux, Windows and OS/2 platform. 
It is a  simple and fast engine which does not require any training data. Its 
recognition process takes two passes. In first pass, entire document is called. 
In second pass the unknown characters are called [97] [98]. 
GOCR claims it can handle single-column sans-serif fonts of 20–60 pixels in 
height. It reports trouble with serif fonts, overlapping characters, handwritten 
text,  heterogeneous  fonts,  noisy  images,  large  angles  of  skew,  and  text  in 
anything other than a Latin alphabet. GOCR can also translate barcodes [99] 
[100]. 
2.3.3  Other Desktop OCR Software 
There  are  also  other  desktop  OCR  software  are  available.  Researcher  has 
studied following Desktop OCR software. 
1. 
Simple OCR 
2. 
ABBYY FineReader 11 
3. 
Transym OCR (TOCR) 
4. 
Free OCR to Word 
5. 
Image to OCR Converter 
6. 
A2ia 
Above software are discussed in detail. 
1. 
Simple OCR 
Simple  OCR  is  desktop  Software.  It  is  a  proprietary optical  character 
recognition application  developed  originally  by  Cyril  Cambien  of  France 
under  the  title  WOCAR  (until  v2.5  in  2001)  [102].  Simple  OCR  offers 
VB.NET PDF insert image library: insert images into PDF in vb.net
try with this sample VB.NET code to add an image As String = Program.RootPath + "\\" 1.pdf" Dim doc New PDFDocument(inputFilePath) ' Get a text manager from
how to enter text in pdf form; adding text to pdf in preview
C# PDF insert image Library: insert images into PDF in C#.net, ASP
Create high resolution PDF file without image quality losing in ASP.NET application. Add multiple images to multipage PDF document in .NET WinForms.
add text to pdf file reader; add text field to pdf
Chapter 2 
59 
Machine print and Hand written Recognition. It provides unlimited license for 
machine print engine but for hand written engine only 14 days. Simple OCR 
uses its own OCR engine that is capable of learning the fonts in a particular 
document  [102].  It  is  a  free  for  all  non-commercial  purposes.  It  converts 
.TIFF, .JPG and .BMP file into .DOC or .TXT file. It is 32 bit application. 
Simple  OCR  gives  facility  to  interactive  correction  with  suggestions  from 
dictionary. Simple OCR has the ability to capture and retain pictures from the 
document.  It  includes  both  single  file  and  batch  of  files  processing  mode 
[102]. Simple OCR gives facility to extract the text from a certain area in a 
document; there is no need to OCR an entire document only to use a small 
portion of it. With Simple OCR, OCR only what you need [103]. 
Simple OCR cannot convert PDF file into text file. Font and format detection 
is not possible in simple OCR [103]. Simple OCR handles only bi-level (black 
& white) and grayscale images. 
 
How it Works? 
I. 
As  shown  in  the  Figure  2.22,  select  either  Machine  Print  or  Hand 
Writing. Machine Print is used to convert printed document into text file and 
Hand Writing is used to convert handwritten document to text file. 
Figure 2.22 Screenshot of Simple OCR 
C# PDF Password Library: add, remove, edit PDF file password in C#
in C#.NET framework. Support to add password to PDF document online or in C#.NET WinForms for PDF file protection. Able to create a
add text pdf reader; add text boxes to a pdf
VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net
Text in any PDF fields can be copied and pasted batch converting PDF to editable & searchable text formats. Convert PDF document page to separate text file in
add text boxes to pdf; how to add text to pdf
Chapter 2 
60 
II. 
Adds Page – Select an image file. 
III.  Convert to text- Perform OCR. 
2. 
ABBYY FineReader 11 
ABBYY Fine Reader 11 efficiently converts an image file or PDF file into 
editable and searchable text file. Fine Reader creates e-books from scans of 
paper documents, PDFs and digital photographs.  
ABBYY  Fine  Reader  Engine is  an OCR  SDK  that  gives  developers, 
integrators and BPOs the tools they require to integrate optical text recognition 
technologies  into  their  applications. The  ABBYY  recognition  platform 
delivers award-winning OCR, intelligent character recognition (ICR), barcode, 
checkmark,  field-level/zonal  recognition  and  PDF  conversion  enabling 
scanned documents and images to be transformed into searchable and editable 
document formats. 
Fine  Reader  11  precisely  re-creates  multi-page  document  structures  and 
formatting, including text size and font styles, tables and diagrams, columns, 
headers, footers, footnotes, page numbers and more. A user-friendly interface 
Figure 2.23 Screenshot of Simple OCR Process 
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
Merge PDF with byte array, fields. PDF page deleting, PDF document splitting, PDF page reordering and PDF page image and text extraction Add necessary references
adding text to pdf file; adding text to a pdf document
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
Merge PDF with byte array, fields. Merge PDF without size limitation. Add necessary references: VB.NET Demo code to Append PDF Document.
adding a text field to a pdf; add text to pdf document online
Chapter 2 
61 
and pre-defined, automated tasks increase efficiency and eliminate the need 
for complicated routines and settings. 
ABBYY  Fine  Reader  based  on  three  fundamental  principles:  Integrity, 
Purposefulness  and  Adaptability.  The  principle  of  integrity  says  that  the 
observed object must always be considered as a “whole” consisting of many 
interrelated  parts.  The  principle  of  purposefulness  supposes  that  any 
interpretation of data must always serve some purpose. And the principle of 
adaptability means that the program must be capable of self-learning [104]. 
Let’s take a look on how Fine Reader OCR recognizes text. First, the program 
analyzes the structure of document image. It divides the page into elements 
such as blocks of texts, tables, images, etc. The lines are divided into words 
and  then  into  characters.  Once  the  characters  have  been  singled  out,  the 
program compares them with a set of pattern images. It advances numerous 
hypotheses  about  what  this  character  is.  Basing  on  these  hypotheses  the 
program analyzes different variants of breaking of lines into words and words 
into  characters.  After  processing  huge  number  of  such  probabilistic 
hypotheses,  the  program  finally  takes  the  decision,  presenting  you  the 
recognized text [104]. 
ABBYY Fine  Reader 11 detects any combination of 189 languages  to help 
you expand your global capabilities. Fine Reader 11 supports a wide range of 
output formats. The results can also be sent directly to applications such as 
Microsoft Word, Excel and PowerPoint, Adobe Acrobat, Corel WordPerfect 
and OpenOffice.org Writer [105]. 
ABBYY Fine Reader is free for only 30 days and allows processing of up to 
100 pages. It exports or saves maximum 3 pages to an external application at a 
time. 
VB.NET PDF Password Library: add, remove, edit PDF file password
allowed. passwordSetting.IsCopy = True ' Allow to assemble document. passwordSetting.IsAssemble = True ' Add password to PDF file.
how to add text box in pdf file; how to add text field to pdf
VB.NET PDF Text Extract Library: extract text content from PDF
With this advanced PDF Add-On, developers are able to extract target text content from source PDF document and save extracted text to other file formats
adding text to pdf document; adding text pdf files
Chapter 2 
62 
 
How it Works? 
I. 
Open- Open image or PDF file. 
II. 
Read - Perform OCR. 
III.  Send - Save or Send document.  
3. 
Transym OCR (TOCR) 
Transym  OCR is  one  of  the  proprietary  optical  character  recognition tools, 
which  provides  the  good  amount  of  accuracy.  Transym  coverts  the  color 
images to gray scale images then does the OCR of these images. So we do not 
need to convert color image to grayscale while using Transym [106].  It reads 
broken, blurred and obscure characters. It allows to format output text. 
 
How it Works? 
I. 
Open an image file from File menu. 
Figure 2.24 Screenshot of ABBYY Fine Reader 11 
Chapter 2 
63 
II. 
OCR Image- To Perform OCR. 
4. 
Free OCR to Word 
Free OCR to Word software is a simple and basic functionality OCR program. 
Free OCR to Word program works with any of the popular image files of JPG, 
JPEG, PSD, PNG, GIF, TIFF, BMP and more from a scanner attached to your 
computer or a digital camera and convert it into .DOC or .TXT format. 
Free OCR to Word can recognize specified areas in an input image. You might 
need  to select  the  image and  text  regions that  are  recognized  by  the  OCR 
software. Some image & document tools are integrated with the software for 
image errors correcting and document editing. If the input image contains the 
orientation  and  skew  errors,  use RotateCW or RotateACW tools  to  fix  the 
angle of them. For better viewing, try Fit Image, Fit Width as well as Zoom 
tools [107]. Free OCR to Word has a simple interface. So it is easy to use. It 
allows rotation of the image. 
Free OCR to word cannot recognize formatting. It does not support PDF and 
multi-page file. It supports only one language. 
Figure 2.25 Screenshot of Transym OCR 
Chapter 2 
64 
 
How it Works? 
I. 
Open - Open an image file. 
II. 
OCR – Convert an image file to text file. 
5. 
Image to OCR converter 
Image to OCR Converter is text recognition software that can read text from 
BMP, PDF, TIFF, JPG, GIF, PNG and all major image formats and saves the 
extracted text in WORD, DOC, PDF, HTML and TEXT formats with accurate 
text formatting  and  spacing.  Complicated layout of legal  documents, faxes, 
documents with tables, designs, and photos captured with digital and phone 
cameras are accurately recognized and recreated in output formats [108].  
Image  to  OCR  Converter  recognizes  more  than  40  different  languages.  It 
retains  logical  structure  and  formatting  elements  in  single  and  multi-page 
documents.  Image  to  OCR  Converter  provides  security  features  such  as 
Figure 2.26 Screenshot of Free OCR to Word 
Chapter 2 
65 
password  protection  and  watermark  to  the  converted  documents.  The 
password protection prevents others from viewing or copying your document's 
content.  Files  can  be  watermarked  to  prevent illegal  distribution.  Image  to 
OCR  Converter  provides  automatic  detection  and  correction  of  rotated, 
skewed  and  tilted  documents.  Broken  text  and  characters  are  also 
reconstructed to provide better accuracy and recognition [108]. 
Image to OCR  converter allows  converting  only  two pages  in unregistered 
version at a time. Security features such as password protection and watermark 
to the converted document are only provided in registration mode which is not 
free. 
 
How it Works? 
I. 
Open File – Open an image file or PDF file. 
II. 
Save File – Convert an image or PDF file to text file 
Figure 2.27 Screenshot of Image to OCR Conveter 
Documents you may be interested
Documents you may be interested