open pdf from windows form c# : How to delete text from a pdf reader control application system azure web page asp.net console Readiris-12.0-en5-part1715

Readiris
TM
Pro 12 – User Guide
45 
C
HAPTER 
8
R
ECOGNIZING DOCUMENTS
I
NTRODUCTION
To recognize documents, Readiris applies linguistics during the 
recognition phase. As a result, Readiris recognizes text, tables and 
graphics, barcodes and handprinted text in all kinds of documents. 
Readiris even copes with complex columnized documents, low-
quality documents, faxes, dot matrix printouts, badly scanned and 
copied documents containing too light or dark font shapes, etc.  
Readiris supports 125 languages: all American and European 
languages are supported, including the Central-European, Baltic and 
Cyrillic languages as well as Greek and Turkish. Optionally, 
Readiris can read Hebrew documents and four Asian languages - 
Japanese, Simplified and Traditional Chinese and Korean. Readiris 
even copes with mixed alphabets: the software detects “Western” 
words that occur in Greek, Cyrillic, Hebrew and Asian documents - 
many untranscribable proper names, brand names etc. are written 
using the Western symbols. 
Readiris is based on the most advanced recognition technologies. 
Font-independent text recognition is complemented by self-learning 
techniques. The system is able to learn new characters and words 
through contextual and linguistic analysis. This means that the OCR 
accuracy of the recognition system will improve as it goes along. 
Besides that, Readiris has a user verification function. When 
activated, the user verification function (Interactive learning) not 
only flags characters the recognition system isn't sure of but also 
How to delete text from a pdf reader - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
how to remove text watermark from pdf; remove text from pdf acrobat
How to delete text from a pdf reader - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
how to delete text in pdf document; delete text from pdf acrobat
Chapter 8 – Recognizing documents 
46 
allows to increase the system's accuracy. All solutions you confirm 
are memorized temporarily during recognition, increasing the 
system speed and confidence and rendering the system more 
intelligent as you go along. This powerful learning tool also allows 
you to train Readiris on special characters such as mathematical 
symbols and dingbats and to handle distorted fonts. 
The interactive learning results can also be stored permanently in 
font dictionaries for future use. 
S
ELECTING THE DOCUMENT LANGUAGE
Readiris offers OCR in 125 languages. Readiris supports all 
American and European languages including the Central-European, 
Cyrillic and Baltic languages, as well as Greek and Turkish. 
Readiris Pro Asian and Readiris Corporate Asian additionally 
recognize documents in Japanese, Simplified Chinese, Traditional 
Chinese, Korean and Hebrew. 
In order for Readiris to recognize a document, the document 
language must be specified. 
To do so: 
Click the globe button on the main toolbar and select the language 
of your choice in the Primary language list. 
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
›› VB.NET PDF: Delete PDF Page. VB.NET PDF - How to Delete PDF Document Page in VB.NET. Visual Basic Sample Codes to Delete PDF Document Page in VB.NET Class.
delete text from pdf; remove text watermark from pdf
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
Page: Delete Existing PDF Pages. |. Home ›› XDoc.PDF ›› C# PDF: Delete PDF Page. C#.NET PDF Library - Delete PDF Document Page in C#.NET.
how to delete text in pdf preview; how to edit and delete text in pdf file
Readiris
TM
Pro 12 – User Guide
47 
Important: select the document language before executing page 
analysis when you are dealing with Asian or Hebrew documents. 
Specific page analysis routines are used for these documents. 
Tip: in case you want to recognize documents in multiple languages, 
make sure to select the language with the biggest character set. E.g. if 
you want to recognize a document that contains both English and 
French text, select French as document language. This way, the 
accents will be recognized correctly. 
The recognition can also be limited to a Numeric character set to 
optimally recognize tables and figures. Readiris then only recognizes 
the numerals 0-9 and the following series of symbols:  
To activate numeric mode, select Numeric at the top of the Primary 
language list. 
VB.NET PDF Text Extract Library: extract text content from PDF
PDF ›› VB.NET PDF: Extract PDF Text. VB.NET PDF - Extract Text from PDF Using VB. How to Extract Text from PDF with VB.NET Sample Codes in .NET Application.
delete text pdf file; how to erase pdf text
C# PDF Text Extract Library: extract text content from PDF file in
XDoc.PDF ›› C# PDF: Extract PDF Text. C# PDF - Extract Text from PDF in C#.NET. Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File.
how to copy text out of a pdf; how to delete text from pdf with acrobat
Chapter 8 – Recognizing documents 
48 
Recognizing Western words in Cyrillic and Slavic languages 
and in Greek 
In certain Cyrillic and Slavic languages, as well as in Greek, 
Western proper nouns often remain written in the Latin alphabet. 
Readiris is able to recognize those Western words in Russian, 
Byelorussian, Ukrainian, Serbian, Macedonian, Bulgarian and 
Greek. 
You must simply indicate the language pair (Other language – 
English) that is used in the text. Readiris will use the corresponding 
character set and switch languages whenever necessary. 
To enable the reading of Western words in the above-mentioned 
languages: 
Click the globe button on the main toolbar. 
Select the required language pair in the language list. 
Note: when processing Asian or Hebrew documents, mixed 
characters sets are used automatically. 
C# PDF insert text Library: insert text into PDF content in C#.net
Supports adding text to PDF in preview without adobe reader installed in ASP.NET. Powerful .NET PDF edit control allows modify existing scanned PDF text.
how to delete text in pdf converter; how to delete text in a pdf file
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
C#.NET PDF SDK - Convert PDF to Text in C#.NET. Integrate following RasterEdge C#.NET text to PDF converter SDK dlls into your C#.NET project assemblies;
how to edit and delete text in pdf file online; deleting text from a pdf
Readiris
TM
Pro 12 – User Guide
49 
Selecting the language per page 
When specific pages use a different language than the overall 
document, you don't need to define a secondary language. You can 
apply a different language to those pages.  
Select the pages in the drawer, Ctrl-click them and use the 
command Language to assign another language than the overall 
document language to that/those page/pages. 
Pages with a different language than the overall language are marked 
in red in the drawer. 
Note: the tooltip of each page in the drawer indicates which language 
applies to that page. 
VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net
VB.NET PDF - Convert PDF to Text Using VB. Integrate following RasterEdge text to PDF converter SDK dlls into your VB.NET project assemblies;
remove text from pdf preview; erase text in pdf document
C# PDF Text Search Library: search text inside PDF file in C#.net
Text: Search Text in PDF. C# Guide about How to Search Text in PDF Document and Obtain Text Content and Location Information with .NET PDF Control.
delete text pdf acrobat professional; pdf text remover
Chapter 8 – Recognizing documents 
50 
D
EFINING THE DOCUMENT CHARACTERISTICS
Next to the document language, other document characteristics such 
as the Font type and Character pitch play an important role in the 
recognition process. 
Font type 
Readiris distinguishes between "regular" and dot matrix printed 
documents. Dot matrix symbols (of the type 9 pin) are made up of 
isolated, separate dots.  
Special segmentation and recognition techniques are required to 
recognize dot matrix documents and need to be activated. 
To select the font type:  
On the Settings menu, point to Font type. 
The font type is set to Automatic by default. 
That way, Readiris recognizes "25 pin" or "NLQ" (Near Letter 
Quality) dot matrix, or other "normal" printing. 
To recognize only dot matrix printed documents, click Dot 
matrix.  
Readiris will recognize so-called "draft" or "9 pin" dot matrix printed 
documents. 
Character pitch 
The character pitch is the number of characters per inch in a 
typeface. The character pitch can either be fixed , in which case all 
characters have the same width, or proportional, in which case the 
characters have a different width. 
Readiris
TM
Pro 12 – User Guide
51 
To select the character pitch:  
On the Settings menu, point to Character Pitch. 
The character pitch is set to Automatic by default. 
Click Fixed if all characters of the typeface have the same width. 
This is often the case in old typewriter documents. 
Click Proportional if the characters of the typeface have a 
different width. Virtually all fonts in newspapers, magazines and 
books are proportional. 
Important: these document characteristics do not apply to Asian or to 
Hebrew documents. 
U
SING INTERACTIVE LEARNING
Readiris offers an interactive learning function. By means of 
Interactive learning you can train the recognition system on fonts 
and character shapes, and correct the OCR results if necessary. 
During interactive learning, any characters the recognition system 
isn't sure of are displayed in a preview window, in combination with 
their parent word and the proposed solution. 
Interactive learning can substantially enhance the accuracy of the 
recognition system and is particularly useful when recognizing 
distorted, defaced forms. Interactive learning can also be used to 
train Readiris on special symbols it is unable to recognize initially, 
such as mathematical and scientific symbols and dingbats. 
To enable interactive learning: 
Chapter 8 – Recognizing documents 
52 
On the Learn menu, click Interactive Learning.  
Click the Recognize + Save button to recognize the document. 
Readiris enters the interactive learning phase. 
The characters the recognition system isn't sure of are displayed. 
If the results are correct: 
Click the Learn button to save the result as sure. 
The learning results are temporarily stored in the computer memory, for 
the duration of the recognition. Readiris will no longer display the 
learned characters when OCRing the rest of the document. 
When a new document is OCRed, the learning results are erased. 
To save learning results permanently, use a font dictionary. For more 
information, see the section Using font dictionaries
Click Finish to save all solutions the software offers. 
If the results are incorrect: 
Type in the correct characters and click the Learn button. 
Readiris
TM
Pro 12 – User Guide
53 
Note: if you are dealing with documents that contain special 
characters make sure you click the command Special 
Characters on the Edit menu. Double-click the characters you 
want to insert. 
or 
Click Don't learn to save the result as unsure.  
Use this command for damaged characters which could be confused 
with other characters if learned. E.g. the number 1 and the letter I, which 
have an identical form in many fonts. 
Click Delete to delete characters from the output.  
Use this button to prevent document noise from appearing in the output 
file. 
Click Undo to correct mistakes.  
Readiris keeps track of the last 32 operations. 
Click Abort to abort interactive learning.  
All learning results will be deleted. Next time you click Recognize + 
Save, interactive learning  will start again. 
Chapter 8 – Recognizing documents 
54 
U
SING FONT DICTIONARIES
When scanning many documents of the same type, font quality and 
printing quality, you may not want to repeat the learning process 
every time. Therefore, it is useful to use font dictionaries. Font 
dictionaries contain font information learned during interactive 
learning and can substantially increase the recognition results. 
Note that font dictionaries are limited to 500 shapes. You are 
recommended to create separate dictionaries for specific 
applications. 
To create a new font dictionary: 
On the Learn menu click the command New Dictionary. 
Click Interactive Learning on the Learn menu to activate it. 
Click Recognize + Save to recognize the document. 
Readiris enters the interactive learning phase. Use the buttons of 
the dialog box to save characters in the font dictionary. 
When the recognition is completed, click Save to save the 
document. 
Then return to the Learn menu and click Save Dictionary to 
save it. 
Enter the name of the dictionary and click Save. 
To use an existing font dictionary: 
On the Learn menu click Open Dictionary. 
Select the dictionary you want to use and click Open
Click Recognize + Save to recognize the document. 
Documents you may be interested
Documents you may be interested