pdf reader in asp.net c# : Erase pdf text software application project winforms html wpf UWP MicrosoftDocumentImagingTools0-part816

Karlen Communications 
Karen McCall, M.Ed. 
Microsoft Office Document Imaging Tool 
Phone: 
1-519-442-2856 
E-mail: 
info@karlencommunications.com
Web: 
karlencommunications.com
This material copyright 2009 Karen McCall, Karlen Communications. 
Table of Contents 
Introduction .................................................................................................................................................. 2 
Installing the Document Imaging Tool .......................................................................................................... 2 
Upgrading the OCR Software ........................................................................................................................ 5 
The Document Imaging Tool User Interface ................................................................................................. 6 
Accessibility in the Document Imaging Tool ................................................................................................. 7 
Opening a TIF or TIFF .................................................................................................................................... 9 
OCR on Scanned Pages ................................................................................................................................ 12 
Scanning in French or Spanish .................................................................................................................... 17 
Microsoft Office Document Imaging Options ............................................................................................. 18 
Erase pdf text - delete, remove text from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# developers to use mature APIs to delete and remove text content from PDF document
remove text watermark from pdf online; how to delete text from a pdf
Erase pdf text - VB.NET PDF delete text library: delete, remove text from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
VB.NET Programming Guide to Delete Text from PDF File
how to remove text watermark from pdf; delete text from pdf preview
2 
Introduction 
One of the tools often overlooked in the Microsoft Office suites is the "Microsoft Office Document 
Imaging" tool. 
What is this? 
The Microsoft Office document Imaging tool lets you either open a TIF or TIFF image of a document or 
scan a document into the Document Imaging tool and then perform OCR or Optical Character 
Recognition on the text. 
A TIF or TIFF image of a document literally means Tagged Image File Format [TIFF] which is then 
shortened to "TIF." 
The Microsoft Office Document Imaging tool is a free tool that lets someone with a visual or print 
disability scan pages into the Document Imaging tool and then make the text readable with their 
adaptive technology such as a screen reader or TTS/Text-to-Speech software. It is not as powerful as 
OCR scanning software such as OmniPage Pro, TextBridge, ABBYY Fine Reader or tools like the Kurzweill 
or Freedom Scientific scanning software specifically designed for people with disabilities. 
It is, however, a tool at your fingertips for quickly scanning and converting printed pages to text 
readable using adaptive technology. 
Installing the Document Imaging Tool 
When you install Office 2007, instead of choosing the "Install" button, choose the "Customize" button. 
The Microsoft Office Document Imaging tools are not installed as part of the general Office install. 
As we will see, there is also the ability to install the OCR tool for three languages: English, Spanish and 
French. You can choose to install all or whichever ones you need. 
After you choose to install a customized version of Office, you will see a dialog with all the components 
of the Microsoft Office 2007 suite. Items that are shaded have components that will either not be 
installed at all or will be installed the first time you use the tool. 
C# WinForms Viewer: Load, View, Convert, Annotate and Edit PDF
Draw PDF markups. PDF Protection. • Sign PDF document with signature. • Erase PDF text. • Erase PDF images. • Erase PDF pages. Miscellaneous.
how to delete text from pdf; erase pdf text online
C# WPF Viewer: Load, View, Convert, Annotate and Edit PDF
Draw markups to PDF document. PDF Protection. • Add signatures to PDF document. • Erase PDF text. • Erase PDF images. • Erase PDF pages. Miscellaneous.
delete text from pdf online; pdf editor delete text
3 
Figure 1 List of components for Microsoft Office install. 
If you are using a screen reader, the items will be read to you as you go through them and you will be 
told that there are sub-items or that the item is collapsed or expanded. Use the Arrow keys to expand or 
collapse items. 
1.
Find the "Proofing Tools" components. 
2.
Expand the list of proofing tools. 
3.
Locate the "Optical Character Recognition Modules"  components use the right mouse button or 
the AppKey to open the context menu of options for installation. 
4.
Choose to "Run from my computer."" And press Enter to confirm. 
5.
Move down the list of proofing tools to the French and then the Spanish proofing tools and 
repeat this the process of running the component from the computer. 
C# HTML5 Viewer: Load, View, Convert, Annotate and Edit PDF
Redact tab on viewer empower users to redact and erase PDF text, erase PDF images and erase PDF pages online. Miscellaneous. • RasterEdge XDoc.
delete text pdf file; delete text pdf document
C# PDF Text Redact Library: select, redact text content from PDF
Free online C# source code to erase text from adobe PDF file in Visual Studio. How to Use C# Code to Erase PDF Text in C#.NET. Add necessary references:
remove text from pdf reader; how to delete text from a pdf document
4 
Figure 2 French proofing tools OCR component. 
Figure 3 Spanish proofing tool OCR component. 
C# HTML5 PDF Viewer SDK to view, annotate, create and convert PDF
setting PDF file permissions. Help C# users to erase PDF text content, images and pages online in ASP.NET. RasterEdge C#.NET HTML5
pull text out of pdf; pdf text remover
C# PDF Image Redact Library: redact selected PDF images in C#.net
Same as text redaction, you can specify custom text to appear over the image redaction area. How to Erase PDF Images in .NET Using C# Class Code.
how to delete text in pdf converter professional; delete text pdf files
5 
Once you've chosen to install the OCR components you want, move to the first level set of tools called 
"Office Tools" which is further down the list of components you can install. 
Figure 4 Document Imaging Help component. 
You can then move to and activate the "Install Now" button. 
If you already have Microsoft Office installed on your computer, you can add the Document Imaging 
component by going to Programs and Features or Add or Remove Programs and choosing to modify or 
change the installation of Office. 
Upgrading the OCR Software 
If you launch the Microsoft Office Document Imaging tool you can go to the Help Menu item where 
you'll find a topic related to upgrading the OCR. 
This lets you upgrade the optical character recognition engine to Nuance's OmniPage Pro OCR scanning 
software. While the on-board Document Imaging tool lets you read text it will not retain layout and 
most images. You will need to move to a fuller version of an OCR scanning software such as OmniPage 
Pro or ABBEEY Fine Reader to retain formatting. 
However, the Document Imaging tool will work for you in a pinch. 
How to C#: Special Effects
Erase. Set the image to current background color, the background color can be set by:ImageProcess.BackgroundColor = Color.Red. Encipher.
how to delete text from a pdf in acrobat; how to delete text in pdf preview
Customize, Process Image in .NET Winforms| Online Tutorials
Include crop, merge, paste images; Support for image & documents rotation; Edit images & documents using Erase Rectangle & Merge Block function;
how to delete text in pdf converter; acrobat delete text in pdf
6 
Figure 5 Upgrade information in Help documentation for the Document Imaging tool. 
The Document Imaging Tool User Interface 
I use the Document Imaging tool on a regular basis and have it on my Desktop. You can find it in 
Windows Vista or Windows 7 by pressing the Windows Key and typing Document Imaging. 
When you launch the Microsoft Office Document Imaging tool, you will see a Menu bar, Toolbar and 
Status bar. The main document area is divided into two parts: a narrow frame type element on the left 
and a larger frame like element on the right. These are called the "Thumbnail" and "Page" panes 
respectively. 
.NET Imaging Processing SDK | Process, Manipulate Images
Provide basic transformation functions, like Crop, Rotate, Resize, Flip and more; Basic image edit function support, such as Erase Rectangle, Merge Block, etc.
delete text pdf; delete text pdf acrobat
7 
Figure 6 Document Imaging tool user interface. 
The following image shows a closer look at the Menu bar and Toolbar. 
Figure 7 Document Imaging Toolbars. 
Accessibility in the Document Imaging Tool 
There are two Help documents related to accessibility within the Help documentation for the Microsoft 
Document Imaging tool.  One contains keyboard commands for working with the Document Imaging 
tool and the other contains tips and techniques for scrolling, zooming, panning and annotating text in 
the Document Imaging tool. 
You can use some standard keyboard commands such as Ctrl + C to Copy, Ctrl + X to Cut, Ctrl + V to 
Paste or Ctrl + the letter O to launch the Open dialog. 
8 
In addition, some of the standard keyboard commands have different functions. Below is a list of 
keyboard commands you'll find useful when working with the document Imaging tool. For the complete 
list, consult the Help documentation for the Microsoft Office Document Imaging tool. 
To carry out a task in the Document Imaging tool, press: 
Ctrl + A to select the current page. 
Ctrl + Shift + A to select all pages. 
Ctrl + letter I to copy the selected area as a bitmap image. 
Ctrl + C to copy selected annotations if annotations are selected. Use this keyboard command to 
copy selected text as well. 
Ctrl + X to cut selected annotations if one or more annotations are selected. This will also cut 
selected text. 
Ctrl + Shift + X to cut the selected page. 
Ctrl + Shift + V to "Paste a copied or cut page. If an image was copied, the image is pasted on a 
new page. " [copied directly from the Microsoft Help documentation]. 
Shift + Delete to remove the selected pages. 
Delete to remove the current page. 
Ctrl + T to send all text in the current document to Microsoft Word. 
Tab to move between the Thumbnail and Page panes. 
Ctrl + E to move to the Page box in the Toolbar. 
Press F6 to move back to the Thumbnail Pane. 
Ctrl + M to move to the Zoom box in the Toolbar. 
Press F6 to move back to the Thumbnail Pane. 
Spacebar to move to the next page in the Thumbnail Pane. 
Backspace to move to the previous page in the Thumbnail Pane. 
Arrow keys in the Thumbnail Pane to scroll in the direction of the Arrow key you press. 
Note: You cannot use standard navigation keyboard commands such as the Arrow 
keys for moving through words or characters. In the Document Imaging tool these 
are used to move through pages or sections of content. To navigate the document 
character by character or word by word, send the document to Microsoft Word. 
The page used in this How To guide comes from the book " Microsoft Word 2007 from the Keyboard" by 
Karen McCall. It was chosen because the page has an image, a caption, a list, a heading, and paragraph 
text. It represents a typical page. 
9 
Opening a TIF or TIFF 
Sometimes printed pages are scanned in as TIF or TIFF documents. Using Microsoft Office Document 
Imaging we can open them and perform OCR on them so that we can read the text using either a screen 
reader or TTS/Text-to-Speech tool. 
To read a TIF or TIFF document: 
1.
Locate the TIFF OR TIF file. 
2.
Launch Microsoft Office Document Imaging. 
3.
Press Ctrl + letter O to show the Open dialog. 
4.
Locate the file and move to and activate the Open button. 
Figure 8 TIF file opened in Document Imaging tool. 
5.
Press Alt + T to open the Tools menu and choose " 
10 
Figure 9 Tools menu showing option to perform OCR. 
At this point, if you are using a screen reader you will not have access to auditory feedback in either the 
Thumbnail or Pages Panes. The best option is to send the text to Word. 
Your screen reader will provide feedback on the OCR progress and you will know once the process is 
completed. 
At that point press Ctrl + T to send the recognized text to Word. You can also return to the Tools Menu 
and choose to send the text to Word. 
Figure 10Send the recognized text to Word from the Tools Menu. 
When the text opens in Word, it will not be formatted as it was in the scanned page. However, bulleted 
lists are recognized by screen readers as individual bulleted items which helps preserve list relationships. 
If an image has a caption, that text is present so someone knows an image is on the page. A heading text 
is larger and bold, so it retains the formatting but not the underlying heading structure. 
Most importantly, we can read the page! 
Documents you may be interested
Documents you may be interested