37
ADOBE ACROBAT 6.0
Section Five: Creating Accessible PDF Documents from Scanned Documents
How To Guide
Using Paper Capture to create accessible PDF documents from scanned PDF 
documents
Documents that you scan directly into Adobe Acrobat and save as PDF files are not accessible to all readers. A 
scanned PDF document doesn’t contain text, structure, or elements that can be tagged, so assistive devices can not 
access them. Paper Capture performs OCR to add text to scanned PDF documents. In some instances, Paper Capture 
can’t recognize text. These instances are directly related to the clarity of the scanned material. For example, a smudge 
on a page might be interpreted by Paper Capture as suspect text. In this case, you can examine, confirm, or correct 
the suspect text.
Open the scanned PDF document in Acrobat 6.0 Professional or Acrobat 6.0 Standard.
• If the document format is TIFF, JPEG, BMP, PNG, or PCX, choose File > Create PDF > From File.
• If you are using an existing scanned PDF file, or you are using File > Create PDF > From Scanner, you’ve already 
created a PDF file and can proceed to setting the Paper Capture output options.
Before running Paper Capture, you need to set the PDF Output Style in the Paper Capture Settings.
To set the PDF Output Style and run Paper Capture:
 Choose Document > Paper Capture > Start Capture.
 Click Edit in the Paper Capture dialog box.
The Paper Capture dialog box
 Select a PDF Output Style in the Paper Capture Settings dialog box.
Note: To replace text with actual rendered characters that result from OCR recognition, choose Formatted Text & 
Graphics as your PDF Output Style in the Paper Capture Settings dialog box. Any characters not properly recognized 
remain as scanned images of the characters. You can make corrections so that the scanned images of characters are recog-
nized as actual characters. Formatted Text & Graphics offers optimum accessibility. You can keep the exact appearance of 
the scanned document and supplement it with the recognized text; choose Searchable Image to produce documents in 
which OCR-recognized text lies behind the actual scanned images of the documents. 
Convert pdf to txt file - Convert PDF to txt files in C#.net, ASP.NET MVC, WinForms, WPF application
C# PDF to Text (TXT) Converting Library to Convert PDF to Text
converting pdf to editable text for; convert pdf to text vb
Convert pdf to txt file - VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net, ASP.NET MVC, WinForms, WPF application
VB.NET Guide and Sample Codes to Convert PDF to Text in .NET Project
convert pdf to plain text online; convert pdf scanned image to text
38
ADOBE ACROBAT 6.0
Section Five: Creating Accessible PDF Documents from Scanned Documents
How To Guide
The Paper Capture Settings dialog box
 Click OK in the Paper Capture Settings dialog box.
 Click OK in the Paper Capture dialog box to start the capture of the scanned PDF document.
Finding OCR suspects
If the OCR dictionary has difficulty identifying characters, it considers them suspect or questionable. You have two 
choices in reviewing OCR suspects: Use Find First OCR Suspect to find suspects sequentially in a PDF document; or 
choose to have all OCR suspects displayed.
To find the first OCR suspect:
 Choose Document > Paper Capture > Find First OCR Suspect. The Find Element window displays the first 
suspect for inspection.
The first OCR suspect displayed in the Find Element dialog box
 Compare the suspect in the document with the image of the word in the Find Element dialog box, and do one of 
the following:
• Click Accept And Find to accept the text as correct, and then move to the next suspect word.
• Click the suspect in the document and type edits to correct the text (The TouchUp Text tool became active when 
Acrobat began looking for suspects). 
• Click Find Next to leave the suspect unchanged, and then move to the next suspect.
 Close the Find Element dialog box when you have finished reviewing the suspects.
You can also choose to have all OCR suspects displayed in the PDF document.
Online Convert PDF to Text file. Best free online PDF txt
from other C# .NET PDF to text conversion controls, RasterEdge C# PDF to text converter control toolkit can convert PDF document to text file with good
converting .pdf to text; convert pdf to text document
C# PDF Converter Library SDK to convert PDF to other file formats
Allow users to convert PDF to Text (TXT) file. It's easy to be integrated into your C# program and convert PDF to .txt file with original PDF layout.
conversion of pdf image to text; convert pdf file to txt file
39
ADOBE ACROBAT 6.0
Section Five: Creating Accessible PDF Documents from Scanned Documents
How To Guide
To find all OCR suspects:
 Choose Document > Paper Capture > Find All OCR Suspects. The suspects are outlined in thin frames.
A paper-captured document with all the suspects highlighted
 In the Advanced Editing toolbar, select the TouchUp Text tool, and select a suspect in the document. 
 In the Find Element dialog box, choose the appropriate option:
• Click Accept And Find to accept the text as correct, and then move to the next suspect.
• Click the suspect in the document to edit the text. 
• Click Find Next to leave the suspect unchanged, and then move to the next suspect.
VB.NET Create PDF from Text to convert txt files to PDF in vb.net
Batch convert editable & searchable PDF document from TXT formats in VB.NET class. Able to copy and paste all text content from .txt file to PDF file by keeping
convert pdf to editable text online; convert pdf to text on
C# Create PDF from Text to convert txt files to PDF in C#.net, ASP
Free .NET library for creating PDF from TXT in both C# C#.NET class source code for creating PDF document from Convert plain text to PDF text with multiple fonts
batch convert pdf to txt; convert pdf photo to text
40
ADOBE ACROBAT 6.0
Section Five: Creating Accessible PDF Documents from Scanned Documents
How To Guide
A paper-captured document with all suspects identified and the Find Element dialog box displayed
 Click Close when you have reviewed all suspects.
To tag the PDF document for accessibility, do one of the following:
• In Acrobat 6.0 Standard, choose Advanced > Accessibility > Make Accessible.
• In Acrobat 6.0 Professional, choose Advanced > Accessibility > Add Tags To Document. 
To finish the PDF document:
 Optimize the PDF document for accessibility. For information on providing alt text for images and links using 
Acrobat 6.0 Professional, see “Section Seven: Optimizing the Accessibility of Tagged PDF Documents” on page 55. 
 Repair any structural elements. For information on repairing structural elements and rearranging tags in a logical 
document structure using Acrobat 6.0 Professional, see “Section Eight: Manipulating Tagged PDF Structural 
Elements” on page 64.
 Perform an accessibility Full Check using Acrobat 6.0 Professional. [See “Full Check (Adobe Acrobat 6.0 Profes-
sional)” on page 4.]
 Test the PDF document for accessibility. (See “Additional accessibility tests” on page 10.)
C# WPF PDF Viewer SDK to convert and export PDF document to other
2. To TIFF. Export PDF to TIFF file format. 3. To TXT. Export and convert PDF to TXT file. 4. To Image. Convert PDF to image formats, such as PNG, JPG, BMP and
c# extract text from pdf; convert pdf file to text file
VB.NET PDF - WPF PDF Viewer for VB.NET Program
are allowed to view PDF on VB.NET project, annotate PDF document with various notes and shapes, convert PDF to Word document, Tiff image, TXT file and other
convert pdf to text c#; change pdf to text for editing
41
ADOBE ACROBAT 6.0
Section Five: Creating Accessible PDF Documents from Scanned Documents
How To Guide
Using Adobe Acrobat Capture 3.0 and the Tag Adobe PDF Agent to create 
accessible PDF documents
To complete these tasks, you need Adobe Capture 3.0 and the Adobe Tag Agent. You also need Acrobat 6.0 Profes-
sional to test your documents for accessibility.
Important: You need the Tag Adobe PDF agent to create a tagged PDF file. This is a separate product that is available for 
purchase from Adobe. For more information, see the Adobe Acrobat Capture product page at www.adobe.com. 
Tag Adobe PDF Agent tips
Users who convert high volumes of paper documents to PDF documents using Adobe Acrobat Capture 3.0 find Tag 
Adobe PDF Agent useful because it allows tagging of PDF documents to be incorporated in an Adobe Acrobat 
Capture workflow.
Advantages to using Tag Adobe PDF Agent:
• It allows users to specify more than one language dictionary for processing documents.
• It recognizes table of contents and index layouts, and automatically creates hyperlinks to the appropriate views in 
the document.
• It includes a Move Graphics to Artifact option, which is especially useful when converting forms to Tagged Adobe 
PDF.
Foreign Language Processing  
Paper Capture in Acrobat 6.0 Professional and Acrobat 6.0 Standard allows users to 
specify any one of 17 foreign languages as the primary OCR language.
The Tag Adobe PDF Agent for Adobe Acrobat Capture 3.0 provides access to a number of dictionaries and also allows 
more than one dictionary to be selected for processing multiple-language documents.
Adobe Acrobat Capture 3.0 accessibility workflow
The first step in using Adobe Capture 3.0 is to build an accessibility workflow. 
VB.NET PDF - Convert PDF with VB.NET WPF PDF Viewer
2. To TIFF. Export PDF to TIFF file format. 3. To TXT. Export and convert PDF to TXT file. 4. To Image. Convert PDF to image formats, such as PNG, JPG, BMP and
convert pdf to text; changing pdf to text
C# Create PDF Library SDK to convert PDF from other file formats
Create writable PDF from text (.txt) file. HTML webpage to interactive PDF file creator freeware. Create multipage PDF from OpenOffice and CSV file.
convert pdf to word text document; convert pdf to word to edit text
42
ADOBE ACROBAT 6.0
Section Five: Creating Accessible PDF Documents from Scanned Documents
How To Guide
The Acrobat Capture 3.0 interface
To build a workflow to create accessible PDF documents in Acrobat Capture 3.0: 
 In the Configure panel, click Insert Workflow.
 Right-click on the newly inserted workflow (named “Untitled”), select Rename, and then type in an appropriate 
name (such as “Accessible PDF”).
The Insert Workflow button in the Configure panel
 Click Insert Steps.
43
ADOBE ACROBAT 6.0
Section Five: Creating Accessible PDF Documents from Scanned Documents
How To Guide
The Insert Steps button in the Configure panel
 Add the following steps in order:
• (For PDF Image-only files) Split Multipage PDF Image files to individually process each page of the PDF Image-
only file. 
• (For PDF Image-only files) Convert Image To TIFF to make the image on each page usable for the OCR software 
that the Capture Image agent applies. 
• Capture Image to apply OCR to each page as marked with the zone template. (The zone template lets you specify 
areas on pages to treat as though they contain text or images.) 
• QuickFix Page to let you review and correct suspects on each page. 
• Bind Pages to assemble the individual pages into a single document. 
• Export To PDF Agent to save files as Adobe PDF files. 
• Tag PDF to create tagged Adobe PDF files. (Tag PDF is a separately purchased plug-in available from Adobe.) 
• Store File (PDF) to save the file in Adobe PDF in the location you specify. 
The Insert Steps dialog box
 Click Done. 
44
ADOBE ACROBAT 6.0
Section Five: Creating Accessible PDF Documents from Scanned Documents
How To Guide
A workflow as steps are added
To complete building the workflow:
 In the Configure panel, select the Export To PDF agent in the workflow.
 Right-click Export To PDF, and then choose Properties. 
45
ADOBE ACROBAT 6.0
Section Five: Creating Accessible PDF Documents from Scanned Documents
How To Guide
A workflow with the Export To PDF agent context menu active
 Click the General tab, and then select the appropriate page content. 
 Click OK.
Note: To replace text with actual rendered characters that result from OCR recognition, choose Formatted Text & 
Graphics as your Page Content in the Export To PDF Properties dialog box. Any characters not properly recognized remain 
as scanned images of the characters. You can make corrections so that the scanned images of characters are recognized as 
the actual characters. Formatted Text & Graphics offers optimum accessibility. You can keep the exact appearance of the 
scanned document and supplement it with the recognized text; choose Searchable Image to produce documents in which 
OCR-recognized text lies behind the actual scanned images of the documents.
46
ADOBE ACROBAT 6.0
Section Five: Creating Accessible PDF Documents from Scanned Documents
How To Guide
The General tab in the Export To PDF Properties dialog box
 Right-click the Tag Adobe PDF agent in the workflow, and then choose Properties. 
 Choose the language to use in discerning word breaks. 
 Select the default options.
 Click OK. 
 Right-click the Store File agent in the workflow, and then choose Properties. 
10  Enter a location in which to store the resulting tagged Adobe PDF files. 
11  Click OK. 
Submitting documents to the Adobe Acrobat Capture 3.0 accessibility workflow
Now that the Accessibility PDF workflow has been created, documents submitted to it will be automatically 
converted to accessible documents.
To run an Adobe Acrobat Capture 3.0 workflow: 
 Open Adobe Acrobat Capture 3.0. 
 Click the Configure tab. 
 In the Configure panel, click the Run button for your Accessible PDF workflow. 
 Click the Submit tab. 
 Select the folder or files you want to capture. 
 At the bottom of the Submit panel, select how you want to treat files and how you want to combine the images. 
 On the Target Workflow menu at the bottom of the Submit tab, choose the Accessible PDF workflow you created. 
 Click the Submit to Workflow button. 
 Use the QuickFix tool to review and correct suspects on each page. 
The image files are automatically assembled into a single file, exported to Adobe PDF files with tagged Adobe PDF, 
and stored. 
Documents you may be interested
Documents you may be interested