c# parse pdf table : Export pdf bookmarks to text file application software tool html windows azure online creatingaccessibleaa70-part1366

Creating Accessible PDFs 
High Tech Center Training Unit 
of the California Community Colleges at the 
Foothill-De Anza Community College District 
21050 McClellan Road 
Cupertino, CA 95014 
(408) 996-4636 
www.htctu.net
Export pdf bookmarks to text file - add, remove, update PDF bookmarks in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your C# Project with Rapid PDF Internal Navigation Via Bookmark and Outline
creating bookmarks in pdf documents; pdf export bookmarks
Export pdf bookmarks to text file - VB.NET PDF bookmark library: add, remove, update PDF bookmarks in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your VB.NET Project with Rapid PDF Internal Navigation Via Bookmark and Outline
how to add a bookmark in pdf; bookmarks pdf reader
2006 HTCTU 
http://creativecommons.org/licenses/by-nd-nc/1.0/
VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
Compress & decompress PDF document file while maintaining original content of target PDF document file. Remove bookmarks, annotations, watermark, page labels
add bookmarks to pdf preview; delete bookmarks pdf
C# PDF File Split Library: Split, seperate PDF into multiple files
Split PDF file by top level bookmarks. The following C# codes explain how to split a PDF file into multiple ones by PDF bookmarks or outlines.
create bookmarks in pdf; how to add bookmarks to pdf document
Table of Contents 
CREATING ACCESSIBLE PDFS........................................................................................1 
TABLE OF CONTENTS.......................................................................................................3 
A
DOBE 
A
CROBAT 
7.0
P
ROFESSIONAL FOR 
W
INDOWS
........................................................5 
Publisher:..........................................................................................................................5 
Retail Cost:.......................................................................................................................5 
System Requirements:.......................................................................................................5 
Description........................................................................................................................5 
Basic Use..........................................................................................................................5 
Creating a New PDF Document.......................................................................................6 
PDFs with Images.............................................................................................................7 
Converting Existing PDF Documents...............................................................................8 
Adding Tags to a PDF Document.....................................................................................9 
The TouchUp Reading Order Tool.................................................................................10 
Using the Tags Tab.........................................................................................................16 
Accessibility Checker......................................................................................................19 
Paper Capture Plug-In...................................................................................................20 
Creating Tables...............................................................................................................20 
Creating Forms...............................................................................................................21 
Increasing PDF Document Accessibility........................................................................23 
JAWS Specific Keystrokes for Adobe Reader 6..............................................................26 
Using JAWS with PDF Forms........................................................................................26 
Using Window-Eyes for PDFs........................................................................................27 
Notes:..............................................................................................................................27 
W
EB 
R
ESOURCES
................................................................................................................29 
Adobe Acrobat 7.0 Website.............................................................................................29 
Accessibility Information at Adobe.................................................................................29 
Accessibility Information and Support...........................................................................29 
VB.NET PDF File Split Library: Split, seperate PDF into multiple
Demo Code in VB.NET. The following VB.NET codes explain how to split a PDF file into multiple ones by PDF bookmarks or outlines.
bookmarks pdf; bookmark pdf in preview
C# PDF File Compress Library: Compress reduce PDF size in C#.net
Easy to compress & decompress PDF document file in .NET framework. Remove bookmarks, annotations, watermark, page labels and article threads from PDF while
acrobat split pdf bookmark; bookmarks in pdf reader
C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
Export PDF images to HTML images. SDK, preserves all the original anchors, links, bookmarks and font style that are included in target PDF document file.
edit pdf bookmarks; pdf bookmark
C# Create PDF Library SDK to convert PDF from other file formats
etc. Create writable PDF from text (.txt) file. file. Create and save editable PDF with a blank page, bookmarks, links, signatures, etc. Create
split pdf by bookmark; add bookmark pdf file
Adobe Acrobat 7.0 Professional for Windows 
Publisher: 
Adobe Systems 
http://www.adobe.com
http://access.adobe.com
Retail Cost: 
Educational discount for California community colleges: http://www.foundationccc.org
Adobe Online Store: http://store.adobe.com/store/main.jhtml
System Requirements: 
Intel® Pentium® processor (not yet possible to create tagged PDF from MS Office in OS 
X system) 
Windows NT® 4.0 with Service Pack 6, Windows 2000 with Service Pack 2, Windows 
XP Home/Professional 
64 MB of RAM (128 MB recommended), 245 MB of available hard-disk space 
CD-ROM, MS Internet Explorer 5 or greater 
Description 
Adobe Systems PDF format is widely used online for dissemination of documents.  A PDF 
(portable document format) file is a graphical file that is an exact image of a document 
originally created by another application (e.g., MS Word file) and then converted by Adobe 
Acrobat into PDF format.  A PDF document can be viewed using Adobe Reader, which is a 
free viewer program that provides access to the PDF document.  The Adobe Reader viewer 
allows users to view and enter information into a PDF document (where applicable) as well 
as enlarge the viewing area of the document. 
Accessible PDF documents can be created using the Adobe Acrobat software application in 
conjunction with Microsoft Word, Excel, PowerPoint 2000/XP/2003 applications.  The use 
of Adobe Acrobat and a supported word-processing application creates a "tagged" PDF 
document, where document presentation is separated from document content.  Assistive 
computer technology applications have the capacity to then read the "tagged" PDF document 
to communicate information to the user. 
Basic Use 
Instructions for downloading and installing the latest versions of Acrobat Reader as well as 
additional Acrobat plug-ins to increase the functionality and accessibility can be found at 
http://access.adobe.com
.  While this manual focuses on the use of Adobe Acrobat 7.0 
Professional to make content accessible, it is possible to use Adobe Acrobat 6.0 Standard or 
Adobe Acrobat 7.0 Standard as well (Note: Acrobat Standard does not support form 
development). 
How to C#: Basic SDK Concept of XDoc.PDF for .NET
PDFTextMgr. This class provides APIs to manipulate text contents in a PDF document. OutLines. This class describes bookmarks in a PDF document.
bookmark pdf documents; how to bookmark a pdf page
VB.NET PDF: Basic SDK Concept of XDoc.PDF
PDFTextMgr. This class provides APIs to manipulate text contents in a PDF document. OutLines. This class describes bookmarks in a PDF document.
adding bookmarks to a pdf; add bookmarks to pdf online
Creating a New PDF Document 
Creating a new PDF document offers the most flexibility to insure accessibility is designed 
into the document.  Adobe Acrobat 7.0 is designed to work effectively with MS Office 
2000/XP applications and later (i.e., Word 2000/XP, PowerPoint 2000/XP, etc.) to create a 
"tagged" PDF structure.  Before a document can be translated to a PDF document format, it 
is necessary to check the conversion settings of the Adobe Acrobat PDFMaker within 
Microsoft Office.  The default settings should produce a tagged PDF document from MS 
Word. 
To check conversion settings: 
1.  Open a document in the Microsoft Office application. 
2.  Choose Adobe PDF from the menu bar and select "Change Conversion Settings". 
3.  Make sure that "Enable accessibility and reflow with Tagged PDF" is checked. 
4.  Select "OK". 
Creating the PDF Document: 
1.  Create/open the document in the Microsoft Office application. 
2.  Use the styles and formatting elements provided in the Office application to control 
the presentation of the document.  For example, do not use tabs and spaces to 
visually present a two-column document.  Rather, use the column-formatting 
element to control the presentation of the information.  Styles can be manipulated 
under Styles and Formatting from Format in the menu bar. 
3.  Choose "Adobe PDF" from the menu bar and select "Convert to Adobe PDF" 
(alternatively, click the Convert to Adobe PDF button on the application toolbar). 
4.  Name and save the file. 
5.  Open Adobe Acrobat and view the document's tagged structure to insure the 
information is contained in the correct order. 
PDFs with Images 
If using images in a PDF document created from MS Word/Excel/PowerPoint, it is possible 
to add alternative text to represent the image for individuals using assistive computer 
technology.  This method should be used for image content that is relatively simple and does 
not require extensive description of the image.  If a longer description of the image is 
necessary to fully explain its content, consider inserting a more detailed description of the 
image within the document text that precedes and follows the image. 
To insert simple alternative text: 
1.  Create/open the document in the Microsoft Office application. 
2.  Select the image and perform a right-mouse button click and select "Format Picture" 
from the options.  Alternatively, you may select the image and choose "Format" 
from the menu bar and then "Picture". 
3.  Under the "Web" tab, enter a short text description of the image.  Be descriptive as 
to what the image is and the purpose of the image.  For instance, if using a screen-
shot of the PDFMaker window in Adobe Acrobat, identify the image as:  
"Screenshot of the PDFMaker in Microsoft Word identifying the checkbox Enable 
Accessibility and Reflow with Tagged PDF is checked." 
4.  Select "OK" and continue with the document creation. 
Adding Alternative Text after Tagging 
Some situations will require you to add alternative text to images or figures after adding tags 
to a PDF document (adding tags will be covered later in the manual).  To add alternative text, 
identify the image/figure in question and perform a right-mouse button click.  Choose the 
"Edit Alternative Text" option.  This will allow you to enter the appropriate alternative text 
for the image/figure you selected. 
Converting Existing PDF Documents 
Adobe Acrobat 7.0 continues to separate presentation from content when using a PDF file.  
PDF documents created without using Microsoft Office, created using Acrobat Distiller, or 
another program that exports to PDF, results in a PDF document that does not contain a 
"tagged" document structure.  This causes increased difficulty (if not the impossibility) for 
assistive computer technology to gain access to the document information.  In fact, the PDF 
document may actually be only a "picture" of the information (i.e., Image-Only PDF) with no 
underlying text information.  The following recommendations are designed to provide 
guidance when having to choose what type of method is most appropriate to create an 
accessible PDF document.  Generally speaking, it is better to revert to the original file format 
(i.e., MS Word) when attempting to recreate an accessible PDF as the document can be 
created with a "tagged" document structure and result in improved access to the information 
by assistive computer technology. 
Recommendations when using MS Office applications: 
1.  If the original document is available, open that file in a Microsoft Office application 
(if possible).  Format the presentation of the document using the style elements 
found under Format on the menu bar.  Remember to add an appropriate "alt-tag" to 
graphics and figures containing information through the Picture Properties menu.  
Once this process is complete, follow the directions under the Creating the PDF 
Document section. 
2.  If the original document is not available (or cannot be opened in a Microsoft Office 
application), open the PDF document in Adobe Acrobat 7.0.  Then, follow the 
directions in the next section, titled "Adding Tags to a PDF Document". 
3.  If the PDF document exists in an "Image Only" file format, it will be necessary to 
use the Paper Capture tool in Adobe Acrobat or Adobe Capture software 
application (or another OCR program of your choice).  The Paper Capture tool or 
Adobe Capture software provides Optical Character Recognition of the PDF 
document image to yield a document containing text content (not a graphic 
representation of the image).  This is similar to starting with a TIFF document from 
a scanner, and then using an OCR program such as OmniPage or ABBY 
FineReader to recognize the actual letters and symbols on the page.  The Paper 
Capture tool in Adobe Acrobat may be found under the "Document" heading from 
the menu bar. 
Adding Tags to a PDF Document 
Adobe Acrobat 7.0 allows users to create a tagged PDF document from untagged PDF files.  
Tagged PDF documents are necessary for greater user accessibility as well as the capacity to 
save a PDF document into alternate formats (e.g., HTML, Accessible Text, RTF, etc.).  
Additionally, tagged PDF documents provide the ability to "reflow" the text information in a 
PDF file to fit different screen dimensions. 
If creating electronic forms, it is necessary to use Adobe Acrobat 7.0 Professional or Adobe 
Designer 7.0 to create accessible form fields.  If the forms may require updating on a regular 
basis it is recommended to review Adobe Designer to deliver accessible interactive forms.   
Adding tags manually to a PDF document does have some limitations.  While Acrobat can 
automatically add tags to a PDF document, there is no guarantee that the document content 
will be tagged in the correct reading order.  Documents that contain regions of high 
complexity, such as visually-rich layouts, may not result in a tagged structure that follows the 
logical reading order of the original document.  Any graphics or charts in the PDF document 
may not be processed correctly and may be rendered as "Figures" or "Inline Shapes".  It is 
necessary to identify these items and add the appropriate alternative text descriptions. 
Adobe Acrobat 7 provides improved functionality to reorder and specify the logical reading 
order of the PDF document using the "TouchUp Reading Order" tool.  However, it is 
necessary to first add tags to the document. 
Adding Tags: 
1.  Open the PDF document that does not contain the tagged structure. 
2.  Select Advanced from the menu bar. 
3.  Select Accessibility. 
4.  Choose "Add Tags to Document". 
5.  After the program finishes processing the document, use Save As and save the file 
with a new name. 
6.  Open the new PDF document to check the logical order of the tagged file. 
Note:  A shortcut method of assessing the logical reading order of the tagged PDF document 
is to save the PDF file as text.  Check the logical reading order of the text file as to where 
there may be errors in order of the tags in the PDF document. 
The TouchUp Reading Order Tool 
The TouchUp Reading Order tool is new for Adobe Acrobat 7 and provides the opportunity 
to evaluate the reading order of the PDF document content and make necessary corrections.  
After adding tags to a PDF document, the TouchUp Reading Order tool will identify blocks 
of text, headings, figures, tables, and formulas that are contained within the document 
structure.  Additionally, if the PDF document contains images (or figures) containing 
pertinent information, then it is necessary to use the TouchUp Reading Order tool to add the 
appropriate alternate text. 
While it is possible to manually add and restructure the tags in a PDF document, it is 
recommended to use the "Add Tags to Document" function followed by the TouchUp 
Reading Order tool to organize the logical flow of document information.  Open the 
TouchUp Reading Order tool by: 
1.  Selecting "Advanced" from the menu bar and choosing "Accessibility". 
2.  Choosing "TouchUp Reading Order". 
10 
Documents you may be interested
Documents you may be interested