pdf to datatable c# : Bookmark pdf documents software SDK cloud windows winforms web page class acrobat_reference47-part185

465
Accessibility, tags, and reflow
Last updated 5/10/2016
Correct table tags with the Tags panel
Use the Touch Up Reading Order tool to make sure that tables are tagged correctly. If you need to structure figures and 
text within the cells of your table, you may prefer to re-create the table in the authoring application before you convert 
it as an accessible PDF. Adding tags on a cell level in Acrobat is a labor-intensive procedure.
Before you make any changes to table elements, use the Touch Up Reading Order tool to determine that the table is 
tagged correctly.
Check table elements
In the Tags panel, expand the tags root to view a table tag.
Select the table tag <Table> and verify that it contains one of the following elements:
• Table Rows, each of which contains Table Header <TH> or Table Data<TD> cells.
• <THead>, <TBody>, and <TFoot> sections, each of which containsTable Rows. (The Table Rows contain <TH> 
cells, <TD> cells, or both.)
Do one or more of the following:
• If the tag for the table doesn’t contain these elements, but rows, columns, and cells appear in the table in the
document pane, use the Touch Up Reading Order tool to select and define the table or individual cells.
• If the table contains rows that span two or more columns, set ColSpan and RowSpan attributes for these rows in
the tag structure.
• Re-create the table in the authoring application, and then convert it to a tagged PDF.
Set ColSpan and RowSpan attributes
In the Tags panel, select a <TD> or <TH> element.
Choose Properties from the options menu.
In the Touch Up Properties dialog box, click the Tag panel, and then click Edit Attribute Objects.
Select Attribute Objects, and then click New Item to create a new Attribute Object Dictionary.
Expand the new dictionary, select the Layout attribute, and then click Change Item.
Change the Layout value to Table.
Select the Attribute Object Dictionary, and click New Item.
In the Add Key And Value dialog box, type ColSpan or RowSpan in the Key box, enter the number of columns or 
rows spanned in the Value box, choose Integer from the Value Type pop-up menu, and click OK.
Standard PDF tags
This section describes the standard tag types that apply to tagged PDFs. These standard tags provide assistive software 
and devices with semantic and structural elements to use to interpret document structure and present content in a 
useful manner.
The PDF tags architecture is extensible, so any PDF document can contain any tag set that an authoring application 
decides to use. For example, a PDF can have XML tags that came in from an XML schema. Custom tags that you define 
(such as tag names generated from paragraph styles of an authoring application) need a role map. The role map matches 
each custom tag to a standard tag here. When assistive software encounters a custom tag, the software can check this 
role map and properly interpret the tags. Tagging PDFs by using one of the methods described here generally produces 
a correct role map for the document.
Bookmark pdf documents - add, remove, update PDF bookmarks in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your C# Project with Rapid PDF Internal Navigation Via Bookmark and Outline
pdf bookmark editor; creating bookmarks in a pdf document
Bookmark pdf documents - VB.NET PDF bookmark library: add, remove, update PDF bookmarks in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your VB.NET Project with Rapid PDF Internal Navigation Via Bookmark and Outline
creating bookmarks pdf; how to bookmark a pdf in reader
466
Accessibility, tags, and reflow
Last updated 5/10/2016
Note: You can view and edit the role map of a PDF by choosing Options > Edit Role Map in the Tags panel.
The standard Adobe element tag types are available in the New Tag dialog box. They are also available in the Touch Up 
Properties dialog box in Acrobat Pro. Adobe strongly encourages using these tag types because they provide the best 
results when tagged content is converted to a different format. These formats include HTML, Microsoft Word, or an 
accessible text format for use by other assistive technologies.
Block-level elements are page elements that consist of text laid out in paragraph-like forms. Block-level elements are 
part of a document’s logical structure. Such elements are further classified as container elements, heading and 
paragraph elements, label and list elements, special text elements, and table elements.
Container elements
Container elements are the highest level of element and provide hierarchical grouping for other block-level elements.
Document 
Document element. The root element of a document’s tag tree.
Part 
Part element. A large division of a document; may group smaller units of content together, such as division 
elements, article elements, or section elements.
Div 
Division element. A generic block-level element or group of block-level elements.
Art 
Article element. A self-contained body of text considered to be a single narrative.
Sect 
Section element. A general container element type, comparable to Division (DIV Class=“Sect”) in HTML, which 
is usually a component of a part element or an article element.
Heading and paragraph elements
Heading and paragraph elements are paragraph-like, block-level elements that include specific level heading and 
generic paragraph (P) tags. A heading (H) element should appear as the first child of any higher-level division. Six levels 
of headings (H1 to H6) are available for applications that don’t hierarchically nest sections.
Label and list elements
Label and list elements are block-level elements used for structuring lists. 
List element. Any sequence of items of similar meaning or other relevance; immediate child elements should be list 
item elements.
LI 
List item element. Any one member of a list; may have a label element (optional) and a list body element (required) 
as a child.
LBL 
Label element. A bullet, name, or number that identifies and distinguishes an element from others in the same list.
LBody 
List item body element. The descriptive content of a list item.
Special text elements
Special text elements identify text that isn’t used as a generic paragraph (P). 
BlockQuote 
Block quote element. One or more paragraphs of text attributed to someone other than the author of the 
immediate surrounding text.
Caption 
Caption element. A brief portion of text that describes a table or a figure.
Index 
Index element. A sequence of entries that contain identifying text and reference elements that point out the 
occurrence of the text in the main body of the document.
TOC 
Table of contents element. An element that contains a structured list of items and labels identifying those items; 
has its own discrete hierarchy.
C# PDF Print Library: Print PDF documents in C#.net, ASP.NET
view, Annotate,Convert documents online using ASPX. extract, copy, paste, C#.NET rotate PDF pages, C#.NET search text in PDF, C#.NET edit PDF bookmark, C#.NET
create bookmarks pdf file; auto bookmark pdf
VB.NET PDF Print Library: Print PDF documents in vb.net, ASP.NET
view, Annotate,Convert documents online using ASPX. extract, copy, paste, C#.NET rotate PDF pages, C#.NET search text in PDF, C#.NET edit PDF bookmark, C#.NET
edit pdf bookmarks; how to bookmark a pdf page
467
Accessibility, tags, and reflow
Last updated 5/10/2016
TOCI 
Table of contents item element. An item contained in a list associated with a table of contents element.
Table elements
Table elements are special elements for structuring tables. 
Table 
Table element. A two-dimensional arrangement of data or text cells that contains table row elements as child 
elements and may have a caption element as its first or last child element.
TR 
Table row element. One row of headings or data in a table; may contain table header cell elements and table data 
cell elements.
TD 
Table data cell element. A table cell that contains nonheader data.
TH 
Table header cell element. A table cell that contains header text or data describing one or more rows or columns of 
a table.
Inline-level elements
Inline-level elements identify a span of text that has specific formatting or behavior. They are differentiated from block-
level elements. Inline-level elements may be contained in or contain block-level elements.
BibEntry 
Bibliography entry element. A description of where some cited information may be found.
Quote 
Quote entry element. An inline portion of text that is attributed to someone other than the author of the text 
surrounding it; different from a block quote, which is a whole paragraph or multiple paragraphs, as opposed to inline 
text.
Span 
Span entry element. Any inline segment of text; commonly used to delimit text that is associated with a set of 
styling properties.
Special inline-level elements
Similar to inline-level elements, special inline-level elements describe an inline portion of text that has special 
formatting or behavior.
Code 
Code entry element. Computer program text embedded within a document.
Figure 
Figure entry element. A graphic or graphic representation associated with text.
Form 
Form entry element. A PDF form annotation that can be or has been filled out.
Formula 
Formula entry element. A mathematical formula.
Link 
Link entry element. A hyperlink that is embedded within a document. The target can be in the same document, 
in another PDF document, or on a website.
Note 
Note entry element. Explanatory text or documentation, such as a footnote or endnote, that is referred to in the 
main body of text.
Reference 
Reference entry element. A citation to text or data that is found elsewhere in the document.
More Help topics 
Accessibility features
Reading PDFs with reflow and accessibility features
Creating accessible PDFs
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
VB.NET Guide and Sample Codes to Merge PDF Documents in VB.NET Project. Batch merge PDF documents in Visual Basic .NET class program.
creating bookmarks in pdf documents; pdf reader with bookmarks
C# PDF Library SDK to view, edit, convert, process PDF file for C#
quality PDF conversions to or from multiple supported images and documents. for editing PDF document hyperlink (url) and quick navigation link in PDF bookmark.
creating bookmarks pdf files; excel pdf bookmarks
468
Accessibility, tags, and reflow
Last updated 5/10/2016
Touch Up Reading Order tool for PDFs (Acrobat Pro)
Keys for accessibility (Acrobat Pro)
Creating accessible PDFs
Workflow for creating accessible PDFs
At a high level, the process of creating accessible PDFs consists of a few basic stages:
Consider accessibility before you convert a document to PDF.
As needed, add fillable form fields and descriptions, and set the tab order.
Add other accessibility features to the PDF.
Tag the PDF.
Evaluate the PDF and repair tagging problems.
These stages are presented in an order that suits most needs. However, you can perform tasks in a different order or 
iterate between some of the stages. In all cases, first examine the document, determine its intended purpose, and use 
that analysis to determine the workflow that you apply.
Additional resources
For more information about creating accessible PDFs, see these resources:
• Guide to creating accessible electronic documents, including
PDFs:http://www.section508.gov/content/build/create-accessible-documents/
• Best practices: amp.ssbbartgroup.com
Consider accessibility before you convert a document to PDF
Whenever possible, think about accessibility when you create the source files in an authoring application, such as a 
word-processing or page-layout application.
Typical tasks in the authoring application include adding alternate text to graphics, optimizing tables, and applying 
paragraph styles or other document-structure features that can be converted to tags. For more information, see 
Creating a tagged PDF from an authoring application.
Add fillable form fields and descriptions, and set the tab order
If your PDF includes form fields, use Tools > Accessibility > Run Form Field Recognition to detect form fields and make 
them interactive (fillable).
Use the Forms tools to create fillable form fields, such as buttons, check boxes, pop-up menus, and text boxes. When 
you create a field, type a description in the Tooltip box in the Properties dialog box for that field. Screen readers read 
this text aloud to the user. For more information, see Create form fields.
You can also use the Touch Up Reading Order tool in Acrobat Pro to add descriptions to form fields.
For information on setting the tab order to use document structure, see Set form field navigation.
C# PDF File Compress Library: Compress reduce PDF size in C#.net
Thus, how to compress large-size existing PDF documents is quite useful for increasing the efficiency and productiveness of existing document management system
how to add bookmark in pdf; add bookmark pdf
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
C#.NET PDF Library - Merge PDF Documents in C#.NET. Provide NET components for batch combining PDF documents in C#.NET class. Powerful
add bookmarks pdf; how to bookmark a page in pdf document
469
Accessibility, tags, and reflow
Last updated 5/10/2016
Add other accessibility features to the PDF
In Acrobat Pro DC, this stage includes setting the document language, making sure that security settings don’t interfere 
with screen readers, creating accessible links, and adding bookmarks. For more information, see Document language, 
Prevent security settings from interfering with screen readersAccessible links, and Bookmarks.
In Acrobat Standard DC, this stage includes setting the document language, making sure that security settings don’t 
interfere with screen readers, and adding bookmarks. For more information, see Document languagePrevent security 
settings from interfering with screen readers, and Bookmarks.
Tag the PDF
Improve the accessibility of PDFs by adding tags in Acrobat. If a PDF doesn’t contain tags, Acrobat attempts to tag it 
automatically when users read or reflow it, and the results may be disappointing. With a tagged PDF, the logical 
structure tree sends the contents to a screen reader or other assistive software or hardware in an appropriate order.
For best results, tag a document when converting it to PDF from an authoring application. Examples of these 
applications include Adobe FrameMaker®, Adobe InDesign®,Microsoft Word, or OpenOffice Writer. If you do not have 
access to an authoring application that can generate a tagged PDF, you can tag a PDF any time by using Acrobat.
Tagging during conversion to PDF requires an authoring application that supports tagging in PDF. Tagging during 
conversion enables the authoring application to draw from the paragraph styles or other structural information of the 
source document to produce a logical structure tree. The logical structure tree reflects an accurate reading order and 
appropriate levels of tags. This tagging can more readily interpret the structure of complex layouts, such as embedded 
sidebars, closely spaced columns, irregular text alignment, and tables. Tagging during conversion can also properly tag 
the links, cross-references, bookmarks, and alternate text (when available) that are in the file. 
To tag a PDF in Acrobat, choose Tools > Accessibility > Add Tags To Document. This command works on any untagged 
PDF, such as one created with Adobe PDF Printer. Acrobat analyzes the content of the PDF to interpret the individual 
page elements, their hierarchical structure, and the intended reading order of each page. Then, it builds a tag tree that 
reflects that information. It also creates tags for any links, cross-references, and bookmarks that you added to the 
document in Acrobat.
The Add Tags To Document command adequately tags most standard layouts. However, it cannot always correctly 
interpret the structure and reading order of complex page elements. These elements include closely spaced columns, 
irregular text alignment, nonfillable form fields, and tables that don’t have borders. Tagging these pages by using the 
Add Tags To Document command can result in improperly combined elements or out-of-sequence tags. These issues 
cause reading order problems in the PDF.
About watermarks and screen readers
You can add a watermark to a tagged PDF without adding it to the tag tree. Not having a watermark appear in the tag 
tree is helpful for people who are using screen readers, because they won’t hear the watermark read as a document 
content. 
The best way to add a watermark that doesn’t interfere with screen readers is to insert an untagged PDF of the 
watermark into a tagged PDF. 
Evaluate the PDF and repair tagging problems (Acrobat Pro DC)
Once you have a tagged PDF, evaluate the document for reading order problems, tagging errors, and accessibility errors, 
and then repair them as needed.
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
Create fillable and editable PDF documents from Excel in Visual Basic .NET class. Change Excel hyperlink to PDF hyperlink and bookmark.
pdf bookmarks; convert word pdf bookmarks
VB.NET PDF File Split Library: Split, seperate PDF into multiple
Split PDF document by PDF bookmark and outlines in VB.NET. file to one-page PDF files or they can separate source PDF file to smaller PDF documents by every
add bookmark pdf file; pdf export bookmarks
470
Accessibility, tags, and reflow
Last updated 5/10/2016
Whichever method you use to tag the PDF, use Acrobat to touch up the tagging and reading order for complex page 
layouts or unusual page elements. For example, the Add Tags To Document command can’t always distinguish between 
instructive figures and decorative page elements such as borders, lines, or background elements. It may incorrectly tag 
all of these elements as figures. Similarly, this command may erroneously tag graphical characters within text, such as 
drop caps, as figures instead of including them in the tag that represents the text block. Such errors can clutter the tag 
tree and complicate the reading order that assistive technology relies on.
If you tag a document from within Acrobat, the application generates an error report after it completes the tagging 
process. Use this report as a guide to repair tagging problems. You can identify other tagging, reading order, and 
accessibility problems for any PDF by using the Full Check tool or the Touch Up Reading Order tool. For more 
information, see Check accessibility of PDFs (Acrobat Pro DC)and Check and correct reading order (Acrobat Pro DC).
Create a tagged PDF from a web page
A PDF that you create from a web page is only as accessible as the HTML source that it is based on. For example, if the 
web page relies on tables for its layout design, the HTML code for the table may not flow in the same logical reading 
order as a tagged PDF would require, even though the HTML code is sufficiently structured to display all the elements 
correctly in a browser. 
Depending on the complexity of the web page, you can do extensive repairs in Acrobat Pro by using the Touch Up 
Reading Order tool or editing the tag tree in Acrobat. 
To produce the most accessible PDFs from web pages you create, first establish a logical reading order in their HTML 
code. For best results, employ the Web Content Accessibility Guidelines that are published by theWorld Wide Web 
Consortium (W3C). For more information, see the guidelines on the W3C website.
Do one of the following:
• In Acrobat, choose File > Create > PDF From Web Page, enter the web page address, and then click Settings.
• In Microsoft Internet Explorer, in the Adobe PDF toolbar, click the Down Arrow on the Convert button and
choose Preferences.
In the General tab, select Create PDF Tags, and then click OK.
Specify any other options as appropriate, and then click Create.
Creating a tagged PDF from an authoring application
In most cases, you create tagged PDFs from within an authoring application, such as Adobe FrameMaker®, Adobe 
InDesign, or Microsoft Word. Creating tags in the authoring application generally provides better results than adding 
tags in Acrobat. 
PDFMaker provides conversion settings that let you create tagged PDFs in Microsoft Excel, PowerPoint, and Word. 
For more information about creating accessible PDFs, see www.adobe.com/accessibility. 
For more information, see the documentation for your authoring application.
About tags in combined PDFs
You can combine multiple files from different applications in one operation to create a single PDF. For example, you 
can combine word-processing files with slide presentations, spreadsheets, and web pages. Choose File > Create > 
Combine Files Into A Single PDF.
During conversion, Acrobat opens each authoring application, creates a tagged PDF, and assembles these PDFs into a 
single tagged PDF.
C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
watermark and save PDF text, image, table, hyperlink and bookmark to Word without losing format. Powerful components for batch converting PDF documents in C#
bookmark pdf reader; create pdf bookmark
471
Accessibility, tags, and reflow
Last updated 5/10/2016
The conversion process doesn’t always correctly interpret the document structure for the combined PDF, because the 
files being assembled often use different formats. Use Acrobat Pro DC to create an accessible PDF from multiple 
documents.
When you combine multiple PDFs into one tagged PDF, it is a good idea to retag the combined document. Combining 
tagged and untagged PDFs results in a partially tagged PDF that isn’t accessible to people with disabilities. Some users, 
such as those using screen readers, are unaware of the pages that don’t have tags. If you start with a mix of tagged and 
untagged PDFs, tag the untagged files before proceeding. If the PDFs are all untagged, add tags to the combined PDF 
after you finish inserting, replacing, and deleting pages.
When you insert, replace, or delete pages, Acrobat DC accepts existing tags into the tag tree of the consolidated PDF in 
the following manner:
• When you insert pages into a PDF, Acrobat adds the tags (if any) for the new pages to the end of the tag tree. This
order occurs even if you insert the new pages at the beginning or the middle of the document.
• When you replace pages in a PDF, Acrobat adds the tags (if any) from the incoming pages to the end of the tag tree. 
This order occurs even if you replace pages at the beginning or the middle of the document. Acrobat retains the tags 
(if any) for the replaced pages.
• When you delete pages from a PDF, Acrobat retains the tags (if any) of the deleted pages.
Pages whose tags are out of order in the logical structure tree can cause problems for screen readers. Screen readers read 
tags in sequence down the tree, and possibly do not reach the tags for an inserted page until the end of the tree. To fix 
this problem, use Acrobat Pro DC to rearrange the tag tree. Place large groups of tags in the same reading order as the 
pages themselves. To avoid this step, plan on inserting pages to the end of a PDF, building the document from front to 
back in sequence. For example, if you create a title page PDF separately from the content, add the content PDF to the 
title page PDF, even though the content document is larger. This approach places the tags for the content after the tags 
for the title page. It’s unnecessary to rearrange the tags later in Acrobat Pro.
The tags that remain from a deleted or replaced page don’t connect to any content in the document. Essentially, they 
are large pieces of empty tag tree sections. These redundant tags increase the file size of the document, slow down 
screen readers, and can cause screen readers to give confusing results. For best results, make tagging the last step in the 
conversion process. Use Acrobat Pro DC to delete the tags of deleted pages from the tag tree.
For more information, see Create merged PDFs.
About tools for creating accessible PDF forms
Adobe offers several tools for the creation of accessible PDF forms:
Acrobat Pro DC, Acrobat Standard DC 
Use one of these applications to open untagged or tagged PDF forms (except 
PDF forms that are created from Adobe Designer) to add fillable form fields, such as text boxes, check boxes, and 
buttons. Then use the application’s other tools to make the form accessible. Add descriptions to form fields, tag 
untagged forms, set the set tab order, manipulate tags, and perform the other PDF accessibility tasks.
Authoring applications 
Most authoring applications that you can use to design forms don’t retain their fillable form 
fields when you convert the files to PDF. Use the forms tools in Acrobat Pro DC to add fillable form fields. Moreover, 
if you tag the form during conversion to PDF, the authoring application can generate inappropriate tags for the text 
labels of the form fields. In a complex form, for example, the text labels for all the fields can run together into a single 
line. Screen readers can’t interpret these fields as individual labels. Such reading order problems can require time-
consuming work in Acrobat Pro DC to split the labels apart. In this case, producing an untagged PDF form from the 
authoring application is sometimes the better course. You can then use the Forms tools in Acrobat Pro DC to add 
fillable form fields before you tag the entire document. Some forms are straightforward enough that you can produce 
472
Accessibility, tags, and reflow
Last updated 5/10/2016
a tagged PDF from the authoring application. Then perform light touch-up in Acrobat Pro DC after you add the fillable 
form fields.
Workflow for creating accessible PDF forms
Using Acrobat, you can open untagged and tagged PDF forms, add fillable form fields, add field descriptions and 
alternate text, set the tab order, and tag the forms (if they aren’t already tagged). You can also edit the tags of any tagged 
PDF form by using the Touch Up Reading Order tool or the tag tree. 
Design the form for accessibility.
Forms tend to have relatively complex layouts compared to documents that have a simple, single-column structure. The 
success that an application has in analyzing and tagging a form depends largely on the original formatting and layout 
of a document, and the types of fields that it uses.
When you design a form, include headings, instructions, and fields in which users are to enter data. At a minimum, 
give each field a label. Also add special instructions for fields that need them. Use graphics tools to draw lines and boxes. 
Don’t use characters, such as underscores and vertical bars, because these text characters can confuse screen readers.
Adding descriptions to form fields enables screen readers to identify the fields to users. Users hear the description read 
aloud when they tab to the field. Write descriptions that are terse but complete. For example, the description “First 
name” is appropriate for a first-name field. Don’t use instructions (such as “Enter first name”) as a description.
Set and test the tab order of a form.
The tab order for form fields enables people with disabilities to use a keyboard to move from field to field in a logical 
order. In PDF forms, set the tab order to Use Document Structure. You can test the tab order of a form by using the 
following keyboard commands: 
• Tab to move focus to the next field
• Shift+Tab to move focus to the previous field
• Spacebar to select options
• Arrow keys to select options or list items
Tag the PDF form and correct tagging issues.
If the PDF form is already tagged, use the Touch Up Reading Order tool in Acrobat to tag each form field. This tool also 
enables you to fix any reading order problems of the text labels for the form fields. For example, you may need to split 
merged lines of fields into individual fields.
More Help topics 
Accessibility features
Reading PDFs with reflow and accessibility features
Creating accessible PDFs
Touch Up Reading Order tool for PDFs (Acrobat Pro DC)
Editing document structure with the Content and Tags panels(Acrobat Pro DC)
Keys for accessibility (Acrobat Pro DC)
473
Last updated 5/10/2016
Chapter 13: Searching and indexing
Creating PDF indexes
Create and manage an index in a PDF
You can reduce the time required to search a long PDF by embedding an index of the words in the document. Acrobat 
DC can search the index much faster than it can search the document. The embedded index is included in distributed 
or shared copies of the PDF. Users search PDFs with embedded indexes exactly as they search those without embedded 
indexes; no extra steps are required.
Add an index to a PDF
With the document open in Acrobat DC, choose Tools > Index.
The Index toolset is displayed in the secondary toolbar.
In the secondary toolbar, click Manage Embedded Index.
In the Manage Embedded Index dialog box, click Embed Index.
Read the messages that appear, and click OK.
Note: In Outlook and Lotus Notes, you have the option of embedding an index when you convert email messages or 
folders to PDF. This is especially recommended for folders containing many email messages.
Update or remove the embedded index in a PDF
Choose Tools > Index.
The Index toolset is displayed in the secondary toolbar.
In the secondary toolbar, click Manage Embedded Index.
Click either Update Index or Remove Index.
About the Catalog feature (Acrobat Pro DC)
You can define a specific group of PDFs as a catalog and create a unified index for that entire collection of documents. 
When users search the cataloged PDFs for specific information, the index makes the search process much faster.
When you distribute the collection on a CD, you can include the index with the PDFs.
You can catalog documents written in Roman, Chinese, Japanese, or Korean characters. The items you can catalog 
include the document text, comments, bookmarks, form fields, tags, object and document metadata, attachments, 
document information, digital signatures, image XIF (extended image file format) metadata, and custom document 
properties.
474
Searching and indexing
Last updated 5/10/2016
Preparing PDFs for indexing (Acrobat Pro DC)
Begin by creating a folder to contain the PDFs you want to index. All PDFs should be complete in both content and 
electronic features, such as links, bookmarks, and form fields. If the files to be indexed include scanned documents, 
make sure that the text is searchable. Break long documents into smaller, chapter-sized files, to improve search 
performance. You can also add information to a file’s document properties to improve the file’s searchability.
Before you index a document collection, it’s essential that you set up the document structure on the disk drive or 
network server volume and verify cross-platform filenames. Filenames may be truncated and hard to retrieve in a cross-
platform search. To prevent this problem, consider these guidelines:
• Rename files, folders, and indexes using the MS-DOS file-naming convention (eight characters or fewer followed
by a three-character filename extension), particularly if you plan to deliver the document collection and index on
an ISO 9660-formatted CD-ROM disc.
• Remove extended characters, such as accented characters and non-English characters, from file and folder names.
(The font used by the Catalog feature does not support character codes 133 through 159.)
• Don’t use deeply nested folders or path names that exceed 256 characters for indexes that will be searched by Mac
OS users.
• If you use Mac OS with an OS/2 LAN server, configure IBM®LAN Server Macintosh (LSM) to enforce MS-DOS file-
naming conventions, or index only FAT (File Allocation Table) volumes. (HPFS [High Performance File System]
volumes may contain long unretrievable filenames.)
If the document structure includes subfolders that you don’t want indexed, you can exclude them during the
indexing process.
Adding metadata to document properties (Acrobat Pro DC)
To make a PDF easier to search, you can add file information, called metadata, to the document properties. (You can 
see the properties of the currently open PDF by choosing File > Properties, and clicking the Description tab.)
When adding data for document properties, consider the following recommendations:
• Use a good descriptive title in the Title field. The filename of the document should appear in the Search Results
dialog box.
• Always use the same option (field) for similar information. For example, don’t add an important term to the Subject
option for some documents and to the Keywords option for others.
• Use a single, consistent term for the same information. For example, don’t use biology for some documents and life 
sciences for others.
• Use the Author option to identify the group responsible for the document. For example, the author of a hiring policy 
document might be the Human Resources department.
• If you use document part numbers, add them as Keywords. For example, adding doc#=m234 in Keywords could
indicate a specific document in a series of several hundred documents on a particular subject.
• Use the Subject or Keywords option, either alone or together, to categorize documents by type. For example, you
might use status report as a Subject entry and monthly or weekly as a Keywords entry for a single document.
If you already have specialized training in Adobe PDF, you can define custom data fields, such as Document Type,
Document Number, and Document Identifier, when you create the index. This is recommended only for advanced
users and is not covered in Acrobat Complete Help.
Documents you may be interested
Documents you may be interested