Using PDF Files in CONTENTdm 
January 6, 2016  
Page 11 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Figure 10: Project spreadsheet 
7. In the Project Spreadsheet, edit the title in the required Title field and enter other
metadata. (Or open the item in the Item Editing tab for access to more editing
features.)
For more information, see Entering Metadata and Using the Item Editing Tab
Note: We do not enter metadata in the Description field because it has been 
designated as the full text search field and contains the extracted text. 
Step 6: Upload the PDF file 
After you have added the PDF file to your project, you can upload it to the pending queue on 
the server, where it can be reviewed and approved by an administrator before being added to 
your collection. 
For more information about how to upload a file, see Uploading Items from the Project 
Tab
Step 7: Approve the PDF file 
After your file is uploaded to the pending queue, it must be approved by your CONTENTdm 
administrator in order to be added and viewable in the collection. 
When it is approved, the PDF file is added to the collection on the CONTENTdm Server. The 
first 128,000 characters are extracted from the PDF and put into the Description field, which 
we designated as the full text search field in step 3. (If the text in the PDF is longer than that, 
the text is truncated. If the full text search field already contained data, the text would not be 
extracted.) 
Step 8: Index the collection 
Finally, after the file is approved, your CONTENTdm administrator must index the collection. 
This builds the text index that makes the PDF file discoverable via search. 
The PDF file is now searchable and viewable inline in the CONTENTdm Item Viewer. 
Pdf text searchable - search text inside PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn how to search text in PDF document and obtain text content and location information
search pdf documents for text; select text in pdf
Pdf text searchable - VB.NET PDF Text Search Library: search text inside PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn How to Search Text in PDF Document and Obtain Text Content and Location Information in VB.NET application
how to select all text in pdf; how to make a pdf document text searchable
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 12 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Figure 11: Multiple-page PDF file displayed as a single-item PDF inline in the Item Viewer 
Importing a Multiple-Page PDF File as a Compound Object 
You can import multiple-page PDF files to display in your collections in the Compound Object 
Viewer. In this example we will import the same multiple-page PDF file as a PDF compound 
object. 
Step 1: Confirm that Adobe Reader is installed 
Because we want to be able to view the PDF in the Project Client, we first confirm that Adobe 
Reader is installed on the Project Client computer. (To download and install the latest version 
of Adobe Reader, see http://get.adobe.com/reader/.)  
Step 2: Confirm source file type and security settings 
Confirm that the file name for the item you want to add has the extension .pdf. In this case, 
the source document is named Census92.pdf. (If the file extension is .doc or another format, 
you will need to first convert to PDF by using software such as Adobe Acrobat®.) 
Next confirm that the PDF file is not password-protected, encrypted or locked. (If it is 
encrypted or locked, a thumbnail may not be generated, it may not be converted to a 
compound object, and text is not extracted in CONTENTdm.) One way to test for security 
settings is to try opening the document on your computer using Adobe Reader. You may see a 
message similar to the following. For more information, see the Troubleshooting section of 
this tutorial. 
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
NET project. Powerful .NET control for batch converting PDF to editable & searchable text formats in C# class. Free evaluation library
how to select all text in pdf file; pdf searchable text converter
C# Create PDF Library SDK to convert PDF from other file formats
The PDF document file created by RasterEdge C# PDF document creator library is searchable and can be fully populated with editable text and graphics
search pdf for text in multiple files; pdf find highlighted text
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 13 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Figure 12: Adobe Reader security warning 
If you need to modify the security settings, you may need permission to change the settings 
from the document owner, and then use Adobe Acrobat to edit and save the PDF file. 
Step 3: Confirm collection settings 
Because we have decided to add this multiple-page PDF file as a compound object, we confirm 
with the CONTENTdm administrator that the collection has PDF conversion enabled for 
multiple-page PDF files in CONTENTdm Administration. (This setting is displayed in 
CONTENTdm Administration under the Collections tab on the Collection Configuration page.)    
Note: See also the following Confirm Project Setting step because some settings can be set 
locally in the Project Client to override the server settings. 
Figure 13: PDF conversion setting enabled for the collection in CONTENTdm Administration 
Each page of this multiple-page PDF file will have a metadata record. When the PDF compound 
object is added to the Project Spreadsheet, the text from each page (up to 128,000 
characters) is extracted from the PDF and put into the full text search field for the metadata 
record for each page. 
Therefore, as with the single-item PDF file, we need to confirm that one metadata field has 
been set to the type Full Text Search. 
For this example, we have set the Description field for the collection to the data type Full Text 
Search in CONTENTdm Administration. 
VB.NET Image: Robust OCR Recognition SDK for VB.NET, .NET Image
for VB.NET provides users fast and accurate image recognition function, which converts scanned images into searchable text formats, such as PDF, PDF/A, WORD
pdf searchable text; select text in pdf reader
VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net
keeping original layout. VB.NET control for batch converting PDF to editable & searchable text formats. Support .NET WinForms, ASP
pdf text select tool; search a pdf file for text
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 14 of 23 
Figure 15: Project Settings Manager, Processing page 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Figure 14: Metadata Fields page in CONTENTdm Administration 
Step 4: Confirm project settings 
Although we confirmed settings on the CONTENTdm Server, settings can be set for the project 
in the Project Client. These settings can override the server settings. 
1. Access the Project Settings Manager, and click the Processing tab. The
Processing page displays.
C# HTML5 Viewer: Load, View, Convert, Annotate and Edit Word
C# users can convert Convert Microsoft Office Word to searchable PDF online, create multi empowered to add annotations to Word, such as add text annotations to
text select tool pdf; how to select text in pdf reader
Online Convert PDF to Text file. Best free online PDF txt
PDF document conversion SDK provides reliable and effective .NET solution for Visual C# developers to convert PDF document to editable & searchable text file.
text searchable pdf file; select text in pdf file
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 15 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
2. Confirm that PDF File Conversion is set to Convert multiple-page PDF files to
compound objects.
3. Check the PDF Print Quality setting.
This setting enables you to specify the quality of the optional print versions (PDF) of
the compound object. The quality is determined by this setting in relation to the
quality of the original source material. Select a higher-quality setting for items
where the PDF quality is important to your end users, or select lower-quality settings
to improve processing and rendering times of the user experience. (For more
information, see Processing.)
Figure 16: Convert multiple-page PDF files to compound objects 
4. Click OK to save any changes.
Step 5: Add the PDF file as a compound object 
The general steps for adding a multiple-page PDF file to your project are the same as adding a 
single-item PDF file or other individual files. 
For more information, review the steps outlined for adding a single-item PDF file in the 
example above. 
After the item is added to the Project Spreadsheet, you can edit the title for the compound 
object-level record in the required Title field and enter other metadata. (Or open the item in 
the Item Editing tab for access to more compound object editing features.)  
For more information, see Entering Metadata and Using the Item Editing Tab
Note: We do not enter metadata in the Description field because it has been designated as 
the full text search field and contains the extracted text. 
Step 6: Upload the PDF file 
After you have added the PDF file to your project and entered metadata, you can upload it to 
the pending queue on the server, where it can be reviewed and approved by an administrator 
before being added to your collection. 
For more information about how to upload a file, see Uploading Items from the Project 
Tab
Step 7: Approve the PDF file 
After your file is uploaded to the pending queue, it must be approved and indexed by your 
CONTENTdm administrator to be viewable in the collection. 
VB.NET Create PDF from Text to convert txt files to PDF in vb.net
Best VB.NET adobe text to PDF converter library for Visual Studio .NET project. Batch convert editable & searchable PDF document from TXT formats in VB.NET
how to select text in pdf and copy; pdf searchable text converter
C# Create PDF from Text to convert txt files to PDF in C#.net, ASP
Visual Studio .NET project. .NET control for batch converting text formats to editable & searchable PDF document. Free .NET library for
pdf text search; search multiple pdf files for text
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 16 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Step 8: Index the collection 
Finally, after the file is approved, your CONTENTdm administrator must index the collection. 
This builds the text index that makes the PDF compound object discoverable via search. 
The PDF compound object and all of its pages are now searchable and viewable inline in the 
CONTENTdm Compound Object Viewer.  
Figure 17: Multiple-page PDF file displayed as a compound object 
Section IV 
Editing PDF Files 
After your PDF files have been uploaded, approved, and indexed to a collection, the metadata 
for single-item PDF files and PDF compound objects can be edited by using the Web interface 
or the Project Client, similar to how you edit other items and objects but with some 
considerations for how they are structured and processed. 
PDF compound objects have editable metadata records for each page, as well as for
the compound object itself.
You cannot replace or remove individual pages of PDF compound objects using the
Project Client or the Web interface. To replace individual pages of PDF compound
objects, you must delete the compound object from the collection, replace the pages
in the original PDF file, and import the file again.
You cannot delete individual pages of a PDF compound object.
Permission settings for PDF compound objects apply to all pages of the compound
object. You cannot set permissions for individual pages of PDF compound objects.
Editing a PDF Compound Object Using the Project Client 
You can edit the metadata, display page names, thumbnails and permissions of a PDF 
compound object using the Project Client. (For more information about using the Project Client 
for editing, see Editing Items in a Collection in the Help files.) 
Note: When you download items from a collection into your project, the items are locked  
from editing by other users but are still available for viewing in the Web interface. 
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
Export all Word text and image content into high quality Professional .NET PDF batch conversion control. Easy to create searchable and scanned PDF files from
how to select text in pdf; how to search a pdf document for text
VB.NET Create PDF from PowerPoint Library to convert pptx, ppt to
PDF, VB.NET convert PDF to text, VB.NET multiple pages PowerPoint to fillable and editable PDF documents. Easy to create searchable and scanned PDF files from
convert pdf to searchable text; find and replace text in pdf
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 17 of 23 
Figure 19: Search results in Find in Collection tab  
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Step 1: Find the compound object and page-level records & add to the Project 
Spreadsheet for editing 
1. Open the Project Client project that is associated with the collection you wish to edit.
2. Click the Find in Collection tab.
3. Browse for the items in the collection by clicking Browse Collection or conduct a
search by typing keywords in the search box and clicking Search. (Or construct a
more detailed search by clicking My Advanced Search.)
Figure 18: Finding items in the collection  
For more information about using the advanced search or the other features in the 
Find in Collection tab, see Using the Find in Collection Tab
4. Search and browse results are displayed.
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 18 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
5. Locate the PDF compound object to edit, and select the checkbox. Then click Add to
Project (Edit).
The selected items are added to the Project Spreadsheet, a locked icon displays and
the item rows change color on the Find in Collection tab.
Note: Although you can add more than 10,000 items at a time, we recommend
downloading less than 10,000 items at a time from the server to maintain
acceptable download times.
Step 2: Edit the records in the Project Spreadsheet 
Using the Project Spreadsheet and the Item Editing Tab, we can edit metadata for the 
compound object and the individual pages of the compound object. 
Note: If you download and then delete an item from your project (whether or not you make 
any changes), the item is unlocked and returns to its original state within the collection. 
In this example, we open a PDF compound object in the Item Editing tab and edit the contents 
of the Subject field for several pages. For more information about all of the compound object-
editing features provided by the Item Editing Tab, see Using the Item Editing Tab
1. From the Project tab Project Spreadsheet, double-click the thumbnail. The PDF
compound object opens in a new tab, with the compound object-level record
displayed.
Note: Use the View Structure drop-down menu to change the view of the
compound object navigation pane. This enables you to switch between a structural,
thumbnail or spreadsheet view of the PDF file. (The spreadsheet view provides fill
functions and the other editing options that are available when using the project
spreadsheet.)
Figure 20: Item Editing Tab 
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 19 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
2. After you enter metadata in the Subject field for the compound object-level record,
use the navigation pane to click through the pages of the object and enter metadata
for the Subject field of those records. (Alternatively, if all Subject fields will have the
same metadata, you can switch to the spreadsheet view and use the Fill
Compound Object option. This option fills the same data in the selected field for all
pages of the compound object. For more information, see Using Fill Functions.)
Figure 21: Editing metadata of a page of the compound object 
3. Click Save to save your changes.
Step 3: Upload the items for approval 
When you are finished editing, select the item in the Project Spreadsheet and then click 
Upload for Approval. Items are sent to the pending queue for approval. 
Editing a PDF Compound Object Using the Web Interface 
To edit items using the Web interface, you must have CONTENTdm administrator rights to edit 
and approve metadata. For more information about using the Web interface for editing, see 
Editing Items in the Help files.  
Step 1: Find the compound object and page-level records 
Editing a compound object begins with searching for the compound object and its pages. (You 
can browse the entire collection, however, to edit pages within a compound object, you must 
search for the pages, because subpages are suppressed while you are browsing.)  
1. In CONTENTdm Administration, go to the Items tab and then click Edit. In this
example, we then search for the term “arizona.”
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 20 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Figure 22: Searching for items to edit using CONTENTdm Administration 
2. In this example, search results display 15 items (the PDF compound object and the
individual pages that make up that compound object).
Figure 23: Search results 
Note: PDF compound objects do not display a structure option. You cannot edit or 
delete individual pages of PDF compound objects by using CONTENTdm 
Administration. To edit or delete individual pages of PDF compound objects, you must 
Documents you may be interested
Documents you may be interested