c# download pdf from url : Add hyperlinks to pdf control SDK system web page winforms asp.net console Using%20PDF%20Files%20in%20CONTENTdm0-part661

Using PDF Files in CONTENTdm 
January 6, 2016  
© 2016 OCLC  
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Using PDF Files in CONTENTdm 
CONTENTdm® uses the Adobe® PDF Library™ to provide features for efficient processing of 
born-digital documents in Portable Document Format (PDF). PDF files and PDF compound 
objects can be displayed inline in the Item Viewer and Compound Object Viewer by using 
Adobe® Reader®. 
The PDF features include: 
Creation of thumbnail images from PDF files
Full text extraction (converted to UTF-8 format)
Automatic conversion of multiple-page PDF files into monograph compound objects
Pages of a compound object automatically generated from a PDF file do not count
toward the total number of items on the server
Search term highlighting within the PDF file
Configurable options for PDF file display in your website, using the Website
Configuration Tool
This tutorial provides an overview for using PDF files in CONTENTdm and steps through using 
the Project Client to import a multiple-page PDF file as a single item and then as a compound 
object. (If you use Connexion digital import to add items to your collection, see the Using 
OCLC Connexion Digital Import tutorial for more information. If you use the Web interface 
to add items, see Adding Items in the Help files.) This tutorial also steps through editing PDF 
items using the Project Client and the Web interface.  
This tutorial assumes that you are running CONTENTdm version 6 or later. It also assumes 
that you have installed Adobe Reader version 8 or later on the computer running the Project 
Learn About 
Section I: 
About PDF Files 
Section II:  Before You Begin 
Choosing the Format 
Configuring the Website 
Confirming Collection Configuration 
Section III:  Importing PDF Files Using the Project Client 
Importing a Single-Item PDF File 
Importing a Multiple-Page PDF File as a Compound Object 
Section IV:  Editing PDF Files 
Using the Project Client 
Using the Web Interface 
Section V:  
Add hyperlinks to pdf - insert, remove PDF links in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Free C# example code is offered for users to edit PDF document hyperlink (url), like inserting and deleting
add url link to pdf; add hyperlink to pdf in preview
Add hyperlinks to pdf - VB.NET PDF url edit library: insert, remove PDF links in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Help to Insert a Hyperlink to Specified PDF Document Page
change link in pdf file; add hyperlink to pdf acrobat
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 2 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Section I  Overview 
About PDF Files 
A single PDF file can contain many pages. Regardless of the number of pages, it is a single file 
and is uploaded as a single file. You can import multiple PDF files using the Add Multiple Items 
wizard in the Project Client. 
Depending on how your collection is configured, multiple-page PDF files can be added to your 
collection to be viewed as single items or, if PDF conversion is enabled, they can be 
automatically converted to PDF compound objects (of the type monograph). When multiple-
page PDF files are automatically converted to compound objects, each page of the PDF 
becomes a page with its own metadata record and each page is navigable using the features 
of the Compound Object Viewer. 
Note: To ensure an optimal end-user experience, PDF files (or pages of a compound object) 
larger than 20 MB are not loaded inline in any of the item viewers. These larger files can be 
saved to the desktop or opened outside of the browser. 
To support full text searching, text from PDF files is extracted and placed in a full text search 
field when PDF files are approved and added to a collection. Automatic text extraction occurs 
The file extension of the item is .pdf.
The text is embedded in the PDF file. (To check whether your PDF file has embedded
text, save it as a .txt file. If the text file contains the text, then the PDF has embedded
Note: If your PDF file was created from a born-digital document, such as a Microsoft 
Word file, it will almost always have embedded text. If your PDF file was created from 
scanned TIFF images, it does not have embedded text unless you have taken the 
additional step to OCR the image (or PDF file) and add that text to the PDF.  
CONTENTdm supports integrated OCR functionality through the OCR Extension
Using the OCR Extension, full text can be generated from JPEG2000, JPEG, GIF and 
TIFF files. OCR is not supported for PDF files. (The automatic text extraction for PDF 
files mentioned above is separate functionality and does not require the OCR 
The collection that the PDF is being added to has a full text search field.
The full text search field is empty when the item is added to the collection.
Thumbnail images can be automatically generated for PDF files, or you can specify a custom 
Single-Item PDF Files 
Single-item PDF files are created for PDF files that only contain one page. Single-item PDF files 
are also created by default for multiple-page PDF files, unless your CONTENTdm administrator 
has configured the collection for PDF conversion. (This setting can be turned on and off for 
each collection. Or you can set the PDF conversion option for your project in the Project 
Settings Manager of the Project Client.) 
By default, PDF files are displayed in the website in the CONTENTdm viewers using Adobe 
Reader, but you can use the Website Configuration Tool Page Types > PDF Files options to 
set the website display to link to the PDF file so that it opens in Adobe Reader in a new 
window (your website remains open in a separate window). 
C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
Embed PDF hyperlinks to HTML links. How to Use C#.NET Demo Code to Convert PDF Document to HTML5 Files in C#.NET Class. Add necessary references:
add hyperlinks pdf file; pdf links
VB.NET PDF Convert to HTML SDK: Convert PDF to html files in vb.
Turn PDF images to HTML images in VB.NET. Embed PDF hyperlinks to HTML links in VB.NET. Convert PDF to HTML in VB.NET Demo Code. Add necessary references:
add hyperlink to pdf online; pdf reader link
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 3 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Figure 1: Default single-item PDF display 
You also can use the Website Configuration Tool Page Types > PDF Files options to 
configure whether portions of the Adobe Reader interface display (embedded version) and 
whether search terms are passed through to the Adobe Reader search function (embedded 
PDF Compound Objects 
PDF compound objects are automatically created when multiple-page PDF files are added and 
approved to a collection, if that collection has been configured to enable PDF conversion (or if 
you have enabled it for your project in the Project Settings Manager of the Project Client). 
The page order of the PDF compound object matches the page order of the original, multiple-
page PDF file, and the end-user can navigate and view the document using the features of the 
Compound Object Viewer. 
VB.NET PDF Page Replace Library: replace PDF pages in C#.net, ASP.
all PDF page contents in VB.NET, including text, image, hyperlinks, etc. Replace a Page (in a PDFDocument Object) by a PDF Page Object. Add necessary references:
clickable links in pdf from word; pdf link
VB.NET PDF Thumbnail Create SDK: Draw thumbnail images for PDF in
PDF document is an easy work and gives quick access to PDF page and file, or even hyperlinks. How to VB.NET: Create Thumbnail for PDF. Add necessary references:
add url pdf; adding hyperlinks to a pdf
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 4 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Figure 2: Multiple-page PDF file displayed in the Compound Object Viewer 
Additionally, search term matches are highlighted in the PDF file in Adobe Reader and passed 
through to the Reader search function. (Search terms are also highlighted in the Page & Text 
Viewer and in the PDF inline display in the Item Viewer.)    
Figure 3: Search term matches are highlighted in the PDF file  and passed through to Adobe Reader search function 
Each page of the PDF file has its own metadata record after it is converted to a compound 
object, but the digital item associated with it in CONTENTdm is virtual (i.e., a link to the 
related page in the PDF file). The individual pages of PDF files do not exist separately on the 
server; they are extracted and displayed only when the user requests them. This improves the 
end-user’s access speed because the entire PDF file does not have to download to display the 
requested page. You cannot set permissions on individual pages or delete individual pages. 
When you set permissions for the PDF compound object they apply to all pages; and to delete 
pages, you must delete the entire PDF compound object. 
.NET PDF SDK | Read & Processing PDF files
by this .NET Imaging PDF Reader Add-on. Include extraction of text, hyperlinks, bookmarks and metadata; Annotate and redact in PDF documents; Fully support all
add link to pdf acrobat; add links to pdf document
PDF Image Viewer| What is PDF
advanced capabilities, such as text extraction, hyperlinks, bookmarks and Note: PDF processing and conversion is excluded in NET Imaging SDK, you may add it on
add link to pdf file; adding a link to a pdf in preview
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 5 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
You also cannot edit or restructure the individual pages of PDF compound objects unless you 
remove the PDF file from the collection, edit the original PDF, and then add it to the collection 
When a multiple-page PDF is added to a project in the Project Client, you can create 
compound object–level metadata by editing the record in the Project Spreadsheet or the Item 
Editing tab. When the multiple-page PDF file is added to the collection, text is extracted from 
each page and added to the full text search field in the associated page-level metadata 
Thumbnail images are generated automatically for each page the PDF compound object.. The 
thumbnail that represents the PDF compound object itself is based on the first page of the PDF 
file. (If you choose to use a custom thumbnail for a PDF compound object, the custom 
thumbnail is used for the compound object, as well as for each page of the object.) 
Note: Multiple-page PDF files that are imported as a part of a compound object are not 
converted to compound objects, even if PDF conversion is enabled for the collection. However, 
text is extracted and thumbnail images are generated.  
Section II 
Before You Begin 
Before you import PDF files to your collection, first determine the best format for your 
collection, and then confirm your style file settings for display and your collection 
Choosing the Format 
Before you decide to use PDF over another format, consider whether your source materials are 
well-suited to this format, and whether your end-user experience would be optimized by using 
PDF. For example, PDF files are ideal for documents that were initially created as digital 
documentation, such as theses and city council minutes originally saved as .doc files. PDF files 
may not provide an optimal end-user experience for scanned images, books, maps or 
Additionally, PDF is not ideal for scanned images because an item that has been scanned does 
not automatically contain embedded text. For scanned images, you can use the CONTENTdm 
OCR Extension for generating full text. PDF files created from images can be very large and 
slow to download for online viewing. For a better end-user experience, you can use 
CONTENTdm to create JPEG2000 or JPEG derivatives from scanned TIFF files, rather than 
converting the TIFF files to PDF files. 
If you determine that PDF is the right format, you then need to decide whether to display the 
PDF file as a single-item (and if it should use the default display or display inline) or, if it 
consists of multiple pages, whether it should be automatically converted to a PDF compound 
Note: For maintenance and for consistency in your collection display, you may also want to 
consider converting any existing PDF files in your collection so that they display and function 
similarly to those you add with the features introduced in CONTENTdm version 4.3. For more 
information, see the introduction to this tutorial. 
Configuring the Website 
After you have reviewed the content of your collection and determined the best overall format, 
you may need to edit the default Configurations in the Website Configuration Tool. For more 
information, see Page Types
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 6 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Confirming Collection Configuration 
Before you import PDF files, you need to confirm your collection settings because they 
determine how your PDF files are processed when they are added to the collection. The 
CONTENTdm administrator can confirm and change collection configuration and metadata field 
settings by using CONTENTdm Administration. 
Settings to confirm: 
PDF conversion: If you want to automatically convert multiple-page PDF files to
compound objects when they are added to the collection, confirm that the PDF
Conversion setting is set to Yes on the Collection Configuration page in CONTENTdm
Administration.  For more information, see Collection Configuration in the Help files.
Metadata fields: If you want text extracted for searching, you must set one
metadata field to the data type Full Text Search. This field holds the PDF text
extraction that happens for each page of the PDF compound object or the first
128,000 characters of a single-item PDF file. For more information, see Editing Field
Properties in the Help files.
Section III 
Importing PDF Files Using the Project Client 
PDF files can be imported using the single or batch operations in the Project Client. The 
following scenarios step you through importing single PDF files to existing collections. For 
more information about batch operations, see Add Multiple Items
When importing a file into your project, the original file remains in its existing location. A copy 
is added to the project. 
Note: To view PDF files in the Project Client, you must have Adobe Reader installed. 
Importing a Single-Item PDF File 
You can import PDF files to display in your collections as single items, whether they contain 
one or more pages. In this example we will import a multiple-page PDF file.  
Step 1: Confirm that Adobe Reader is installed 
Because we want to be able to view the PDF in the Project Client, we first confirm that Adobe 
Reader is installed on the Project Client computer. (To download and install the latest version 
of Adobe Reader, see http://get.adobe.com/reader/.)  
Step 2: Confirm source file type and security settings 
Confirm that the file name for the item you want to add has the extension .pdf. In this 
example, the source document is named Census92.pdf. (If the file extension is .doc or another 
format, you will need to first convert to PDF by using software such as Adobe Acrobat®.) 
Next confirm that the PDF file is not password-protected, encrypted or locked. (If it is 
encrypted or locked, a thumbnail may not be generated and text is not extracted in 
CONTENTdm.) One way to test for security settings is to try opening the document on your 
computer using Adobe Reader. You may see a message similar to the following. 
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 7 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Figure 4: Adobe Reader security warning 
If you need to modify the security settings, you may need permission to change the settings 
from the document owner, and then use Adobe Acrobat to edit and save the PDF file. 
Step 3: Confirm collection settings 
Because we have decided to add this multiple-page PDF file as a single-item, we confirm with 
the CONTENTdm administrator that the collection has PDF conversion disabled for multiple-
page PDF files in CONTENTdm Administration. (This setting is displayed in CONTENTdm 
Administration under the Collections tab on the Collection Configuration page.)    
Note: See also the following Confirm Project Setting step because some settings can be set 
locally in the Project Client to override the server settings. 
Figure 5: PDF conversion setting disabled for the collection in CONTENTdm Administration 
We want the first 128,000 characters extracted for full text search, so we also need to confirm 
that one metadata field has been set to the type Full Text Search. 
For this example, we have set the Description field for the collection to the data type Full Text 
Search in CONTENTdm Administration. 
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 8 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Figure 6: Metadata Fields page in CONTENTdm Administration 
Step 4: Confirm project settings 
Although we confirmed settings on the CONTENTdm Server, settings can be set for the project 
in the Project Client. These settings can override the server settings. 
1. Access the Project Settings Manager, and click the Processing tab. The
Processing Settings page displays.
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 9 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Figure 7: Processing Settings 
2. Confirm that PDF File Conversion is set to Do not convert multiple-page PDF
files to compound objects.
3. Check the PDF Print Quality setting.
This setting enables you to specify the quality of the optional print versions (PDF) of
the compound object. The quality is determined by this setting in relation to the
quality of the original source material. Select a higher-quality setting for items
where the PDF quality is important to your end users, or select lower-quality settings
to improve processing and rendering times of the user experience. (For more
information, see Processing.)
Figure 8: PDF file conversion settings 
4. Click OK to save any changes.
Using PDF Files in CONTENTdm 
January 6, 2016  
Page 10 of 23 
© 2016 OCLC 
Adobe, Adobe PDF Library, and the Adobe logo are trademarks of Adobe Systems Incorporated 
Step 5: Add the PDF file to your project 
The general steps for adding a single-item PDF file are the same as adding other individual 
1. Navigate to the Home tab or Project tab.
2. On the left task pane under Common Tasks, click Add Item. The Add Item wizard
Figure 9: Adding an item 
3. Specify or browse to the file you want to add.
Tip: If you want to add more than one item, press Ctrl and click on the individual 
files to add. 
4. Select whether to create a display image.
5. Click Add. A progress screen displays as the item is processed. When complete, a
summary screen displays the summary and any errors or warnings.
6. Click Close. The item is displayed in the project spreadsheet.
Note: The original file remains in its current location. A copy is added to the project 
Documents you may be interested
Documents you may be interested