how to display pdf file in c# windows application : Copy text from pdf reader control Library platform web page asp.net .net web browser Express%20XML%20Job%20Ticket%20Manual11-part376

111
User Guide
Overlay Crop (OVERLAYCROP)
This element allows the user to “crop” the overlay prior to positioning / applying it to the 
output document.  The rendering of HTML, MHT, Image and CAD files to PDF results in a 
full-page document with an opaque background.  This feature allows this particular file type 
to be used as a foreground overlay without completely obscuring the underlying content in 
the resulting document.
Table 90– OverlayCrop Attributes
Name
Values
Description
MODE
None (Default)
CropToContentEdge
When this attribute is set to “CropToContentEdge”, the 
overlay will be cropped to the smallest area that contains 
actual page content.  When this attribute is set to “None”, 
the overlay will not be cropped and all other defined 
attributes within the JOB:OVERLAYCROP element will 
be ignored.
PADDINGLEFT
Numeric 
(Default = 
0)
Used to set the distance between the left-most content 
edge and the left-most page edge of the overlay 
document.  The PADDINGLEFT value cannot exceed 
the distance between the left-most content edge and the 
left-most page edge of the overlay document.
PADDINGRIGHT
Numeric 
(Default = 
0)
Used to set the distance between the right-most content 
edge and the right-most page edge of the overlay 
document.  The PADDINGRIGHT value cannot exceed 
the distance between the right-most content edge and 
the right-most page edge of the overlay document.
PADDINGTOP
Numeric 
(Default = 
0)
Used to set the distance between the top-most content 
edge and the top-most page edge of the overlay 
document.  The PADDINGTOP value cannot exceed the 
distance between the top-most content edge and the 
top-most page edge of the overlay document.
PADDINGBOTTOM
Numeric 
(Default = 
0)
Used to set the distance between the bottom-most 
content edge and the bottom-most page edge of the 
overlay document.  The PADDINGBOTTOM value 
cannot exceed the distance between the bottom-most 
content edge and the bottom-most page edge of the 
overlay.
1- The units are inches for the Imperial measurement system and centimeters for the Metric 
measurement system set in the Regional Settings of the computer where Express is installed.
2- Regarding the “MODE” attribute, whitespace is considered to be actual page content.  Please be 
wary of the use of “ ” in your HTML documents.
Copy text from pdf reader - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
copy and paste pdf text; copy text from scanned pdf to word
Copy text from pdf reader - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
extract text from pdf with formatting; copy text from pdf in preview
112
User Guide
Figure 18–OverlayElement
<JOB:OVERLAYS ENABLED="Yes">
<JOB:OVERLAY ENABLED="Yes" PATH="C:\Adlib Express\Overlays\Overlay.pdf" 
LAYER="Foreground" PAGES="First, Even, Last, 3, 9, 15-22" ALIGNMENT="Top-
Right" HORIZONTAL="0" VERTICAL="0" />
</JOB:OVERLAYS>
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
C#.NET PDF Library - Copy and Paste PDF Pages in C#.NET. Easy Ability to copy selected PDF pages and paste into another PDF file. The
copy text from pdf online; copy pdf text with formatting
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
Extract, Copy, Paste PDF Pages. |. Home ›› XDoc.PDF ›› VB.NET PDF: Copy and Paste PDF Page. Ability to copy PDF pages and paste into another PDF file.
extract text from pdf online; .net extract text from pdf
113
User Guide
Page Identification (PAGEIDENTIFICATION)
Page Identification adds a unique identifier to each page of a document by incrementing it 
by the value specified by the PAGEIDNEXT attribute for each page in the document.  The 
Page Identification allows you to define up to three items (PageIDA, PageIDB and PageIDC) 
for the Page Identifier.  It is inserted as part of the Header/Footer. (See Figure10–
FootersandHeaders)  It can be set in XML Job Tickets in order to control the Page 
Identifier for each Job Ticket.  It allows the definition of the Page Identifier structure,that is 
to include a prefix (e.g. ABC-) and/or Suffix (e.g. -DEF) to the incrementing value.  In 
addition, it allows the setting of the incrementing value. 
Table 91– Page Identification Attributes
Name
Values
Description
PAGEIDA
Text
Defines the structure for the first section of a Page 
Identifier.
PAGEIDB
Text
Defines the structure for the second section of a 
Page Identifier.
PAGEIDC
Text
Defines the structure for the third section of a 
Page Identifier.
PAGEIDNEXT
Integer
Defines the Page Identifier start number for the 
document.  This number can be padded with 
zeros in order to set the number of digits. 
PAGEIDLOGFOLDER
Text Path (Default = 
C:\Adlib Express\Error)
Contains the path to which the page identifier log 
will be created/appended.
PAGEIDLOGFILENAME
Text File Name (Default = 
Adlib Express Page ID 
Log.txt)
Specifies the name of the page identifier log.
USEGLOBALPAGEID
Yes (Default)
No
Enable/Disable global page identification.
Figure 19– Page Identification Element
<JOB:PAGEIDENTIFICATION PAGEIDA="ABC-" PAGEIDB="&amp;[PageIDIncrement]" 
PAGEIDC="-DEF" PAGEIDNEXT="00004321" PAGEIDLOGFOLDER="C:\Adlib Express\Error" 
PAGEIDLOGFILENAME="Adlib Express Bates Numbering Document Log.txt"
USEGLOBALPAGEID="Yes"/>
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
PDF ›› C# PDF: Extract PDF Image. How to C#: Extract Image from PDF Document. Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document.
cut text pdf; copy text from pdf with formatting
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
VB.NET PDF - Extract Image from PDF Document in VB.NET. Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document in VB.NET Project.
export text from pdf; extract text from pdf image
114
User Guide
Page Stitching (PAGESTITCHING)
The PAGESTITCHINGelement allows users to stitch pages in a PDF file together. The pages 
are joined two at a time. The right edge of the first page isbound with the left edge of the 
next page.
Table 92–PDF Page StitchingAttributes
Name
Values
Description
ENABLED
Yes
No(Default)
Enables/Disables the joining of two pages of a 
document. 
Sets the PDF pages to be joined two at a time.  The 
right edge of the first page is bound with the left edge of 
the next page. 
BLANKPAGE
Yes
No (Default)
Add a blank page to the left of the first page.  
Figure 20–PDF Page Stitching
Figure 21– PDF Page Stitching
<JOB:PAGESTITCHING ENABLED="Yes" BLANKPAGE="Yes"/>
VB.NET PDF copy, paste image library: copy, paste, cut PDF images
Copy, paste and cut PDF image while preview without adobe reader component installed. Image resize function allows VB.NET users to zoom and crop image.
copy formatted text from pdf; export highlighted text from pdf
C# PDF insert text Library: insert text into PDF content in C#.net
Supports adding text to PDF in preview without adobe reader installed in ASP.NET. Powerful .NET PDF edit control allows modify existing scanned PDF text.
cut and paste text from pdf document; how to copy and paste pdf text
115
User Guide
PDF Form (PDFFORMFIELDS)
The PDFFORMFIELDS element contains one PDFFORMFIELD element for every form to be 
added to the PDF (SeeFigure22–PDFFormField).  It is used to add text information 
that can be entered by the user to PDF Forms. Multiple fields can be filled by adding a new 
PDFFORMFIELDelement to the collection for each field. Each PDFFORMFIELD element
defines the name of the field and the value to be assigned to that field.  The FLATTEN 
attribute permanently presses the fields and values into the page contents. This disables all 
of the form interactivity.
You must assign a name to the PDF form in the XML.  The example in Figure22–PDF
FormFielduses BusinessCard as the form name for the MyBusinessCardForm.pdf form 
(e.g. <\PDFForm:BusinessCard>).  This name must be used for each field the form contains 
(e.g.  <\PDFForm:BusinessCard>FaxNumber = (123)456-8901). 
Table 93–PDF Form Fields Attributes
Name
Values
Description
ENABLED
Yes (Default)
No
Enables the form filling option.
FLATTEN
Yes
No (Default)
Enables/Disables the flattening of the form after it has been 
filled. The flattening process permanently presses the fields 
and values into the page contents.  This disables all of the 
form interactivity.
Table 94–PDF Form Field Attributes
Name
Values
Description
FIELD
Text
Assigns a text string to one field for a form.  Multiple fields can 
be filled by defining each one individually.  
VALUE
Text
Assigns a text string to one field for a form.  Multiple fields can 
be filled by defining each one individually.  A text string can be 
inserted as multiple lines by adding the <CR> string between 
each line. 
(e.g. < JOB:PDFFORMFIELD FIELD="Name" VALUE="John 
&lt;CR&gt; Smith" />)
Figure 22–PDF Form Field
<JOB:PDFFORMFIELDS ENABLED="Yes" FLATTEN="No">
<JOB:PDFFORMFIELD FIELD="Name" VALUE="John &lt;CR&gt; Smith" />
<JOB:PDFFORMFIELD FIELD="eMailAddress" VALUE="john.smith@acme.com" />
<JOB:PDFFORMFIELD FIELD="PhoneNumber" VALUE="(123)456-7890" />
<JOB:PDFFORMFIELD FIELD="FaxNumber" VALUE="(123)456-8901" />
</JOB:PDFFORMFIELDS>
C# PDF copy, paste image Library: copy, paste, cut PDF images in
|. Home ›› XDoc.PDF ›› C# PDF: Copy, Paste, Cut Image in Page. C#.NET PDF SDK - Copy, Paste, Cut PDF Image in C#.NET. C# Guide
pdf text replace tool; copy text from scanned pdf
C# PDF Text Search Library: search text inside PDF file in C#.net
Text: Search Text in PDF. C# Guide about How to Search Text in PDF Document and Obtain Text Content and Location Information with .NET PDF Control.
copying text from pdf into word; extracting text from pdf
116
User Guide
PDF Information (PDFINFOSETTINGS)
The PDFINFOSETTINGS element is used to define parameters associated with PDF Info 
extracted from PDF Files. Users may specify the output style of the PDF Text Tokens which 
are extracted from the PDF (See Figure23–ExtractPDFInformationfor extraction 
options).  The resulting text file contains all of the text extracted from the PDF (see
Figure24–ExtractedTextInformation(TokenFile)). In addition, it contains all 
metadata for each text token (See Table96–ExtractedTextInformation(TokenFile)
FileStructure). 
Tip:
If these tokens are of a different font or font style, they will not be merged.
Table 95–Extract PDF Information Attributes
Name
Values
Description
TYPE
Bookmarks
Text
File
FormFields
Hyperlinks
Metadata
OCRZoneData
Pages
DigitalSignatureFields
All values can be used simultaneously separated by a pipe 
( |) delimiter.
The following valuesoffer the following information on 
extraction: 
Level, Text, Destination Type, Destination, Destination 
Page, DestinationX, DestinationY
Page, X, Y, Height, Width, Orientation, Font Name, Text 
(PDF Token Text)
File size (in KB), Date Created, Date Modified, Page Count, 
PDF Version 
Name, Instance, Page, X, Y, Width, Height, Font Name, 
Font Size, Alignment, Description, Form Field Value
Destination Page, Destination X, Destination Y, Width, 
Height, Address Type, Address
(Note: Value extracted are dependant on the Address 
Type)
Key (e.g. Title, Producer, Version, etc…), Value
Name, Page, Left, Top, Width, Height, Type followed by the 
extracted OCR text.
(Note: OCR must be enabled with an OPI file defined.)
Page Number, Width, Height, Text Margin Left, Text Margin 
Right, Text Margin Top, Text Margin Bottom
Name, Instance, Page, X, Y, Width, Height, Signed Value
FORMAT
CSV (Default)
XML
Comma Separated Values
eXtensible Markup Language
ENCODING
ISO88591 (Default)
Industry-standard code set for 7-bit ASCII characters.
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
C#.NET PDF SDK - Convert PDF to Text in C#.NET. Integrate following RasterEdge C#.NET text to PDF converter SDK dlls into your C#.NET project assemblies;
a pdf text extractor; extract text from pdf using c#
117
User Guide
Name
Values
Description
UTF8
UTF16
8-bit Unicode Transformation Format is a lossless, variable-
length character encoding for Unicode.
16-bit Unicode Transformation Format is a lossless, 
variable-length character encoding for Unicode.
STYLE
Default (Default)
Adjacent
SingleSpace
Line
Word
Uses a default setting to extract the text
Merges Text tokens that are adjacent into a single token  
Merges Text tokens that are separated by one space or 
less into a single token
Merges Text tokens that are on the same line using the 
token Y coordinate
Splitting of Text tokens into separate words
CSVDELIMITER
Text
Specifies the delimiter when using CSV format
CSVHEADINGS
Yes
No (Default)
Specifies if the headings are placed in the text
Figure 23–Extract PDF Information
<JOB:PDFINFOSETTINGS TYPE="Text|Metadata" FORMAT="CSV" ENCODING="ISO88591"
STYLE="Default" CSVDELIMITER="/" CSVHEADINGS="Yes" />
118
User Guide
Figure 24–Extracted Text Information (Token File)
Table 96–ExtractedText Information (Token File) File Structure
Item Number
Item Description
1
Page Number
2
X Coordinate on Page in Points 
3
Y Coordinate on Page in Points
4
Height 
5
Width
6
Orientation
7
Font Name
8
Text
119
User Guide
Figure 25– Sample PDF Information file
<?xml version="1.0" encoding="ISO-8859-1"?>
<PDFINFO>
<BOOKMARKS>
<BOOKMARK LEVEL="1">
<BOOKMARKDESTINATION ADDRESSTYPE="Internal" ADDRESS="" PAGE="1" X="1" 
Y="13824"/>Adlib Express Userguide.pdf
</BOOKMARK>
<BOOKMARK LEVEL="2">
<BOOKMARKDESTINATION ADDRESSTYPE="Internal" ADDRESS="" PAGE="11" X="1" 
Y="698"/>Introduction
</BOOKMARK>
</BOOKMARKS>
<FILE SIZE="1700.4951171875" DATECREATED="6/7/2005 2:45:00 PM" DATEMODIFIED="6/7/2005 
2:45:02 PM" PAGECOUNT="174" PDFVERSION="1.3"/>
<FORMFIELDS>
<FORMFIELD NAME="FaxNumber1" INSTANCE="1" PAGE="1" X="72.71194" Y="26.80106" 
WIDTH="120.9374" HEIGHT="11.02829" FONTNAME="Helvetica" FONTSIZE="0" ALIGNMENT="Left" 
DESCRIPTION="">(905) 858-4558 test1</FORMFIELD>
<FORMFIELD NAME="PhoneNumber1" INSTANCE="1" PAGE="1" X="72.71194" Y="38.39011" 
WIDTH="120.5635" HEIGHT="11.02829" FONTNAME="Helvetica" FONTSIZE="0" ALIGNMENT="Left" 
DESCRIPTION="">(905) 858-4567 test1</FORMFIELD>
</FORMFIELDS>
<HYPERLINKS>
<HYPERLINK ADDRESSTYPE="Web" ADDRESS="http://www.lycos.com" PAGE="0" X="0" Y="0">
<HYPERLINKZONE PAGE ="1" X="84.25" Y="538.5" WIDTH="122.5" HEIGHT="14">
<HYPERLINKOBJECT TYPE="TEXT" X="84.25" Y="538.5" WIDTH="122.5" HEIGHT="10" 
FONTNAME="TimesNewRoman" ORIENTATION="0">TEXT</HYPERLINKOBJECT>
</HYPERLINKZONE>
</HYPERLINK>
</HYPERLINKS>
<METADATAELEMENTS>
<METADATAELEMENT FIELD="Title" VALUE="Adlib eXpress Server User Guide"/>
<METADATAELEMENT FIELD="Producer" VALUE="www.adlibsys.com:ADLIBPDF2026-W2KP"/>
<METADATAELEMENT FIELD="Creator" VALUE="Microsoft Word 2003"/>
<METADATAELEMENT FIELD="Author" VALUE="Adlib eDocument Solutions"/>
</METADATAELEMENTS>
<PAGES>
<PAGE NUMBER="1" WIDTH="8.5" HEIGHT="11" TEXTMARGINLEFT="0.2111111" TEXTMARGINRIGHT="-
1.715416" TEXTMARGINTOP="2.356667" TEXTMARGINBOTTOM="0.5533333"/>
<PAGE NUMBER="2" WIDTH="8.5" HEIGHT="11" TEXTMARGINLEFT="0.2111111" TEXTMARGINRIGHT="-
1.715416" TEXTMARGINTOP="0.5333337" TEXTMARGINBOTTOM="0.5533333"/>
</PAGES>
<TEXT>
<TEXTSTRING PAGE="1" X="169.68" Y="507.84" WIDTH="149.384" HEIGHT="48" ORIENTATION="0" 
FONTNAME="PHQGHU+ArialBlack">AdLib</TEXTSTRING>
<TEXTSTRING PAGE="2" X="136.679" Y="148.258" WIDTH="598.8309" HEIGHT="69.96507" 
ORIENTATION="52" FONTNAME="Helvetica">Express Evaluation</TEXTSTRING>
</TEXT>
<OCRZONES>
<OCRZONE NAME="Heading1" PAGE="10" LEFT="350" TOP="284" WIDTH="415" HEIGHT="85" 
TYPE="Text">Bug Collector Pro</OCRZONE>
<OCRZONE NAME="Heading2" PAGE="10" LEFT="350" TOP="1000" WIDTH="471" HEIGHT="85" 
TYPE="Text">Buggy</OCRZONE>
<OCRZONE NAME="Heading3" PAGE="10" LEFT="350" TOP="1500" WIDTH="415" HEIGHT="85" 
TYPE="Text">ItemAction</OCRZONE>
</OCRZONES>
</PDFINFO>
120
User Guide
PDF Information Files (PDFINFOFILES)
The PDFINFOFILES element is used for inserting PDF information (Bookmarks or Hyperlinks) 
into a PDF.  PDF Information files are created by setting the TYPE attribute of a DOCOUTPUT 
to PDFInfo and specifying PDFINFOSETTINGS. (See Table97–PDFInformationFiles
Attributes)
Table 97– PDF Information Files Attributes
Name
Values
Description
PATH
Text
Fully qualified path to PDF Info file.
TYPE
Bookmarks
Hyperlinks
All values can be used simultaneously separated by a pipe ( | ) 
delimiter.
The following values offer the following information on 
extraction: 
Level, Text, Destination Type, Destination, Destination Page, 
Destination X, Destination Y
Destination Page, Destination X, Destination Y, Width, Height, 
Address Type, Address
(Note: Value extracted are dependant on the Address Type)
Documents you may be interested
Documents you may be interested