how to display pdf file in c# windows application : Copy text from pdf with formatting software SDK cloud windows wpf web page class Express%20XML%20Job%20Ticket%20Manual1-part374

11
User Guide
Table 105 – PDF Pre-Flight Attributes.......................................................................128
Table 106 – PDF Split Attributes..............................................................................129
Table 107 – PDF Version Downgrade Attributes.........................................................130
Table 108 – Security Attributes...............................................................................131
Table 109 – Signature Attributes.............................................................................132
Table 110 – Signature Appearance Attributes............................................................133
Table 111 – Signature Certificate Attributes..............................................................133
Table 112 – Signature Data Attributes.....................................................................134
Table 113 – Signature Properties Attributes..............................................................134
Table 114 – Signature Properties Safe Attributes.......................................................135
Table 115 – Signature Fields Attributes....................................................................135
Table 116 – Signature Field Attributes.....................................................................135
Table 117 – XMP Meta Data Attributes.....................................................................136
Table 118 – RTF Settings.......................................................................................138
Table 119 – Text Conversion Attributes....................................................................139
Table 120 – Character Encoding Values....................................................................140
Table 121 – Text Settings Attributes........................................................................143
Table 122 – Text Split Attributes.............................................................................144
Table 123 – TOC Attributes....................................................................................145
Table 124 – TOC Items Attributes............................................................................147
Table 125 – TOC Item Destination Attributes............................................................147
Table 126 – TOC Level Attributes............................................................................148
Table 127 – TOC Style Attributes.............................................................................148
Table 128 – Transformations Attributes....................................................................150
Table 129 – Page Content Scaling Attributes.............................................................151
Table 130 – Page Scaling Attributes.........................................................................152
Table 131 – Watermarks Attributes.........................................................................153
Table 132 – Watermark Attributes...........................................................................153
Table 133 – XPS MSExcel Attributes........................................................................158
Table 134 – XPS MSPowerPoint Attributes................................................................158
Table 135 – XPS MSWord Attributes........................................................................158
Table 136 – XML Conversion Attributes....................................................................160
Table 137 – Job Ticket Templates Attributes.............................................................161
Table 138 – Job Ticket Template Attributes...............................................................161
Table 139 – User Defined Variables Attributes...........................................................162
Copy text from pdf with formatting - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
copy text from pdf to word; copy highlighted text from pdf
Copy text from pdf with formatting - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
extract text from pdf to excel; copy pdf text to word document
12
User Guide
Table 140 – User Defined Variable Attributes............................................................162
Table 141 – Character Entities................................................................................182
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
other C# .NET PDF to text conversion controls, RasterEdge C# PDF to text converter control toolkit can convert PDF document to text file with good formatting.
copy pdf text to word document; extract pdf text to excel
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
pages edit, C#.NET PDF pages extract, copy, paste, C# NET rotate PDF pages, C#.NET search text in PDF all Excel spreadsheet into high quality PDF without losing
copy paste text pdf file; copy text from pdf without formatting
13
User Guide
Introduction
The Adobe© Portable Document Format (PDF) file type is the de facto standard for 
document interchange.  PDF documents can be created from any electronic document as 
well as from scanned images from paper.  PDF files can be displayed and printed from most 
platforms and maintain document fidelity between platforms.  Many organizations use PDF
files for archiving and to enable collaboration and automate document workflows thought 
the document lifecycle.  This often requires augmenting the PDF with additional annotations 
such as Watermarks, Header/Footer information as well as the ability to merging multiple 
documents of different types into a single PDF document.  In addition, merged PDF files 
may require a full Table of Contents, with Hyperlinks, for each document as well as a full set 
of Bookmarks to provide effective navigation throughout the compound document.  Express
is a high performance application that automates the conversion of your business content to 
PDF, Plain (ASCII) Text and Image files. Express converts an extensive list of file types 
including standard business documents, images, graphics, web and legacy files to retain the 
look and feel of the original document for archiving, exchanging between other companies, 
printing or viewing. Express XML Job Tickets are designed to provide complete control of the 
PDF conversion process using Express.  Automated document processing is easily 
implemented using XML Job Tickets.
The information contained within this document requires an understanding of both the 
Express product as well as some basic knowledge of XML.
C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
file. Besides, the converted HTML webpage will have original formatting and interrelation of text and graphical elements of the PDF.
copy text pdf; copy and paste text from pdf to excel
VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
application. In addition, texts, pictures and font formatting of source PDF file are accurately retained in converted Word document file.
copy text from pdf to word with formatting; extract text from pdf java
14
User Guide
XML Job Ticket Overview
An XML Job Ticket is an electronic file that contains all the information for the production of 
a document processing job.  A document processing job involves one or more documents 
that need to be rendered, annotated and distributed.  The XML Job Ticket contains the set of 
specific document processing options, expressed in XML, used by Express to process the 
job.  The XML Job Ticket file is a plain (ASCII) text file with an .XML extension.  Express 
does support the use of Unicode XML Job Tickets. The XML Job Ticket is validated by the 
ExpressDocument Type Definition (DTD) provided with Express. Please visit the World Wide 
Web Consortium (W3C) web site at www.w3c.org/XML
for additional information on XML 
and DTD.  
XML Job Tickets support all of the features provided by theExpress user interface listed 
below.
Header and Footer
Watermark
PDF Overlay
PDF Bookmarks
Envision OCR
PDF Splitting/Stitching
PDF Font Embedding, Optimization
PDF Information Extraction
Transformations, PDF Page and Content Scaling
PDF Settings and Print Settings
PDF Document Open Options
CAD, HTML, Text Page Setup
Logging
Bookmark Creation
Table of Contents Report
Scripts
Document Validation
Security
Compressor
In addition to the above features, XML Job Tickets extend the functionality of the Express
User Interface to include the following advanced features:
File Merging
Custom Bookmarks
Custom Hyperlinks
Custom Table of Contents
Index
Digital Signatures
PDF Attachments
PDF Document Information (METADATA)
PDF Form Fields
Multiple Destinations for the Created documents
o
Email Addresses
o
Printers
o
Folders
o
Web, HTTP, FTP Folders
C# Create PDF from Word Library to convert docx, doc to PDF in C#.
A convenient C#.NET control able to turn all Word text and image content into high quality PDF without losing formatting. Convert
erase text from pdf file; copying text from pdf to excel
C# Create PDF from PowerPoint Library to convert pptx, ppt to PDF
Excellent .NET control for turning all PowerPoint presentation into high quality PDF without losing formatting in C#.NET Class. Convert
erase text from pdf; copy pdf text to word
15
User Guide
Express DTD
XML Job Tickets are created with a reference to a DTD.  The purpose of a DTD is to define 
the legal building blocks of an XML document. It defines the document structure with a list 
of legal elements.  The DTD defines the default settings which are applied to all documents 
converted via XML Job Tickets(Please see AppendixD–CustomizingtheExpressDTD
for more info).  XML Job Ticket files do not use any of the Express settings defined in the 
User Interface because the Express Document Type Definition (AdlibExpress.dtd) referenced 
in the XML Job Ticket file defines the default settings used when they are not defined in the 
XML Job Ticket.  The AdlibExpress.dtd file resides in the DTD folder of the Express 
installation folder (e.g. C:\Adlib Express\DTD).  
The Express DTD is used to validate the XML Job Ticketwith the use of an XML parser.  If 
you try to open an XML document, the XML Parser might generate an error. By accessing 
the parseError object, the exact error code, the error text, and even the line that caused the 
error can be retrieved.  The XML Job Ticket is valid if it complies with the constraints 
expressed in the DTD.  Express validates the XML Job Ticket prior to processing it.  The DTD 
is also used to place default settings for that current job; each DTD file can have a different 
configuration.  Users can validate the XML Job Ticket structure by opening it with IE 5.0 or 
greater.
DTDBackwards Compatibility
Any version of Express can use a DTD that is older than the DTD found within that version 
as long as the corresponding XML Job Ticket validates against that DTD. However, a newer 
DTD placed on a system with an older version of Express may cause compatibility problems.  
An older job ticket may also not validate with a new DTD.
DTD Installation
Upon installation of Express, the Adlib Express DTD is installed in the DTD folder found in 
the Express installation directory.  Any existing DTDs located in the installation directory will 
be backed up.  A backup folder will be created at this location and the existing DTDs will be 
placed there.  When Express is first run, a DTD folder will be created within the “C:\Adlib 
Express\” directory, and the new DTD will be copied to this location.  If a DTD is currently 
found within this directory, no action will be taken.  Also, if the DTD folder is deleted after 
Express has been executed for the first time, it will not be created a second time.
Some other useful information about XML files:
XML Job Tickets enhance the PDF bookmarking functionality by providing the ability to 
define the type of bookmark (Internal, File, Web, Email and Null) and its destination (Path, 
Page Number, Page Number with X, Y coordinates).  
In order to turn off font embedding, Multilanguage must also be turned off as well.  If 
Multilanguage is not turned off, it will override the user’s font embedding setting to Enabled.  
The difference between content bookmarks and document bookmarks is that document 
bookmarks will only create a bookmark consisting of the file name(s) of the file(s) being 
converted.  
C# Create PDF from Excel Library to convert xlsx, xls to PDF in C#
Turn all Excel spreadsheet into high quality PDF without losing formatting. Evaluation library and components for PDF creation from Excel in C#.NET framework.
delete text from pdf acrobat; extract highlighted text from pdf
VB.NET Create PDF from PowerPoint Library to convert pptx, ppt to
Remove Image from PDF Page. Image: Copy, Paste, Cut PDF, VB.NET convert PDF to text, VB.NET all PowerPoint presentation into high quality PDF without losing
acrobat remove text from pdf; get text from pdf c#
16
User Guide
All elements included within the XML Job Ticket will inherit default values not overridden by 
the user from the DTD. Not every element has to be included in order for the XML Job Ticket 
to validate. Simply choosing what is required will suffice. Most defaults have their ENABLED 
values equal to “Yes” which would cause that element to be applied to the conversion.
Folder paths are absolute, variables and line feeds can be used, e.g.
"
&amp;[Path]\&[File]<CR>&amp;[PageID]
". 
Additional information about Job Tickets, along withsample files and sample XML Job 
Tickets, can be requested by sending an email to info@adlibsoftware.com
.
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
Image to PDF. Image: Remove Image from PDF Page. Image: Copy, Paste, Cut Export all Word text and image content into high quality PDF without losing
extract text from pdf acrobat; c# get text from pdf
VB.NET Word: Extract Text from Microsoft Word Document in VB.NET
time and effort compared with traditional copy and paste VB.NET. Apart from extracting text from Word powerful & profession imaging controls, PDF document, tiff
copy text from encrypted pdf; delete text from pdf online
17
User Guide
XML Job Ticket Structure
XML files always contain a header and one root element.  The root element can contain any 
number of child elements.  Elements can contain zero or more attribute-valuepair.  An 
attribute-valuepair (e.g. ENABLED = “Yes”) contains the attribute name (e.g. ENABLED) 
and the value (e.g. “Yes”).  The complete XML Job Ticket must be structured as defined by 
the Adlib Express DTD and will not process successfully if it is not validated according to the 
DTD. 
The Express XML Job Ticket structure uses the JOBS element as the root.  The JOBS 
element contains a child element called JOB.  The JOB element is used to define all settings 
for a single rendering request.  The following briefly describe the child elements for JOB 
element. 
DOCINPUTS - Specifies the documents (Filename, Location,...) to process.  
DOCOUTPUTS - Specifies the document types (Filename, Location and Document Type 
(PDF, TXT, ...) to create from the documents specified in the DOCINPUTS element. 
LOGSETTINGS – Specifies the log files to be created upon processing.
SCRIPTS – Specifies any scripts that are to be run before and/or after processing.
SETTINGS- Specifies all of the document processing settings (Watermark, Header, Footer, 
Overlay, PDF Settings, Text Settings, …).
18
User Guide
Figure 1–Sample XML Job Ticket File with all elements
<?xml version="1.0" encoding="ISO-8859-1" ?>
<?AdlibExpress applanguage="USA" appversion="3.0.0" dtdversion="2.0.0" ?>
<!DOCTYPE JOBS SYSTEM "C:\Adlib Express\DTD\AdlibExpress.dtd">
<JOBS xmlns:JOBS="http://www.adlibsoftware.com" xmlns:JOB="http://www.adlibsoftware.com"><JOB>
<JOB:DOCINPUTS>
<JOB:DOCINPUT FILENAME="Water on the Space Station.doc" FOLDER="C:\Adlib Express Job Tickets\Docs\" />
</JOB:DOCINPUTS>
<JOB:DOCOUTPUTS>
<JOB:DOCOUTPUT FILENAME="Defaults.pdf" FOLDER="C:\Adlib Express Job Tickets\XML Job Tickets Output\">
<JOB:DESTINATION>
<JOB:DESTFOLDERS>
<JOB:DESTFOLDER />
</JOB:DESTFOLDERS>
<JOB:DESTPRINTERS>
<JOB:DESTPRINTER />
</JOB:DESTPRINTERS>
<JOB:DESTEMAILS />
<JOB:DESTURIS>
<JOB:DESTURI />
</JOB:DESTURIS>
</JOB:DESTINATION>
</JOB:DOCOUTPUT>
</JOB:DOCOUTPUTS>
<JOB:DOCREFERENCES>
<JOB:DOCREFERENCE />
</JOB:DOCREFERENCES>
<JOB:INSERTS>
<JOB:INSERT>
<JOB:INSERTFORMFIELDS>
<JOB:INSERTFORMFIELD />
</JOB:INSERTFORMFIELDS>
</JOB:INSERT>
<JOB:INSERTSTYLES>
<JOB:INSERTSTYLE />
</JOB:INSERTSTYLES>
</JOB:INSERTS>
<JOB:LOGSETTINGS>
<JOB:EMAILNOTIFICATION>
<JOB:LOGOUTBOXSETTINGS />
<JOB:LOGSMTPSETTINGS />
</JOB:EMAILNOTIFICATION>
<JOB:URINOTIFICATION />
</JOB:LOGSETTINGS>
<JOB:PRINTERS>
<JOB:PRINTER>
<JOB:PRINTERCOMMANDS>
<JOB:PRINTERCOMMAND />
</JOB:PRINTERCOMMANDS>
</JOB:PRINTER>
</JOB:PRINTERS>
<JOB:SCRIPTS />
<JOB:SETTINGS>
<JOB:ARCHIVESETTINGS />
<JOB:BOOKMARKS>
<JOB:BOOKMARK>
<JOB:BOOKMARKDESTINATION />
</JOB:BOOKMARK>
<JOB:CONTENTBOOKMARKS>
<JOB:MSEXCELBOOKMARKS />
<JOB:MSWORDBOOKMARKS>
<JOB:MSWORDBOOKMARKGROUPS>
<JOB:MSWORDBOOKMARKGROUP />
</JOB:MSWORDBOOKMARKGROUPS>
<JOB:MSWORDSEQFIELDS>
<JOB:MSWORDSEQFIELD />
</JOB:MSWORDSEQFIELDS>
<JOB:MSWORDSTYLES>
<JOB:MSWORDSTYLE />
</JOB:MSWORDSTYLES>
</JOB:MSWORDBOOKMARKS>
<JOB:PDFBOOKMARKS />
</JOB:CONTENTBOOKMARKS>
</JOB:BOOKMARKS>    
19
User Guide
<JOB:CADCONVERSION />
<JOB:DOCUMENTVALIDATION />
<JOB:EFTSSETTINGS />
<JOB:ERRORSETTINGS />
<JOB:FOOTERS>
<JOB:FOOTER />
</JOB:FOOTERS>
<JOB:HEADERS>
<JOB:HEADER />
</JOB:HEADERS>
<JOB:HTMLCONVERSION />
<JOB:HTMLSETTINGS>
<JOB:HTMLSPLIT />
<JOB:HTMLMSWORD />
<JOB:HTMLMSEXCEL />
<JOB:HTMLMSPOWERPOINT />
</JOB:HTMLSETTINGS>
<JOB:HYPERLINKS>
<JOB:HYPERLINK>
<JOB:HYPERLINKAPPEARANCE />
<JOB:HYPERLINKDESTINATION />
</JOB:HYPERLINK>
<JOB:HYPERLINKSAPPEARANCE />
<JOB:MSWORDHYPERLINKS />
</JOB:HYPERLINKS>
<JOB:IFTSSETTINGS />
<JOB:IMAGESETTINGS>
<JOB:IMAGESPLIT />
</JOB:IMAGESETTINGS>
<JOB:INDEX>
<JOB:INDEXWORDSTYLE />
<JOB:INDEXREFERENCESTYLE />
</JOB:INDEX>
<JOB:METADATAELEMENTS>
<JOB:METADATAELEMENT />
</JOB:METADATAELEMENTS>
<JOB:MSWORDSETTINGS />
<JOB:NATIVEAPPSETTINGS>
<JOB:GHOSTSCRIPT />
<JOB:LOTUSNOTES />
<JOB:MSEXCEL />
<JOB:MSOUTLOOK />
<JOB:MSPOWERPOINT />
<JOB:MSVISIO />
<JOB:MSWORD>
<JOB:MSWORDMARKUPOPTIONS />
</JOB:MSWORD>
<JOB:SYMWINFAX />
</JOB:NATIVEAPPSETTINGS>
<JOB:OCRSETTINGS>
<JOB:IMAGEPROCESSING />
<JOB:PDFPROCESSING />
<JOB:DOCUMENTPROCESSING />
<JOB:OCRLANGUAGES>
<JOB:OCRLANGUAGE />
</JOB:OCRLANGUAGES>
<JOB:OCRLOGSETTINGS />
</JOB:OCRSETTINGS>
<JOB:OVERLAYS>
<JOB:OVERLAY />
<JOB:OVERLAYCROP />
</JOB:OVERLAYS>
<JOB:PAGEIDENTIFICATION />
<JOB:PAGESTITCHING />
<JOB:PDFFORMFIELDS>
<JOB:PDFFORMFIELD />
</JOB:PDFFORMFIELDS>
<JOB:PDFINFOSETTINGS>
<JOB:PDFINFOFILES>
<JOB:PDFINFOFILE />
</JOB:PDFINFOFILES>
</JOB:PDFINFOSETTINGS>
20
User Guide
<JOB:PDFSETTINGS>
<JOB:ASSOCIATEDINDEX />
<JOB:FONTEMBEDDING />
<JOB:OPENSETTINGS />
<JOB:OPTIMIZE />
<JOB:PDFATTACHMENTS>
<JOB:PDFATTACHMENT />
</JOB:PDFATTACHMENTS>
<JOB:PDFPOPUPNOTES />
<JOB:PDFPREFLIGHT />
<JOB:PDFSPLIT />
<JOB:PDFVERSIONDOWNGRADE />
<JOB:SECURITY />
<JOB:SIGNATURE>
<JOB:SIGNATUREAPPEARANCE />
<JOB:SIGNATURECERTIFICATE />
<JOB:SIGNATUREDATA />
<JOB:SIGNATUREPROPERTIES />
<JOB:SIGNATUREPROPERTIESSAFE />
</JOB:SIGNATURE>
<JOB:SIGNATUREFIELDS>
<JOB:SIGNATUREFIELD />
</JOB:SIGNATUREFIELDS>
<JOB:XMPMETADATA />
</JOB:PDFSETTINGS>
<JOB:TEXTCONVERSION />
<JOB:TEXTSETTINGS>
<JOB:TEXTSPLIT />
</JOB:TEXTSETTINGS>
<JOB:TOC>
<JOB:TOCITEMS>
<JOB:TOCITEM>
<JOB:TOCITEMDESTINATION />
</JOB:TOCITEM>
</JOB:TOCITEMS>
<JOB:TOCLEVELS>
<JOB:TOCLEVEL />
</JOB:TOCLEVELS>
<JOB:TOCSTYLES />
</JOB:TOC>
<JOB:TRANSFORMATION>
<JOB:PAGECONTENTSCALING />
<JOB:PAGESCALING />
</JOB:TRANSFORMATION>
<JOB:WATERMARKS>
<JOB:WATERMARK />
</JOB:WATERMARKS>
<JOB:XPSSETTINGS>
<JOB:XPSMSEXCEL />
<JOB:XPSMSPOWERPOINT />
<JOB:XPSMSWORD />
</JOB:XPSSETTINGS>
</JOB:SETTINGS>
</JOB>
<JOBTICKETTEMPLATES>
<JOBTICKETTEMPLATE />
</JOBTICKETTEMPLATES>
<USERDEFINEDVARIABLES>
<USERDEFINEDVARIABLE />
</USERDEFINEDVARIABLES>
</JOBS>
Documents you may be interested
Documents you may be interested