how to display pdf file in c# windows application : Extract pdf text to word Library software component .net windows winforms mvc Express%20XML%20Job%20Ticket%20Manual2-part383

21
User Guide
XML Job Ticket Processing
The various methods of defining references in XML Job Tickets:
Table 1– XML Job Ticket Document Reference Methods
Tip:
XML Job Ticket files may be placed in the Express Input folder but the files 
referenced within the XML Job Ticket may be located anywhere on the network.  This 
allows files to be processed without having to physically move the files to the input 
folder.
The XML Job Ticket functionality is very flexible and can be used in many ways.  For 
example, it can be used to add a cover page to each PDF created.  
Tip:
Locate the cover page file outside of the Input folder and reference it using an 
Absolute path in the XML Job Ticket file.
A second example is to use XML Job Ticket files to assemble multiple documents into a 
single PDF file.  This file can then be emailed as a single attachment.  
A third example is to use XML Job Ticket files to merge structured data (e.g. data from a 
database) with other documents.
Tip:
Write a program or script to extract the structured data and create a file (e.g. HTML, 
RTF, TXT,…) which is then merged with the other documents.
When processing XML Job Ticket files, the Input File Handling selection only applies to the 
files in the Input folder and its subfolders.  All files located outside the Input Folder are 
processed and left in the same location. 
Tip:
The XML Job Ticket file should be created/copied after all files referenced within the 
XML Job Ticket file have been copied.  This eliminates the possibility of processing a 
referenced file that has not been copied which results in a File Not Found error.
Reference 
Method
Description
Examples
Absolute Path
The complete document path and filename is provided.   
C:\My Folder\My 
Doc.doc
UNC Path
The complete document path and filename is provided 
using Universal Naming Conventions (UNC).
\\My Server\My
Folder\My Doc.doc
Extract pdf text to word - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
extract text from pdf acrobat; extract text from pdf java open source
Extract pdf text to word - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
copy text from encrypted pdf; extract pdf text to excel
22
User Guide
Jobs (JOBS)
The JOBS element is the root element of the Job Ticket.  It contains Express settings that 
control how the Job is processed.
Table 2–Job Attributes
Name
Values
Description
JOBID
Text
The unique identifier for the XML Job Ticket.
MEASUREMENTSYSTEM
LocalMachine
Defined
Applies the current measurement setting of the 
computer. The Measurement Unit used in Express will 
be the following: Metric = cm, US = inches
Applies the measurement setting specified in 
MEASUREMENTUNIT.
MEASUREMENTUNIT
Points | pt
Micrometers
Millimeters | mm
Centimeters|cm
Inches|in
Specifies the measurement unit to be used in the Job 
Ticket.
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
PDF in C#, C# convert PDF to HTML, C# convert PDF to Word, C# extract text from PDF, C# convert PDF to Jpeg, C# compress PDF, C# print PDF, C# merge PDF files
c# read text from pdf; copy text from pdf with formatting
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Image: Extract Image from PDF. |. Home ›› XDoc.PDF ›› C# PDF: Extract PDF Image. How to C#: Extract Image from PDF Document.
copy text from pdf without formatting; extract text from pdf to excel
23
User Guide
Input Documents (DOCINPUTS)
The DOCINPUTS element contains one DOCINPUT element for every unique file or Universal 
Resource Identifier (URI) to process. The exact filename must be specified or the XML Job 
Ticket will error upon conversion.  The user can specify whether or not to download the URI 
locally.  A FILENAME and FOLDER are required attributes and at least one DOCINPUTis 
required. The URI string identifies resources in the web such as documents, images, 
downloadable files, services, electronic mailboxes, and other resources. These resources are 
available under a variety of naming schemes and access methods such as HTTP, FTP, and 
Internet mail (e.g. For example, http://www.adlibsoftware.com/testfile.doc).  Please refer to 
the table below for details.
Note: If TOC or Inserts is enabled then the XML Job Ticket can be created with no 
DocInputs.
Tip:
When using URI, you must set the FILENAME and FOLDER to “”.
Table 3– Document Input Attributes
Name
Values
Description
NAME
Text
The Alias name to be used when referring to a particular 
DocInput. (e.g. Page ranges, DocReferences)
FILENAME
Filename
The Filename specified is used.
FOLDER
Folder
The Folder property delivers the PDF to the specified 
folder.
OPENPASSWORD
Text
Password required to open secure documents (Only for 
Microsoft Word and Excel).
URI
Text
The text name destination of a URI.
URIDOWNLOAD
Yes (Default)
No
Determines whether to download the URI. For such files 
as ASP, XML, HTML, or other file formats that either 
stream, or require other files, it is recommended to set 
this value to No. For PDF files it is recommended that 
this value is set to yes.
URIPROXYSERVER
Text
Proxy Server required to access the URI.
URITIMEOUT
Numeric
(Default = 60)
Time interval before Express times out a URI attempted 
connection.
BOOKMARK
Text
The text of the Heading to be used as a bookmark.
BOOKMARKLEVEL
Numeric
The level of the bookmark. How far deep the bookmark 
is embedded.
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
Image: Extract Image from PDF. |. Home ›› XDoc.PDF ›› VB.NET PDF: Extract PDF Image. VB.NET PDF - Extract Image from PDF Document in VB.NET.
.net extract pdf text; delete text from pdf with acrobat
VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
VB.NET Tutorial for How to Convert PDF to Word (.docx) Document in VB.NET. using RasterEdge.XDoc.PDF; Convert PDF to Word Document in VB.NET Demo Code.
erase text from pdf; delete text from pdf online
24
User Guide
Output Documents (DOCOUTPUTS)
The DOCOUTPUTS element contains one DOCOUTPUT element for every document type
(DOCTYPE) to be created. The DOCTYPE attribute of the DOCOUTPUT specifies what type of 
file the output is to be formatted to. If no DOCTYPE is declared, the default found in the 
DTD is selected, which by default is PDF. A FILENAME and FOLDER are required attributes
and at least one DOCOUTPUT is required.  
Table 4– Document OutputAttributes
Name
Values
Description
FILENAME
Filename
The Filename specifies the output document name.
FOLDER
Folder
The Folder property delivers the document to the 
specified folder.  
DOCTYPE
PDF (Default)
IMAGE
TXT
ORIGINAL
PDFINFO
PDFATTACHMENT
HTML
RTF
MSWORD
XPS
Specifies which type of output the document will be
converted to. If none is selected, PDF is chosen by 
default.
A PDF document
Format as defined in the Image settings
A text document.
Conversion does not occur, simply file movement.
Simple text tokens, information in regards to the PDF
generated.
Extracts all attachments from the PDF to the specified 
folder. A filename is still required but will be overwritten 
by the attachment name. 
An HTML document.
An RTF document.
A Microsoft Word document.
A Microsoft XPS document.
C# Create PDF from Word Library to convert docx, doc to PDF in C#.
A convenient C#.NET control able to turn all Word text and image content into high quality PDF without losing formatting. Convert
copy text from pdf; c# extract pdf text
C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
key. Quick to remove watermark and save PDF text, image, table, hyperlink and bookmark to Word without losing format. Powerful components
c# get text from pdf; extract pdf text to word
25
User Guide
Document Destinations (DESTINATION)
The Destination collection can also send the output to Multiple Folders including network 
folders, printers,Email orURI.  The DESTINATIONelementis used to specify 
DESTFOLDERS, DESTPRINTERS, DESTEMAILS and DESTURIS and these elements define 
where the DOCOUTPUT(s) document(s)are to be delivered. If no folder path for the 
DOCOUTPUTS element is selected (a “” is required) then the only outputs that would be 
processed would be the ones defined in the DESTINATION element. 
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
Able to extract single or multiple pages from adobe The portable document format, known as PDF document, is a they are using different types of word processors
copy paste pdf text; extract text from scanned pdf
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
VB.NET: Extract PDF Pages and Save into a New PDF File. You VB.NET: Extract PDF Pages and Overwrite the Original PDF File. Instead
how to copy and paste pdf text; copy highlighted text from pdf
26
User Guide
Destination Folders (DESTFOLDERS)
A copy of each DOCOUTPUTwill be sent to the specified folder. The XML Job Ticket can 
contain multiple DESTFOLDER elements for multiple destinations (SeeFigure2–
DocumentInput,DocumentOutputandDestination).
Table 5– Destination Folders Attributes
Name
Values
Description
FOLDER
Folder
The Folder property delivers the PDF to the specified 
folder.  
Printer (DESTPRINTERS)
PDF documents can be spooled to the specified printer as shown in the sample XML excerpt 
(seeFigure2–DocumentInput,DocumentOutputandDestination).  Adobe Acrobat 
must be installed on the computer. 
Table 6–Destination Printer Attributes
Name
Values
Description
PRINTER
Printer Name
The PRINTER property must be set to the printer name 
as shown in the “Printers and Faxes” folder accessed 
from the Control Panel.  
PRINTPAGES
Numeric
1,2,3
Individual pages
1-12
Range of pages inclusive
23-
Range to the end of the document
Or any combination of the ranges.
NUMBEROFCOPIES
Numeric
Specifies the number of copies to print.
Email (DESTEMAILS)
Email messages may be specified as shown in the sample XML excerpt (SeeFigure2–
DocumentInput,DocumentOutputandDestination).  Express creates the Email 
message, adds the PDF as an attachment and sends the message using the users Email 
information.  A valid Email account must be configured and all required elements must be 
added to the XML Job Ticket.  The following attributes are required; RECIPIENT, SENDER, 
SERVERNAME, USERNAME, PASSWORD.Refer to Table7–DestinationEmailAttributes
for a description of the XML Email properties.
Table 7– DestinationEmail Attributes
Name
Values
Description
RECIPIENT
Email Address
The Emailaddress of the recipient where the Email
message is sent.  Multiple Emailaddresses may be 
specified by separating them with the semicolon (;) 
character.
27
User Guide
Name
Values
Description
SENDER
EmailAddress
Express sends all Email messages using the default 
Emailaccount of the Emailclient. 
It is possible to set the Sent From Email address to a 
different address by defining the Sender property.  When 
using this property, you must specify the Emailserver 
using the SERVERNAME property.  A copy of the Email
message is sent to the address defined when the Sender 
property is used.  This second Emailis disabled by 
setting the COPYTOSENDER property to No. 
CC
EmailAddress
The Emailaddress where a Carbon Copy of the Emailis 
sent.  Multiple Emailaddresses may be specified by 
separating them with the semicolon (;) character.
BCC
EmailAddress
The Emailaddress where a Blind Carbon Copy of the 
Emailis sent.  Multiple Emailaddresses may be 
specified by separating them with the semicolon (;) 
character.
SUBJECT
Text
The subject of the Emailmessage.
MESSAGE
Text
The message for the Email.  Multiple lines may be 
specified by inserting the double pipe (||) characters.  
The double pipes will be automatically removed and 
replaced with a carriage return line feed (CRLF) in the 
Emailmessage.  Emailmessages are limited to 1024 
characters.
ATTACHMENTS
Filename
Additional attachments may be added to the Email
message by using the ATTACHMENTS property.  
Multiple attachments may be specified by separating 
each path by a semicolon (e.g. C:\Temp\misc.pdf; 
C:\Temp\Intro.pdf).
COPYTOSENDER
Yes (Default)
No
Enables/Disables sending a copy of the Emailto the 
sender.
HTMLMESSAGE
Filename
The Emailmessage may be defined using an HTML file 
rather than from the MESSAGE keyword.  The HTML file 
will replace the complete message.
Delivering PDF files using an EmailOutbox requires that an Emailclient software application 
(e.g. Microsoft Outlook, Microsoft Outlook Express) be installed and configured on the 
server where Express Server is running. If no Emailclient is selected, simple mail transfer 
protocol (SMTP), which is built into Express, can be used. Special characters must be used 
to separate lines as well as the addition of other special characters, please seeAppendixG
–SpecialCharactersfor details.
28
User Guide
Destination Outbox Settings (DESTOUTBOXSETTINGS)
When using destination Emails, the Outlook outbox can be used.  This allows the user to 
take advantage of default settings such as signatures and other features found within 
Outlook(See Figure3–LogSettings).
Table 8–Outbox Settings Attributes
Name
Values
Description
ENABLED
Yes 
No (Default)
Enable/Disable sending the DOCOUTPUT using the 
outbox in Microsoft Outlook.
USERNAME
Text
Specifies the Outlook email account user name.
PASSWORD
Text
Specifies the Outlook email account password.
Destination SMTP Settings (DESTSMTPSETTINGS)
When usingdestination Emails, an SMTP server is required.  If the user does not have an 
Email program, they can use the one built within Express, as long as a valid SMTP server is 
still available(SeeFigure3–LogSettings).
Table 9–SMTP Settings Attributes
Name
Values
Description
ENABLED
Yes 
No (Default)
Enable/Disable sending the DOCOUTPUTusing the 
SMTP email server.
SERVERNAME
Text
Specifies the SMTP Server name.
SERVERPORT
Numeric
Specifies the SMTP Server port.
USERNAME
Text
Specifies the SMTP Server user.
PASSWORD
Text
Specifies the SMTP Server user password.
29
User Guide
Web (DESTURIS)
The outputted document can be uploaded as a Universal Resource Identifier (URI). This 
includes protocols such as FTPand HTTP.  Multiple servers can be defined by creating 
multiple DESTURI elements (SeeFigure2–DocumentInput,DocumentOutputand
Destination).
Note:
The DESTFTPS collection has been expanded and changed to DESTURIS. To FTP 
your documents, simply create a DESTURI element anddefine “FTP” as the 
PROTOCOL attribute.
Table 10–Destination Web Attributes
Name
Values
Description
URI
Text
The full path of the URI, takes precedence over 
host/port/username/password combination.
<scheme>://<user>:<password>@<host>:<port>/<url-
path>;<params>?<query>#<fragment>
PROTOCOL
Default (Default)
FTP
HTTP
HTTPS
Gopher
Set the URI protocol type
Default protocol
File Transfer Protocol
HyperText Transfer Protocol
HyperText Transfer Protocol, Secure
Gopher File Transfer
ACCESSTYPE
Default (Default)
Direct
NamedProxy
Sets the proxy behavior for this control's connections
Default Access Type
Direct Access Type
A Named proxy Access Type
HOST
Text
Specifies the name of the URI Server.
PORT
Numeric
(Default = 21)
Specifies the URI port.
FOLDER
Text
Specifies the folder on the URI Server where files are 
to be placed.
DATATYPE
Binary  (Default)
ASCII
Specifies the URI Transfer Method.
PROXYSERVER
Text
Name of the proxy server.
USERNAME
Text
Specifies the Username for logging into the URI Server.
PASSWORD
Text
Specifies the Password for logging into the URI Server.
REQUESTTIMEOUT
Numeric
Time interval before Express times out a URI attempted 
connection.
30
User Guide
Figure 2– Document Input, Document Output and Destination
<JOB:DOCINPUTS>
<JOB:DOCINPUT FILENAME="Water on the Space Station.doc" FOLDER="C:\Adlib 
Express Job Tickets\Docs\" OPENPASSWORD="Adlib" />
<JOB:DOCINPUT FILENAME="" FOLDER="" URI="http://www.yahoo.com" 
URIDOWNLOAD="No" />
</JOB:DOCINPUTS>
<JOB:DOCOUTPUTS>
<JOB:DOCOUTPUT FILENAME="Multiple Documents with Hyperlinks 
Bookmarks.pdf" FOLDER="C:\Express Job Tickets\XML Job Tickets Output\" 
DOCTYPE="PDF">
<JOB:DESTINATION>
<JOB:DESTFOLDERS>
<JOB:DESTFOLDER FOLDER="H:\Backup" />
</JOB:DESTFOLDERS>
<JOB:DESTPRINTERS>
<JOB:DESTPRINTER PRINTER="HP LaserJet 4100 PCL 6" PRINTPAGES="All"
NUMBEROFCOPIES="1" />
</JOB:DESTPRINTERS>
<JOB:DESTEMAILS>
<JOB:DESTEMAIL RECIPIENT="john.doe@acme.com" SENDER="jane.smith@acme.com" 
CC="jane.doe@acme.com" BCC="john.smith@acme.com" 
SERVERNAME="mail.abc.com" SERVERPORT="25" USERNAME="jdoe" 
PASSWORD="abc242" SUBJECT="Interesting Information" 
MESSAGE="John,&gt;CR&lt;You will find this interesting. &gt;CR&lt;Jane" 
ATTACHMENTS="C:\Temp\misc.pdf;C:\Temp\Intro.pdf" COPYTOSENDER="Yes" 
HTMLMESSAGE="template.htm">
<JOB:DESTOUTBOXSETTINGS ENABLED="Yes" USERNAME="test"
PASSWORD="test1" />
<JOB:DESTSMTPSETTINGS ENABLED="Yes"
SERVERNAME="test@adlibsoftware.com" SERVERPORT="25" USERNAME="test"
PASSWORD="test1" />
</JOB:DESTEMAIL>
</JOB:DESTEMAILS>
<JOB:DESTURIS>
<JOB:DESTURI URI="ftp://test:test@www.adlibsoftware.com:21/test" />
<JOB:DESTURI PROTOCOL="FTP" ACCESSTYPE="Default"
HOST="www.adlibsoftware.com" PORT="21" FOLDER="URI-Test" 
USERNAME="test" PASSWORD="test" />
<JOB:DESTURI PROTOCOL="HTTP" ACCESSTYPE="Default" HOST="http://test" 
PORT="80" FOLDER="test/" REQUESTTIMEOUT="60" />
</JOB:DESTURIS>
</JOB:DESTINATION>
</JOB:DOCOUTPUT>
</JOB:DOCOUTPUTS>
Documents you may be interested
Documents you may be interested