how to display pdf file in c# windows application : C# get text from pdf software application cloud windows html azure class Express%20XML%20Job%20Ticket%20Manual6-part387

61
User Guide
Name
Values
Description
DeleteFile
MoveFileToErrorFolder 
(Default)
MoveFileToOutputFolder
None
Deletes the PDF document and 
moves the input document to the 
Error Folder.
Moves the PDF and the input 
document to the Error Folder.
Moves the PDF to the output 
folder.  Moves the input document 
as specified by the Input File 
Handling. 
Do nothing; leave the file where it 
is.
Figure 8–Document Validation
<JOB:DOCUMENTVALIDATION ENABLED="Yes" CANCELONMISSINGRESOURCES="Yes" 
MISSINGRESOURCESFILEHANDLING="MoveFileToErrorFolder" 
CANCELONMISSINGFONTS="Yes" MISSINGFONTSFILEHANDLING="MoveFileToErrorFolder" 
CANCELONPAGINATIONERROR="Yes" PAGINATIONERRORTHRESHOLD="5" 
PAGINATIONERRORFILEHANDLING="MoveFileToErrorFolder" 
CHECKFORUNSUPPORTEDBOOKMARKFONT=”Yes”
UNSUPPORTEDBOOKMARKFONTFILEHANDLING=”None”/>
C# get text from pdf - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
copy text from pdf to word with formatting; erase text from pdf
C# get text from pdf - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
get text from pdf into excel; copy pdf text to word document
62
User Guide
EFTS Settings (EFTSSETTINGS)
(Extended File Type Support)
Table 42–EFTS Settings Attributes
Name
Values
Description
SUPPORTEDFILETYPES
Text
Specifies which file types are to be 
processed.  Multiple file types are to be 
specified using a pipe delimited list 
(DOC|XML|PPT).  
Note: Please refer to Appendix D –
Supported File Types in the Express User 
Guide for a complete list of all the supported 
file extensions.
Table 43–EFTS Supported File Types
File Type
Extension
Microsoft Word
DOC, DOT
Microsoft Word (Rich Text)
RTF
Microsoft Excel
XLS, XLT
Microsoft PowerPoint
PPT, POT, PPS
Joint Photographic Experts Group
JPG
Bitmap
BMP
Hypertext Markup Language
HTML, HTM, MHT
Hewlett Packard Graphics Language
HPGL
Corel Clipart format
CMX
Corel Draw
CDR
Corel/Novell WordPerfect
WPD, WP5
Microsoft Visio
VSD
Microsoft Project (Text only)
MPX
Microsoft Outlook Message
MSG
C# PDF insert text Library: insert text into PDF content in C#.net
try this C# demo. // Open a document. String inputFilePath = Program.RootPath + "\\" 1.pdf"; PDFDocument doc = new PDFDocument(inputFilePath); // Get a text
extract text from scanned pdf; extract text from pdf online
C# PDF Annotate Library: Draw, edit PDF annotation, markups in C#.
for adding text box to PDF and edit font size and color in text box field Learn how to retrieve all annotations from PDF file in C# project. // Get PDF document
get text from pdf online; extracting text from pdf
63
User Guide
Error Settings (ERRORSETTINGS)
Error Settings determine what happens to a job in the event of a missing file or if a specific 
conversionhas failed.  This includes converting to PDF, Image, Text or OCR’ing the 
document.  These settings allow the user to control what happens if one of these cases is 
true.
Table 44– Error Settings Attributes
Name
Values
Description
CANCELJOBON0BYTEFILE
Yes 
(Default)
No 
Enable/Disable whether the job is cancelled if a 
0 Byte DocInput file in encountered.
CANCELJOBONCONVERSIONERROR
Yes 
(Default)
No 
Enable/Disable whether the job is cancelled if a 
conversion error occurs.
CANCELJOBONPDFSECURITY
Yes 
(Default)
No 
Enable/Disable whether the job is cancelled if a 
PDF DocInput with PDF Security preventing 
conversion is encountered.
CANCELJOBONMISSINGDOCINPUT
Yes 
(Default)
No 
Enable/Disable whether the job is cancelled if a 
DocInput is missing.
CANCELJOBONEXISTINGDOCOUTPUT
Yes
No 
(Default)
Enable/Disable whether the job is cancelled if a 
DocOutput already exists in the specified 
location.
ERRORDOCREFERENCENAME
Text
Specifies an alias to a DOCREFERENCE in 
the Job Ticket
Figure 9–Error Settings
<JOB:ERRORSETTINGS CANCELJOBONCONVERSIONERROR="Yes" 
CANCELJOBONMISSINGINPUT="Yes" />
C#: Use OCR SDK Library to Get Image and Document Text
On this Visual C# tutorial page, you will see how SDK in your application to extract and get text from Tiff Extracted text can be output to Word or PDF document
copy pdf text with formatting; a pdf text extractor
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
C# users are able to extract image from PDF document page and get image information for indexing and accessing. C# Project: DLLs for PDF Image Extraction.
edit pdf replace text; c# extract pdf text
64
User Guide
Headers/Footers(HEADERS/FOOTERS)
XML Job Tickets may be used to add branding information in the form of headers and 
footerstodocumentsbeing processed(See Table46–Header/Footer).
Header and footer text can be appliedin the Left, Center and Right justification of each PDF 
page. Multiple line headers and footers are defined by inserting a <CR> string into the text 
string.  These characters will be automatically removed and replaced with a carriage return 
line feed (CRLF) when the document is processed.  Multiple header or multiple footer 
elements can be added to the XML Job Ticket allowing for a variety of headers or footers as 
desired.  Contained in the HEADERS or FOOTERS element is as many HEADER or FOOTER 
elements as needed, however to turn off the entire collection, the HEADERS or FOOTERS 
element must have its ENABLED attribute defined as “No” (Figure10–Footersand
Headers).
The following annotations may be included in the Header and Footer Text.
Page Number - &[Page]
Total Number of Pages - &[Pages]
Date - &[Date]
Time - &[Time]
Document Path - &[Path]
Document File Name - &[File]
Page ID - &[PageID]
Full Path - &[FullPath]
Error- &[Error]
Note, these annotations are evaluated and automatically replaced by the appropriate value 
when the document is processed. Also, the [PageID] is an annotation for Page Identification 
(refer to
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
C#.NET Sample Code: Extract PDF Pages and Save into a New PDF File in C#.NET. You can easily get pages from a PDF file, and then use these pages to create and
copying text from pdf to word; how to copy and paste pdf text
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
page reordering and PDF page image and text extraction In addition, C# users can append a PDF file get PDFDocument object from one file String inputFilePath1
copy text from locked pdf; extract text from pdf open source
65
User Guide
PageIdentification(PAGEIDENTIFICATION) for more details).
Table 45– Headers/Footers Attributes
Name
Values
Description
ENABLED
Yes (Default)
No 
Enables the entire collection of headers or footers.
PRIORITY
1,2,3,4
Specifies the order that certain publishing features 
will be applied.  These features are Headers, 
Footers, Overlays, and Watermarks.
1 is the feature that will be applied first, 4 being the 
feature applied last.
Table 46–Header/FooterAttributes
Name
Values
Description
ENABLED
Yes (Default)
No
Enables/Disableswhether header or footer
elements are to be applied.
FONTNAME
Helvetica (Default)
Helvetica-Bold
Helvetica-Oblique
Times-Roman
Times-Italic
Times-Bold
Courier
Courier-Oblique
Courier-Bold
Symbol
ZapfDingbats
Name of the font for the header/footer.  Helvetica is 
the default font if none is specified.
FONTNAMEEXTENDED
Text
The Font Name of the font which is not a standard 
PDF font. This font must exist on the system. 
For example:
Georgia
Georgia Bold
Georgia Italic
Georgia Bold Italic
Tip: Look in the Windows font folder for valid font 
names.
FONTSIZE
1-4096
(Default = 10)
Font size for the header/footer.
FONTCOLOR
Numeric 
1
(Default = 6447714)
BGR value for the Color of the header/footertext.  
You can retrieve the BGR values from the 
header/footer settings screen.  Alternatively, you 
can use the RGB function from programming 
applications such as Microsoft Visual Basic and 
Microsoft Visual C++ to convert the three RGB 
VB.NET PDF Annotate Library: Draw, edit PDF annotation, markups in
annotating features, provides developers with a great .NET solution to annotate .pdf file with both text & graphics. From this page, you will get a simple VB
copy text from pdf; export highlighted text from pdf
C# PDF Text Search Library: search text inside PDF file in C#.net
Able to find and get PDF text position details in C#.NET application. Allow to search defined PDF file page or the whole document.
pdf text replace tool; copy and paste text from pdf to excel
66
User Guide
Name
Values
Description
values to a single Color value(e.g. RGB(247, 198, 
0) = 50935) using the formula0.3 Red + 0.59 
Green + 0.11 Blue.
FONTEXTENDEDBOLD
Yes 
No (Default)
Future Implementation
FONTEXTENDEDITALIC
Yes 
No (Default)
Future Implementation
APPLYAFTERTRANSFOR
MATION
Yes (Default)
No 
Specifies whether or not theheader/footer will be 
applied after Transformation.
LAYER
Automatic (Default)
Foreground
Background
Specifies the layer where the header/footer will be 
placed. When Automatic is selected, Express 
inserts the header/footer on the layer (Foreground 
or Background) that will make it visible.
ORIENTATION
Page
Text
Specifies the orientation of the header/footer by 
positioning it according to the PDF page or in 
alignment with the text on that page.
MARGINLEFT
Numeric 
1
(Default = 0.25)
Margin for the TEXTLEFT text string.
MARGINRIGHT
Numeric 
1
(Default = 0.25)
Margin for the TEXTRIGHT text string.
MARGINVERTICAL
Numeric 
1
(Default = 0.25)
Vertical margin for the header/footer.
OPACITY
1 - 100 (Default = 
100)
Specifies the opacity/transparency level of the 
header/footer.
TEXTLEFT
Text
Defines a header/footer that is left justified.
TEXTCENTER
Text
Defines a header/footer that is centered.
TEXTRIGHT
Text
Defines a header/footer that is right justified.
PAGES
1, 3
5-7
10-
First
Even
Odd
Last
All (Default)
Specifies the pages in the document to add the 
Header or Footer to.
Individual pages
Range of pages inclusive
Range to the end of the document
First page only
Even pages
Odd pages
Last page
All pages
67
User Guide
Name
Values
Description
DOCN
DOCN-
TOC
IDX
DocInputAlias[1-]
Error
Applies Header/Footer to the N
th
document.
Applies Header/Footer from the N
th
document to 
the end of the final document.
Applies Header/Footer to the TOC report.
Applies Header/Footer to the INDEX.
Applies Header/Footer to the page range specified 
by the DocInput Alias.
Applies Header/Footer to only the pages that are 
error related.
PAGENUMBERINGMODE
MergedDocument 
(Default)
ExtractedPages
OriginalDocuments
Specifies the page numbering mode for the 
document.
Numbers the document sequentially as a single 
document (Page of Total Pages) but uses page 
numbering prior to extracting selected pages.
Numbers the document sequentially as a single 
document (Page of Total Pages) but uses page 
numbering after extracting selected pages.
Note: MergedDocument and ExtractedPages 
modes result in identically numbered documents if 
all pages are used.
Numbers the pages as if they were individual 
documents (Individual Document Page of Total 
Individual Document Pages). 
1- The units are inches for the Imperial measurement system and centimeters for the Metric 
measurement system set in the Regional Settings of the computer where Express is installed.
68
User Guide
Table 47–Page Numbering Mode
Document
Page Number
MergedDocument
ExtractedPages
OriginalDocuments
Doc 1 - Page 1 of 3
1 of 8
1 of 7
1 of 3
Doc 1 - Page 2 of 3 Omitted
Doc 1 - Page 3 of 3
3 of 8
2 of 7
3 of 3
Doc 2 - Page 1 of 2
4 of 8
3 of 7
1 of 2
Doc 2 - Page 2 of 2
5 of 8
4 of 7
2 of 2
Doc 3 - Page 1 of 3
6 of 8
5 of 7
1 of 3
Doc 3 - Page 2 of 3
7 of 8
6 of 7
2 of 3
Doc 3 - Page 3 of 3
8 of 8
7 of 7
3 of 3
Figure 10–Footers and Headers
<JOB:FOOTERS ENABLED="Yes">
<JOB:FOOTER ENABLED="Yes" FONTNAME="Helvetica-Bold" FONTSIZE="10" 
FONTCOLOR="0" LAYER="Foreground" MARGINLEFT="0.25" MARGINRIGHT="0.25" 
MARGINVERTICAL="0.5" OPACITY="75" ORIENTATION="Page" TEXTCENTER="&amp;[Date] 
- &amp;[Time]" TEXTLEFT="&amp;[File]&lt;CR&gt;&amp;[PageID]" 
TEXTRIGHT="&amp;[Page] of &amp;[Pages]" PAGES="Odd" 
PAGENUMBERINGMODE="MergedDocument" />
<JOB:FOOTER ENABLED="Yes" TEXTLEFT="Different footers on specified pages" 
PAGES="Even" OPACITY="70" ORIENTATION="Text" />
</JOB:FOOTERS>
<JOB:HEADERS ENABLED="Yes">
<JOB:HEADER ENABLED="Yes" FONTNAME="Courier" FONTSIZE="10" 
FONTCOLOR="6447714" LAYER="Automatic" MARGINLEFT="0.25" MARGINRIGHT="0.25" 
MARGINVERTICAL="0.25" OPACITY="70" ORIENTATION="Page" TEXTCENTER="Header 
Center Line 1&lt;CR&gt;Header Center Line 2" TEXTLEFT="Header Left Line 
1&lt;CR&gt;Header Left Line 2" TEXTRIGHT="Header Right Line 1&lt;CR&gt;Header 
Right Line 2" PAGES="Odd" PAGENUMBERINGMODE="MergedDocument" />
</JOB:HEADERS>
69
User Guide
HTML Conversion (HTMLCONVERSION)
HTML Conversion allows users to define how HTML files are rendered. Users may specify 
the page size, orientation and page margins.  
Table 48–HTML Attributes
Name
Values
Description
MARGINBOTTOM
Numeric 
1
(Default = 1)
Specifies the bottom margin for converting HTML 
documents.
MARGINLEFT
Numeric 
1
(Default = 1)
Specifies the left margin for converting HTML 
documents.
MARGINRIGHT
Numeric 
1
(Default = 1)
Specifies the right margin for converting HTML 
documents.
MARGINTOP
Numeric 
1
(Default = 1)
Specifies the top margin for converting HTML 
documents.
ORIENTATION
Portrait  (Default)
Landscape
Specifies the page orientation to use for converting 
HTML documents.
PAGESIZE
Letter (Default)
Legal
Tabloid
A Size
B Size
C Size
D Size 
E Size
F Size
A0
A1
A2
A3
A4
A5
Custom
Specifies the page size to use for converting HTML 
documents.
PAGEHEIGHT
Numeric 
1
(Default = 11)
Specifies the height of the page when the PAGESIZE 
attribute is defined as “Custom”.
PAGEWIDTH
Numeric 
1
(Default = 8.5)
Specifies the width of the page when the PAGESIZE 
attribute is defined as “Custom”.
1- The units are inches for the Imperial measurement system and centimeters for the Metric 
measurement system set in the Regional Settings of the computer where Express is installed.
70
User Guide
Figure 11–HTML
<JOB:HTMLCONVERSION MARGINBOTTOM="0.5" MARGINLEFT="0.5" MARGINRIGHT="0.5" 
MARGINTOP="0.5" ORIENTATION="Landscape" PAGESIZE="Custom" PAGEHEIGHT="11" 
PAGEWIDTH="8.5" />
Documents you may be interested
Documents you may be interested