how to display pdf file in c# windows application : Export text from pdf to excel control Library system azure asp.net wpf console Express%20XML%20Job%20Ticket%20Manual14-part379

141
User Guide
1254
Turkish (Windows)
1255
Hebrew (Windows)
1256
Arabic (Windows)
1257
Baltic (Windows)
1258
Vietnamese (Windows)
1361
Korean (Johab)
10000
Western European (Mac)
10001
Japanese (Mac)
10002
Chinese Traditional (Mac)
10003
Korean (Mac)
10004
Arabic (Mac)
10005
Hebrew (Mac)
10006
Greek (Mac)
10007
Cyrillic (Mac)
10008
Chinese Simplified (Mac)
10010
Romanian (Mac)
10017
Ukrainian (Mac)
10021
Thai (Mac)
10029
Central European (Mac)
10079
Icelandic (Mac)
10081
Turkish (Mac)
10082
Croatian (Mac)
12000
Unicode (UTF-32)
12001
Unicode (UTF-32 Big-Endian)
20000
Chinese Traditional (CNS)
20001
TCA Taiwan
20002
Chinese Traditional (Eten)
20003
IBM5550 Taiwan
20004
TeleText Taiwan
20005
Wang Taiwan
20105
Western European (IA5)
20106
German (IA5)
20107
Swedish (IA5)
20108
Norwegian (IA5)
20127
US-ASCII
20261
T.61
20269
ISO-6937
20273
IBM EBCDIC (Germany)
20277
IBM EBCDIC (Denmark-Norway)
20278
IBM EBCDIC (Finland-Sweden)
20280
IBM EBCDIC (Italy)
20284
IBM EBCDIC (Spain)
20285
IBM EBCDIC (UK)
20290
IBM EBCDIC (Japanese katakana)
20297
IBM EBCDIC (France)
20420
IBM EBCDIC (Arabic)
20423
IBM EBCDIC (Greek)
20424
IBM EBCDIC (Hebrew)
Export text from pdf to excel - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
copy and paste text from pdf; cut and paste text from pdf
Export text from pdf to excel - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
copy pdf text to word; .net extract pdf text
142
User Guide
20833
IBM EBCDIC (Korean Extended)
20838
IBM EBCDIC (Thai)
20866
Cyrillic (KOI8-R)
20871
IBM EBCDIC (Icelandic)
20880
IBM EBCDIC (Cyrillic Russian)
20905
IBM EBCDIC (Turkish)
20924
IBM Latin-1
20932
Japanese (JIS 0208-1990 and 0212-1990)
20936
Chinese Simplified (GB2312-80)
20949
Korean Wansung
21025
IBM EBCDIC (Cyrillic Serbian-Bulgarian)
21866
Cyrillic (KOI8-U)
28591
Western European (ISO)
28592
Central European (ISO)
28593
Latin 3 (ISO)
28594
Baltic (ISO)
28595
Cyrillic (ISO)
28596
Arabic (ISO)
28597
Greek (ISO)
28598
Hebrew (ISO-Visual)
28599
Turkish (ISO)
28603
Estonian (ISO)
28605
Latin 9 (ISO)
29001
Europa
38598
Hebrew (ISO-Logical)
50220
Japanese (JIS)
50221
Japanese (JIS-Allow 1 byte Kana)
50222
Japanese (JIS-Allow 1 byte Kana - SO/SI)
50225
Korean (ISO)
50227
Chinese Simplified (ISO-2022)
51932
Japanese (EUC)
51936
Chinese Simplified (EUC)
51949
Korean (EUC)
52936
Chinese Simplified (HZ)
54936
Chinese Simplified (GB18030)
57002
ISCII Devanagari
57003
ISCII Bengali
57004
ISCII Tamil
57005
ISCII Telugu
57006
ISCII Assamese
57007
ISCII Oriya
57008
ISCII Kannada
57009
ISCII Malayalam
57010
ISCII Gujarati
57011
ISCII Punjabi
65000
Unicode (UTF-7)
65001
Unicode (UTF-8)
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
Create PDF from Word. Create PDF from Excel. Create PDF from PowerPoint. Create PDF from Tiff. Create PDF from Text. PDF Export. Convert PDF to Word (.docx
extract formatted text from pdf; export highlighted text from pdf
C# WPF PDF Viewer SDK to convert and export PDF document to other
PDF Create. Create PDF from Word. Create PDF from Excel. Create PDF from PowerPoint. Create PDF from RTF. Create PDF from Text. PDF Export. Convert PDF to Word
get text from pdf image; copy text pdf
143
User Guide
Text Settings(TEXTSETTINGS)
Text Settings allows users to define parameters for how text is formatted for text output
(See Figure28–TextSettings).
Table 121– Text Settings Attributes
Name
Values
Description
FORMATSTYLE
Simple (Default)
Spatial
Condenses the text by removing spaces.
Attempt to preserve the document layout by adding 
spaces between characters.
INSERTPAGEBREAKS
Yes
No (Default)
Specifies whether to insert page breaks into the text 
files.
MINVERTWHITESPACE
Yes (Default)
No
Excludes Line Feeds/Carriage Return characters 
used to produce the top and bottom margins.
MINHORIWHITESPACE
Yes (Default)
No
Excludes leading and trailing space characters used 
to produce the left and right margins.
OCRTOEXTRACTTEXT
Yes
No (Default)
Express will OCR the document if no text is found 
when the text extraction is performed.  This feature 
requires the Envision OCR to be installed.
NOSOURCETEXTHANDLING
Error (Default)
CreateEmptyFile
Express will error out the source document when no 
text is found and log a warning message.
Express will create an empty text file in the 
destination folder when no text is found.
1- The units are inches for the Imperial measurement system and centimeters for the Metric 
measurement system set in the Regional Settings of the computer where Express is installed.
VB.NET PDF - Convert PDF with VB.NET WPF PDF Viewer
Create PDF from Word. Create PDF from Excel. Create PDF from PowerPoint. Create PDF from Tiff. Create PDF from Text. PDF Export. Convert PDF to Word (.docx
delete text from pdf acrobat; extract text from pdf c#
C# PDF Converter Library SDK to convert PDF to other file formats
Able to export PDF document to HTML file. Allow users to convert PDF to Text (TXT) file. toolkit for C#.NET supports file conversion between PDF and various
.net extract text from pdf; erase text from pdf file
144
User Guide
Text Split (TEXTSPLIT)
Text Split allows users to split converted text output into single files. 
Table 122– Text Split Attributes
Name
Values
Description
ENABLED
Yes
No (Default)
Enables/Disables the ability to split TXT files.
Figure 28–Text Settings
<JOB:TEXTSETTINGS FORMATSTYLE="Spacial" INSERTPAGEBREAKS="Yes"
MINVERTWHITESPACE="Yes" MINHORIWHITESPACE="Yes" OCRTOEXTRACTTEXT="No">
<JOB:TEXTSPLIT ENABLED="Yes" />
</JOB:TEXTSETTINGS>
C# Create PDF from Excel Library to convert xlsx, xls to PDF in C#
Merge all Excel sheets to one PDF file. Export PDF from Excel with cell border or no border. Free online Excel to PDF converter without email.
copy text from locked pdf; find and replace text in pdf file
VB.NET PDF Converter Library SDK to convert PDF to other file
PDF Export. |. Home ›› XDoc.PDF ›› VB.NET PDF: PDF Export. be achieved with this VB.NET tutorial of PDF to text conversion. Conversion of MS Office to PDF.
extract pdf text to word; copy text from pdf reader
145
User Guide
Table of Contents (TOC)
(Requires ExpressPublishing Server)
A Table of Contents is a list of the headings in a document. You can use a Table of Contents 
to get an overview of the topics discussed in a document.  The Table of Contents is created 
using the Bookmarks contained in the PDF document.  Therefore, you must enable the 
Bookmarks feature of Express in order to create the Table of Contents successfully.  This is 
beneficial since any PDF can be augmented with a Table of Contents.  The Table of Contents 
contains hyperlinks to the same destinations as the Bookmarks.
When using XML Job Tickets, the user has the ability to define a Table of Contents(TOC) for 
each DOCINPUT. This can include, page numbers, a tab leader and links to those sections 
within the document.  Nested TOC Items can be used by using the LEVEL attribute, thus 
creating a TOC based on the bookmarks created.  An automatic TOC can be created or a 
custom TOC can be created for more control.  TOC is a part of the ExpressPublishing 
Server;please contact sales (AppendixI–ContactAdlib) if you wish to purchase the 
ExpressPublishing Server.
Please see Figure29–TableofContents for an example of a Table of Contents.
Table 123– TOC Attributes
Name
Values
Description
ENABLED
Yes
No (Default)
Enables/Disabled creation of a 
Table of Contents.
CREATETOCBOOKMARK
Yes (Default)
No
Enables/Disables the creation of a 
bookmark to the Table of Contents.
DOCUMENTBOOKMARKS
Yes (Default)
No
Enables/Disables the creation of 
automatically generated bookmarks 
for each file.
DOCUMENTBOOKMARKTEXTMODE
Defined
DocumentFilename 
(Default)
DocumentBaseFilename
DocumentTitle
Specifies how the TOC item is to be 
named.
CONTENTBOOKMARKS
Yes (Default)
No
Enables/Disables if content 
bookmarks are to be created for the 
documents.
HYPERLINKDISPLAYSTYLE
Invisible (Default)
None
BlackSolid
BlueDotted
BlueSolid
GreenDotted
GreenSolid
RedDotted
RedSolid
Specifies the style in which the 
hyperlink is displayed in the TOC.
C# HTML5 PDF Viewer SDK to convert and export PDF document to
Print PDF in WPF. PDF Create. Create PDF from Word. Create PDF from Excel. Create PDF from CSV. Create PDF from RTF. Create PDF from Text. PDF Export. Convert PDF
cut and paste pdf text; copy pdf text to word document
C# WPF PDF Viewer SDK to view, annotate, convert and print PDF in
Print PDF in WPF. PDF Create. Create PDF from Word. Create PDF from Excel. Create PDF from CSV. Create PDF from RTF. Create PDF from Text. PDF Export. Convert PDF
get text from pdf file c#; copy text from pdf without formatting
146
User Guide
Name
Values
Description
INSERTIONPAGENUMBER
Numeric (Default = 1)
Specifies the page where the TOC 
is inserted.
MARGINBOTTOM
Numeric 
(Default = 0.5) Specifies the bottom margin of the 
TOC page.
MARGINLEFT
Numeric 
1
(Default = 
0.5)
Specifies the left margin of the TOC 
page.
MARGINRIGHT
Numeric 
1
(Default = 
0.5)
Specifies the right margin of the 
TOC page.
MARGINTOP
Numeric 
(Default = 0.5) Specifies the top margin of the TOC 
page.
MAXLEVEL
Numeric
Specifies the maximum level that 
the TOC report will auto generate.
MULTILINEPAGEBREAKTHRESHOLD
Text
Specifies whether or not a multi-line 
TOC Item will wrap from one page 
to another.
ORIENTATION
Portrait (Default)
Landscape
Specifies the orientation of the TOC
page.
PAGESIZE
Automatic
Letter
Legal
Tabloid
ASize
BSize
CSize
DSize
ESize
FSize
GSize
A0
A1
A2
A3
A4
A5
Specifies the page size of the TOC 
page.  Automatic will match the size 
of the TOC Page to the first page of 
the document.
SHOWPAGENUMBERS
Yes (Default)
No
Specifies if the TOC is to show a 
page number for each item.
TABLEADERSTYLE
DashedLine 
DottedLine (Default)
None
Underline
Specifies the tab leader style 
between the TOC items and their 
page number.
1- The units are inches for the Imperial measurement system and centimeters for the Metric 
measurement system set in the Regional Settings of the computer where Express is installed.
VB.NET Create PDF from PowerPoint Library to convert pptx, ppt to
Create PDF from Word. Create PDF from Excel. Create PDF from PowerPoint. Create PDF from Tiff. Create PDF from Text. PDF Export. Convert PDF to Word (.docx
copy and paste pdf text; c# read text from pdf
147
User Guide
Table of Contents Items (TOCITEMS)
The user has the ability to define TOC items for the TOC. A Table of Contents is constructed 
from TOCITEMS (See Figure29–TableofContents).
Table 124–TOCItemsAttributes
Name
Values
Description
TEXT
Text
The text of the TOC Item and
bookmark when document bookmark 
text mode is equal to defined.
DOCUMENTBOOKMARK
Yes (Default)
No
Enables/Disables if a bookmark is to 
be created for that document.
DOCUMENTBOOKMARKTEXTMODE
Defined
DocumentFilename
(Default)
DocumentBaseFilename
DocumentTitle
Specifies how the TOC and 
bookmarks are to be named.
CONTENTBOOKMARKS
Yes (Default)
No
Enables/Disables if content 
bookmarks are to be created for that 
TOC item.
LEVEL
Numeric
Specifies what level in the TOC and 
bookmark are to be found in.
Table of Contents Item Destination (TOCITEMDESTINATION)
The Table of Contents Item Destination determines where the TOC link refers to.
Table 125–TOCItem Destination Attributes
Name
Values
Description
ADDRESS
Text
Location where the TOC Item directs to.
ADDRESSTYPE
Web (Default)
Email
Internal
File
Null
What type of address the TOC Item is.
PAGENUMBER
Text
Which page number to link to.
PAGEX
Numeric 
1
The x axis location to link to.(Starts from bottom left)
PAGEY
Numeric
1
The y axis location to link to. (Starts from bottom left)
1- The units are inches for the Imperial measurement system and centimeters for the Metric 
measurement system set in the Regional Settings of the computer where Express is installed.
148
User Guide
Table of ContentLevels (TOCLEVELS)
The Table of ContentLevels determines which style is used for each level and how far that 
level is to be indented.  To set each style, you must begin with the first level and set each of 
the 9 available levels.
Table 126– TOCLevel Attributes
Name
Values
Description
INDENTATION
Numeric
How far the level is to be indented.
STYLE
Numeric 
Which custom style the level is to use.
Table of Content Styles (TOCSTYLES)
The Table of Content Styles allows the user to create a multitude of custom styles to be 
used throughout the TOC Page.
Table 127– TOCStyle Attributes
Name
Values
Description
NAME
Text
The name of the style.
FONTNAME
Helvetica
Helvetica-Bold
Helvetica-Oblique
Times-Roman
Times-Italic
Times-Bold
Courier
Courier-Oblique
Courier-Bold
Symbol
ZapfDingbats
The font name of the style.
FONTNAMEEXTENDED
Text
The Font Name of the font which is not a 
standard PDF font.  This font must exist on the 
system. 
For example:
Georgia
Georgia Bold
Georgia Italic
Georgia Bold Italic
Tip: Look in the Windows font folder for valid 
font names.
FONTSIZE
Numeric
The font size of the style.
FONTEXTENDEDBOLD
Yes 
No (Default)
Future Implementation
149
User Guide
Name
Values
Description
FONTEXTENDEDITALIC
Yes 
No (Default)
Future Implementation
Figure 29–Table of Contents
<JOB:TOC ENABLED="Yes" CREATETOCBOOKMARK="Yes" DOCUMENTBOOKMARKS="Yes" 
DOCUMENTBOOKMARKTEXTMODE="DocumentFilename" CONTENTBOOKMARKS="Yes" 
HYPERLINKDISPLAYSTYLE="BlueSolid" INSERTIONPAGENUMBER="1" MARGINBOTTOM="0.75" 
MARGINLEFT="0.75" MARGINRIGHT="0.75" MARGINTOP="0.75" MAXLEVEL="9" 
ORIENTATION="Portrait" PAGESIZE="Letter" SHOWPAGENUMBERS="Yes" 
TABLEADERSTYLE="DottedLine">
<JOB:TOCITEMS>
<JOB:TOCITEM TEXT="Custom TOC Item1" DOCUMENTBOOKMARK="Yes" 
DOCUMENTBOOKMARKTEXTMODE="Defined" CONTENTBOOKMARKS="Yes" LEVEL="1">
<JOB:TOCITEMDESTINATION ADDRESS="C:\Test Input Files\doc1.doc" 
ADDRESSTYPE="Internal" PAGENUMBER="0" PAGEX="0" PAGEY="0" />
</JOB:TOCITEM>
</JOB:TOCITEMS>
<JOB:TOCLEVELS>
<JOB:TOCLEVEL INDENTATION="1" STYLE="Style1" />
<JOB:TOCLEVEL INDENTATION="2" STYLE="Style1" />
<JOB:TOCLEVEL INDENTATION="3" STYLE="Style1" />
<JOB:TOCLEVEL INDENTATION="4" STYLE="Style2" />
<JOB:TOCLEVEL INDENTATION="5" STYLE="Style2" />
<JOB:TOCLEVEL INDENTATION="6" STYLE="Style2" />
<JOB:TOCLEVEL INDENTATION="7" STYLE="Style3" />
<JOB:TOCLEVEL INDENTATION="8" STYLE="Style3" />
<JOB:TOCLEVEL INDENTATION="9" STYLE="Style3" />
</JOB:TOCLEVELS>
<JOB:TOCSTYLES>
<JOB:TOCSTYLE NAME="Style1" FONTNAME="Helvetica" FONTSIZE="12" />
<JOB:TOCSTYLE NAME="Style2" FONTNAME="Times-Roman" FONTSIZE="10" />
<JOB:TOCSTYLE NAME="Style3" FONTNAME="Courier" FONTSIZE="8" />
</JOB:TOCSTYLES>
</JOB:TOC>
150
User Guide
Transformations (TRANSFORMATION)
The Transformations element allows the user to modify the alignment of the PDF, scale the 
PDF or scale its contents.  Within the Transformations element, the user can specify the 
alignment of the document when transforming. The PDF uses this point as a focal point 
when applying the various transformations (See Figure30–Transformations).
Table 128– Transformations Attributes
Name
Values
Description
PAGECONTENTALIGNMENT BottomLeft
BottomCenter
BottomRight
Center (Default)
CenterLeft
CenterRight
TopCenter
TopLeft
TopRight
Specifies the alignment of the document when 
transforming.
PAGES
Text
Specifies the pages or page range to apply the 
specified transformation options.
Documents you may be interested
Documents you may be interested