how to display pdf file in c# windows application : Copy text from scanned pdf to word application Library tool html .net winforms online Express%20XML%20Job%20Ticket%20Manual8-part389

81
User Guide
IFTS Settings (IFTSSETTINGS)
(Integrated File Type Support)
Table 60–IFTS Settings Attributes
Name
Values
Description
SUPPORTEDFILETYPES
Text
Specifies which file types are to be 
processed by IFTS.  Multiple file types are to 
be specified using a pipe delimited list of the 
file extension (TXT|HPGL|MSG).  
Note: Please refer to Appendix D –
Supported File Types in the Express User 
Guide for a complete list of all the supported 
file extensions.
Table 61–IFTS Supported File Types
File Type
Extension
Tagged Image File
TIFF, TIF
Text File
TXT
Adobe Acrobat
PDF
Portable Network Graphics
PNG
Joint Photographic Experts Group
JPG
Bitmap
BMP
Hewlett Packard Graphics Language
HPGL
Microsoft Outlook Message
MSG
Copy text from scanned pdf to word - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
extract text from pdf c#; copying text from pdf into word
Copy text from scanned pdf to word - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
copy highlighted text from pdf; copy paste text pdf
82
User Guide
Images Settings (IMAGESSETTINGS)
(Requires Extended Output module)
Image Settings allows users to define parameters associated with converted images. Users 
may specify the output image compression, resolution and if pages are to be merged into a 
single document or not.
Table 62–Image Settings Attributes
Name
Values
Description
IMAGETYPE
PNG
JPEG
TIFF (Default)
Specifies image type that is outputted when 
the user defines DOCTYPE=”Image” in the 
DOCOUTPUT element.
COMPRESSION
TIFFCCITTGroup3
TIFFCCITTGroup4(Default)
TIFFColorPackBit
TIFFColorLZW
TIFFColorUncompressed
JPEGColor
JPEGGrayscale
PNGColor
PNGGrayscale
Sets the compression method used for the 
image. If an incorrect compression is 
selected, Express will choose the most 
appropriate compression for the image type.
Compression Settings for TIFF images:
Uses CCITT Group 3 encoding
Uses CCITT Group 4 encoding
Uses Pack Bits True Color (24 Bit) encoding
Uses LZW (24 Bit) encoding
Uses Uncompress (24 Bit) encoding
Compression Settings for JPEG images:
Uses True Color (24 Bit) encoding
Uses Grayscale (8 Bit) encoding
Compression Settings for PNG images:
Uses True Color (24 Bit) encoding
Uses Grayscale (8 Bit) encoding
RESOLUTION
75 –450
Sets the resolution of the image in DPI.
SIZEX
Numeric (Default = 0)
The horizontal size of the image in pixels. If 
0 is selected, then the original file size of the 
image will be used.
SIZEY
Numeric (Default = 0)
The vertical size of the image in pixels. If 0 is 
selected, then the original file size of the 
image will be used.
PRESERVEASPECTRATIO
Yes (Default)
No
Specifieswhether or not to preserve the 
aspect ratio of the image. 
C# PDF - Extract Text from Scanned PDF Using OCR SDK
edit, C#.NET PDF pages extract, copy, paste, C# a page of PDF document and extract its text content. Recognize scanned PDF document and output OCR result to MS
get text from pdf file c#; export text from pdf
VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
webpage. Create high quality Word documents from both scanned PDF and searchable PDF files without losing formats in VB.NET. Support
extract text from pdf; extract pdf text to word
83
User Guide
Image Split (IMAGESPLIT)
Image Split allows users to split converted images into single files. This only applies when 
outputting to a TIF image. 
Table 63– Image Split Attributes
Name
Values
Description
ENABLED
Yes
No (Default)
Enables/Disables the ability to split TIF
image files (Note: JPEG and PNG are only
single page files)
Figure 13– Image Settings
<JOB:IMAGESETTINGS IMAGETYPE="PNG" COMPRESSION="PNG8BitColor" 
RESOLUTION="800" SIZEX="400" SIZEY="300" PRESERVEASPECTRATIO="Yes" >
<JOB:IMAGESPLIT ENABLED="Yes" />
</JOB:IMAGESETTINGS>
C# Create PDF from Word Library to convert docx, doc to PDF in C#.
A convenient C#.NET control able to turn all Word text and image content into high quality PDF Easy to create searchable and scanned PDF files from Word.
extract text from pdf java open source; copy paste pdf text
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
Remove Image from PDF Page. Image: Copy, Paste, Cut Export all Word text and image content into high Easy to create searchable and scanned PDF files from Word.
find and replace text in pdf; c# read text from pdf
84
User Guide
Index Settings (INDEX)
An index lists the terms and topics discussed in a document, along with the pages they 
appear on.  Express extracts all words and the corresponding page numbers from a 
document and then excludes the terms that are contained in a Stop Wordstext file.  The 
resulting index is sorted alphabetically and formatted into one or more columns.  Each term 
is followed by a list of page numbers where the term is located.  Each page number is 
hyperlinked to the location of the term on the specified page.
Once the index words and page numbers are extracted, an Index Report is created based on 
the specified page size, margins and number of columns.  The font for words and page 
numbers can be specified independently.  The resulting Index Report is then appended to 
the end of the document. 
If desired, all index words and their respective page references can be created as 
Bookmarks and are appended to the end of the resulting document.
A standard Stop Word file (e.g. IndexStopWords.txt) is distributed with Express and resides 
in the installed in the Resources folder of the Express installation folder (e.g. C:\Program 
Files\Adlib\Express\Resources)(See Figure14–Indexfor an example).
Indexing is a part of the ExpressPublishing Server; please contact sales (AppendixI–
ContactAdlib) if you wish to purchase the ExpressPublishing Server.
Tip: If the number of columns is too large, the page size too small, or the column spacing 
too small, the text may become unreadable.
Table 64–Index Settings Attributes
Name
Values
Description
ENABLED
Yes
No (Default)
Enables/Disables the creation of the 
index.
COLUMNS
Numeric
Sets the number of columns for the 
index.
COLUMNSPACING
Numeric
1
Sets the spacing between columns.
CREATEBOOKMARKS
Yes
No (Default)
Specifies whether or not to create 
bookmarks based on the results of the 
index.
EXPANDEDBOOKMARKLEVELMODE All (Default)
Defined
None
Specifies whether or not to expand 
created bookmarks for the index.
EXPANDEDBOOKMARKLEVEL
Numeric
Specifies what level to expand the 
bookmarks to. (Note: 
EXPANDEDBOOKMARKLEVELMODE 
must be set to “Defined”)
HYPERLINKDISPLAYSTYLE
Invisible (Default)
None
BlackSolid
BlueDotted
BlueSolid
GreenDotted
GreenSolid
Specifies how Index Items will be 
displayed as hyperlinks.
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
Text can be extracted from scanned PDF image with OCR file, converted by our C# PDF to text converting library as, PDF to HTML converter assembly, PDF to Word
copy text from scanned pdf to word; copy pdf text to word with formatting
C# PDF insert text Library: insert text into PDF content in C#.net
Powerful .NET PDF edit control allows modify existing scanned PDF text. Ability to change text font, color, size and location and output a new PDF document.
get text from pdf into excel; get text from pdf file c#
85
User Guide
Name
Values
Description
RedDotted
RedSolid
MARGINBOTTOM
Numeric 
(Default = 
0.5)
Specifies the bottom margin.
MARGINLEFT
Numeric
1
(Default = 
0.5)
Specifies the left margin.
MARGINRIGHT
Numeric 
(Default = 
0.5)
Specifies the right margin.
MARGINTOP
Numeric 
(Default = 
0.5)
Specifies the top margin.
ORIENTATION
Portrait (Default)
Landscape
Specifies the orientation of the Index.
PAGESIZE
Automatic (Default)
Letter
Legal
Tabloid
ASize
BSize
CSize
DSize
ESize
FSize
GSize
A0
A1
A2
A3
A4
A5
Specifies the page size of the index.  
Automatic will match the size of the 
Index Page to the first page of the 
document.
STOPWORDSPATH
Text Path
Path to Stop Words file. 
(e.g. C:\Express\MyStopWords.txt)
A Stop Words file contains a list of all 
words that are to be excluded from the 
index that is generated.  
TABLEADERSTYLE
DashedLine
DottedLine (Default)
None
Underline
Specifies how the Tab Leader will be 
displayed for each index Item.
1- The units are inches for the Imperial measurement system and centimeters for the 
Metric measurement system set in the Regional Settings of the computer where Express 
is installed.
C# PDF - Read Barcode on PDF in C#.NET
Page: Replace PDF Pages. Page: Move Page Position. Page: Extract, Copy and Paste PDF Pages. Page: Rotate a PDF Page. PDF Read. Text: Extract Text from PDF. Text
extract text from pdf to excel; extract text from pdf acrobat
VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net
Text extraction from scanned PDF image with OCR component in VB.NET. Integrate following RasterEdge text to PDF converter SDK dlls into RasterEdge.XDoc.PDF.dll.
a pdf text extractor; copying text from pdf into word
86
User Guide
Index Word Style (INDEXWORDSTYLE)
Index Word Style allows users to determine which style they wish to use for the words 
created on the Index Report.
Table65– Index Word Style Attributes
Name
Values
Description
FONTNAME
Helvetica (Default)
Helvetica-Bold
Helvetica-Oblique
Times-Roman
Times-Italic
Times-Bold
Courier
Courier-Oblique
Courier-Bold
Symbol
ZapfDingbats
Sets the font name for the indexed 
word items.  Helvetica is the default 
font if none is specified.
FONTSIZE
Numeric
Sets the font size for the indexed word 
items.
FONTCOLOR
Numeric (Default = 0) BGR value for the Color of the indexed 
word items.  You can use the RGB 
function from programming 
applications such as Microsoft Visual 
Basic and Microsoft Visual C++ to 
convert the three RGB values to a 
single Color value (e.g. RGB(247, 198, 
0) = 50935) using the formula0.3 Red 
+ 0.59 Green + 0.11 Blue.
87
User Guide
Index Reference Style (INDEXREFERENCESTYLE)
Index Reference Style allows users to determine which style they wish to use for the 
reference, displayed by the appropriate page number(s) created on the Index page.
Table 66– Index Reference Style Attributes
Name
Values
Description
FONTNAME
Helvetica (Default)
Helvetica-Bold
Helvetica-Oblique
Times-Roman
Times-Italic
Times-Bold
Courier
Courier-Oblique
Courier-Bold
Symbol
ZapfDingbats
Sets the font name for the indexed 
reference items.  Helvetica is the 
default font if none is specified.
FONTSIZE
Numeric
Sets the font size for the indexed 
reference items.
FONTCOLOR
Numeric (Default = 
16711680)
BGR value for the Color of the indexed 
reference items.  You can use the RGB 
function from programming 
applications such as Microsoft Visual 
Basic and Microsoft Visual C++ to 
convert the three RGB values to a 
single Color value (e.g. RGB(247, 198, 
0) = 50935) using the formula0.3 Red 
+ 0.59 Green + 0.11 Blue.
Figure 14–Index
<JOB:INDEX ENABLED="Yes" COLUMNS="3" COLUMNSPACING="0.125" 
CREATEBOOKMARKS="Yes" EXPANDEDBOOKMARKLEVELMODE="All" 
EXPANDEDBOOKMARKLEVEL="2" HYPERLINKDISPLAYSTYLE="RedDotted" 
MARGINBOTTOM="0.5" MARGINLEFT="0.5" MARGINRIGHT="0.5" MARGINTOP="0.5" 
ORIENTATION="Landscape" PAGESIZE="Automatic" STOPWORDSPATH="C:\Adlib 
Express\Input\ULTIMATE JOB TICKETS\FILES\STOPWORDS\StopWordsPath.txt" 
TABLEADERSTYLE="Underline">
<JOB:INDEXWORDSTYLE FONTNAME="Times-Bold" FONTSIZE="15" FONTCOLOR="255" 
/>
<JOB:INDEXREFERENCESTYLE FONTNAME="Times-Bold" FONTSIZE="15" 
FONTCOLOR="0" />
</JOB:INDEX>
88
User Guide
PDF Document Information and Metadata (METADATAELEMENT)
Document Information can be added to the PDF. Fields are placed into the PDF files as they 
are processed (see Figure15–DocumentInformation). The PDF format supports the 
following four Document Information fields.
Title
Subject
Author
Keywords
In addition to these fields, the PDF format supports the insertion of user definable metadata 
fields for each document.  
Tip:
If no metadata elements are desired, set each to “” to remove them from the PDF.
Table 67– Metadata Elements Attributes
Name
Values
Description
ENABLED
Yes (Default)
No 
Enables the entire collection of Metadata elements.
Table 68–Document Information Attributes
Name
Values
Description
FIELD
Title
Subject
Author
Keywords
User Defined
Specifies the Title value.
Specifies the Subject value.
Specifies the Author value.
Specifies the Keywords value(s).
Specifies user definable metadata.  User Definable 
Metadata Field Names cannot contain spaces.
VALUE
Text
Specifies the value to be placed in the metadata.
Figure 15–Document Information
<JOB:METADATAELEMENTS ENABLED="Yes">
<JOB:METADATAELEMENT FIELD="Title" VALUE="My Document Title" />
<JOB:METADATAELEMENT FIELD="Subject" VALUE="My Document Title" />
<JOB:METADATAELEMENT FIELD="Author" VALUE="John Smith" />
<JOB:METADATAELEMENT FIELD="Keywords" VALUE="PDF, Document Conversion, 
Electronic Document, Workflow" />
<JOB:METADATAELEMENT FIELD="UserDefinedField1" VALUE="User Defined Field 
Value 1" />
<JOB:METADATAELEMENT FIELD="UserDefinedField2" VALUE="User Defined Field 
Value 2" />
</JOB:METADATAELEMENTS>
89
User Guide
MS Word Settings (MSWORDSETTINGS)
MS Word settings allowthe user to define parameters for converting documents to MS Word 
format.
Table 69– MS Word Settings Attributes
Name
Values
Description
CREATETABLES
Yes (Default)
No
Creates table objects in the resulting document 
from tables detected in the source document.
Detects tables in the source document but does 
not create table objects in the resulting document.
CREATEHEADERSFOOTERS Yes (Default)
No
Creates header and/or footer objects in the 
resulting document from headers and/or footers 
detected in the source document.
Detected headers and/or footers will be placed in 
the body of the resulting document. 
REMOVEIMAGES
Yes 
No (Default)
Removes all inline images in the resulting 
document.
Preserves all inline images in the resulting 
document.
90
User Guide
Native Application Settings (NATIVEAPPSETTINGS)
Enables users to specify how Native Applications arecontrolled during document 
processing. For example, the user can specify the printing format of Microsoft PowerPoint
documents (Slides, Handouts, Notes…).
Table 70–Native Application Attributes
Name
Values
Description
SUPPORTEDFILETYPES
Text
Specifies which file types are to be processed by 
Native Applications.  Multiple file types are to be 
specified using a pipe delimited list 
(DOC|XML|PPT).  
Note: Please refer to Appendix D – Supported File 
Types in the Express User Guide for a complete 
list of all the supported file extensions.
Table 71–Native Application Supported File Types
File Type
Extension
Microsoft Word
DOC, DOT
Microsoft Word (Rich Text)
RTF
Microsoft Excel
XLS, XLT
Microsoft PowerPoint
PPT, POT, PPS
Tagged Image File
TIFF, TIF
Portable Network Graphics
PNG
Hypertext Markup Language
HTML, HTM, MHT
Extensible Markup Language
XML
Hewlett Packard Graphics Language
HPGL
Corel Draw
CDR
Corel/Novell WordPerfect
WPD, WP5
Microsoft Visio
VSD
Microsoft Project
MPP
AutoCAD Drawing Web Format
DWF
AutoCAD Interchange
DXF
AutoCAD Native Drawing
DWG
Microsoft Outlook Message
MSG
Documents you may be interested
Documents you may be interested