pdfencryptor.encrypt itextsharp c# : Extracting data from pdf forms to excel software application dll winforms html wpf web forms HTMLDOC7-part1129

Chapter 8 - Command-Line Reference
This chapter describes all of the command-line options supported by HTMLDOC.
Basic Usage
The basic command-line usage for HTMLDOC is:
htmldoc options filename1.html ... filenameN.html ENTER
htmldoc options filename.book ENTER
The first form converts the named HTML files to the specified output format immediately. The second form
loads the specified 
.book
file and displays the HTMLDOC window, allowing a user to make changes and/or
generate the document interactively.
If no output file or directory is specified, then all output is sent to the standard output file.
On return, HTMLDOC returns an exit code of 0 if it was successful and non-zero if there were errors.
Options
The following command-line options are recognized by HTMLDOC.
-d directory
The 
-d
option specifies an output directory for the document files.
This option is not compatible with the PDF output format.
Chapter 8 - Command-Line Reference
8-1
Extracting data from pdf forms to excel - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
extract data from pdf using java; extracting data from pdf into excel
Extracting data from pdf forms to excel - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
exporting data from excel to pdf form; pdf form save with reader
-f filename
The 
-f
option specifies an output file for the document.
-t format
The 
-t
option specifies the output format for the document and can be one of the following:
Format
Description
html
Generate one or more indexed HTML files.
htmlsep Generate separate HTML files for each heading in the table-of-contents.
pdf
Generate a PDF file (default version - 1.4).
pdf11
Generate a PDF 1.1 file for Acrobat Reader 2.0 and later.
pdf12
Generate a PDF 1.2 file for Acrobat Reader 3.0 and later.
pdf13
Generate a PDF 1.3 file for Acrobat Reader 4.0 and later.
pdf14
Generate a PDF 1.4 file for Acrobat Reader 5.0 and later.
ps
Generate one or more PostScript files (default level - 2).
ps1
Generate one or more Level 1 PostScript files.
ps2
Generate one or more Level 2 PostScript files.
ps3
Generate one or more Level 3 PostScript files.
-v
The 
-v
option specifies that progress information should be sent/displayed to the standard error file.
--batch filename.book
The 
--batch
option specifies a book file that you would like to generate without the GUI popping up. This
option can be combined with other options to generate the same book in different formats and sizes:
htmldoc --batch filename.book -f filename.ps ENTER
htmldoc --batch filename.book -f filename.pdf ENTER
--bodycolor color
The 
--bodycolor
option specifies the background color for all pages in the document. The color can be
specified by a standard HTML color name or as a 6-digit hexadecimal number of the form 
#RRGGBB
.
HTMLDOC 1.8.29 Software Users Manual
8-2
-f filename
C# Word: How to Extract Text from C# Word in .NET Project
plain text as well as the formatting data to ensure Visual C# sample code for extracting text from powerful & profession imaging controls, PDF document, image
save data in pdf form reader; how to fill out a pdf form with reader
VB.NET Word: Extract Text from Microsoft Word Document in VB.NET
locked as static images and the data is inaccessible Guides in VB.NET. Apart from extracting text from powerful & profession imaging controls, PDF document, tiff
export excel to pdf form; save pdf forms in reader
--bodyfont typeface
The 
--bodyfont
option specifies the default text font used for text in the document body. The 
typeface
parameter can be one of the following:
typeface
Actual Font
Arial
Helvetica
Courier
Courier
Helvetica
Helvetica
Monospace DejaVu Sans Mono
Sans
DevaVu Sans
Serif
DejaVu Serif
Times
Times
--bodyimage filename
The 
--bodyimage
option specifies the background image for all pages in the document. The supported
formats are BMP, GIF, JPEG, and PNG.
--book
The 
--book
option specifies that the input files comprise a book with chapters and headings.
--bottom margin
The 
--bottom
option specifies the bottom margin. The default units are points (1 point = 1/72nd inch); the
suffixes "in", "cm", and "mm" specify inches, centimeters, and millimeters, respectively.
This option is only available when generating PostScript or PDF files.
--browserwidth pixels
The 
--browserwidth
option specifies the browser width in pixels. The browser width is used to scale images
and pixel measurements when generating PostScript and PDF files. It does not affect the font size of text.
The default browser width is 680 pixels which corresponds roughly to a 96 DPI display. Please note that your
images and table sizes are equal to or smaller than the browser width, or your output will overlap or truncate
in places.
HTMLDOC 1.8.29 Software Users Manual
--bodyfont typeface
8-3
VB.NET Image: Demo Code to Read & Capture Code 93 Barcode from
accurate & quick barcode information extracting function, has String In datas Debug.WriteLine(data) Next End & profession imaging controls, PDF document, image
how to save pdf form data in reader; can reader edit pdf forms
VB.NET TIFF: TIFF Tag Viewer SDK, Read & Edit TIFF Tag Using VB.
page contain the information about data type, count manipulating controls, like TIFF text extracting control to ASP.NET AJAX, Silverlight, Windows Forms as well
cannot save pdf form in reader; how to fill out pdf forms in reader
--charset charset
The 
--charset
option specifies the 8-bit character set encoding to use for the entire document. HTMLDOC
comes with the following character set files:
charset
Character Set
cp-874
Windows code page 874
cp-1250
Windows code page 1250
cp-1251
Windows code page 1251
cp-1252
Windows code page 1252
cp-1253
Windows code page 1253
cp-1254
Windows code page 1254
cp-1255
Windows code page 1255
cp-1256
Windows code page 1256
cp-1257
Windows code page 1257
cp-1258
Windows code page 1258
iso-8859-1
ISO-8859-1
iso-8859-2
ISO-8859-2
iso-8859-3
ISO-8859-3
iso-8859-4
ISO-8859-4
iso-8859-5
ISO-8859-5
iso-8859-6
ISO-8859-6
iso-8859-7
ISO-8859-7
iso-8859-8
ISO-8859-8
iso-8859-9
ISO-8859-9
iso-8859-14 ISO-8859-14
iso-8859-15 ISO-8859-15
koi8-r
KOI8-R
--color
The 
--color
option specifies that color output is desired.
This option is only available when generating PostScript or PDF files.
--compression[=level]
The 
--compression
option specifies that Flate compression should be performed on the output file(s). The
HTMLDOC 1.8.29 Software Users Manual
8-4
--charset charset
optional 
level
parameter is a number from 1 (fastest and least amount of compression) to 9 (slowest and most
amount of compression).
This option is only available when generating PDF or Level 3 PostScript files.
--continuous
The 
--continuous
option specifies that the input files comprise a web page (or site) and that no title page or
table-of-contents should be generated. Unlike the 
--webpage
option described later in this chapter, page
breaks are not inserted between each input file.
This option is only available when generating PostScript or PDF files.
--cookies 'name=\"value with space\"; name=value'
The 
--cookies
option specifies one or more HTTP cookies that should be sent when converting remote
URLs. Each cookie must be separated from the others by a semicolon and a space, and values containing
whitespace or the semicolon must be placed inside double-quotes. When specifying multiple cookies, the
entire cookie string must be surrounded by single quotes in order for the string to be processed correctly.
--datadir directory
The 
--datadir
option specifies the location of data files used by HTMLDOC.
--duplex
The 
--duplex
option specifies that the output should be formatted for two sided printing.
This option is only available when generating PostScript or PDF files. Use the 
--pscommands
option to
generate PostScript duplex mode commands.
--effectduration seconds
The 
--effectduration
option specifies the duration of a page transition effect in seconds.
This option is only available when generating PDF files.
--embedfonts
The 
--embedfonts
option specifies that fonts should be embedded in PostScript and PDF output. This is
especially useful when generating documents in character sets other than ISO-8859-1.
--encryption
The 
--encryption
option enables encryption and security features for PDF output.
This option is only available when generating PDF files.
HTMLDOC 1.8.29 Software Users Manual
--compression[=level]
8-5
--firstpage page
The 
--firstpage
option specifies the first page that will be displayed in a PDF file. The 
page
parameter can
be one of the following:
page
Description
p1
The first page of the document.
toc
The first page of the table-of-contents.
c1
The first page of chapter 1.
This option is only available when generating PDF files.
--fontsize size
The 
--fontsize
option specifies the base font size for the entire document in points (1 point = 1/72nd inch).
--fontspacing spacing
The 
--fontspacing
option specifies the line spacing for the entire document as a multiplier of the base font
size. A 
spacing
value of 1 makes each line of text the same height as the font.
HTMLDOC 1.8.29 Software Users Manual
8-6
--firstpage page
--footer lcr
The 
--footer
option specifies the contents of the page footer. The 
lcr
parameter is a three-character string
representing the left, center, and right footer fields. Each character can be one of the following:
lcr
Description
. A period indicates that the field should be blank.
:
A colon indicates that the field should contain the current and total number of
pages in the chapter (n/N).
/
A slash indicates that the field should contain the current and total number of
pages (n/N).
1
The number 1 indicates that the field should contain the current page number in
decimal format (1, 2, 3, ...)
a
A lowercase "a" indicates that the field should contain the current page number
using lowercase letters.
A
An uppercase "A" indicates that the field should contain the current page number
using UPPERCASE letters.
c A lowercase "c" indicates that the field should contain the current chapter title.
C
An uppercase "C" indicates that the field should contain the current chapter page
number.
d A lowercase "d" indicates that the field should contain the current date.
D
An uppercase "D" indicates that the field should contain the current date and
time.
h An "h" indicates that the field should contain the current heading.
i
A lowercase "i" indicates that the field should contain the current page number in
lowercase roman numerals (i, ii, iii, ...)
I
An uppercase "I" indicates that the field should contain the current page number
in uppercase roman numerals (I, II, III, ...)
l A lowercase "l" indicates that the field should contain the logo image.
t A lowercase "t" indicates that the field should contain the document title.
T
An uppercase "T" indicates that the field should contain the current time.
Setting the footer to "
...
" disables the footer entirely.
HTMLDOC 1.8.29 Software Users Manual
--footer lcr
8-7
--format format
The 
--format
option specifies the output format for the document and can be one of the following:
Format
Description
html
Generate one or more indexed HTML files.
htmlsep Generate separate HTML files for each heading in the table-of-contents.
pdf
Generate a PDF file (default version - 1.4).
pdf11
Generate a PDF 1.1 file for Acrobat Reader 2.0 and later.
pdf12
Generate a PDF 1.2 file for Acrobat Reader 3.0 and later.
pdf13
Generate a PDF 1.3 file for Acrobat Reader 4.0 and later.
pdf14
Generate a PDF 1.4 file for Acrobat Reader 5.0 and later.
ps
Generate one or more PostScript files (default level - 2).
ps1
Generate one or more Level 1 PostScript files.
ps2
Generate one or more Level 2 PostScript files.
ps3
Generate one or more Level 3 PostScript files.
--gray
The 
--gray
option specifies that grayscale output is desired.
This option is only available when generating PostScript or PDF files.
--header lcr
The 
--header
option specifies the contents of the page header. The 
lcr
parameter is a three-character string
representing the left, center, and right header fields. See the 
--footer
option for the list of formatting
characters.
Setting the header to "
...
" disables the header entirely.
--header1 lcr
The 
--header1
option specifies the contents of the page header for the first body/chapter page. The 
lcr
parameter is a three-character string representing the left, center, and right header fields. See the 
--footer
option for the list of formatting characters.
Setting the header to "
...
" disables the first page header entirely.
HTMLDOC 1.8.29 Software Users Manual
8-8
--format format
--headfootfont font
The 
--headfootfont
option specifies the font that is used for the header and footer text. The 
font
parameter
can be one of the following:
Courier
• 
Courier-Bold
• 
Courier-Oblique
• 
Courier-BoldOblique
• 
Helvetica
• 
Helvetica-Bold
• 
Helvetica-Oblique
• 
Helvetica-BoldOblique
• 
Monospace
• 
Monospace-Bold
• 
Monospace-Oblique
• 
Monospace-BoldOblique
• 
Sans
• 
Sans-Bold
• 
Sans-Oblique
• 
Sans-BoldOblique
• 
Serif
• 
Serif-Roman
• 
Serif-Bold
• 
Serif-Italic
• 
Serif-BoldItalic
• 
Times
• 
Times-Roman
• 
Times-Bold
• 
Times-Italic
• 
Times-BoldItalic
• 
This option is only available when generating PostScript or PDF files.
--headfootsize size
The 
--headfootsize
option sets the size of the header and footer text in points (1 point = 1/72nd inch).
This option is only available when generating PostScript or PDF files.
HTMLDOC 1.8.29 Software Users Manual
--headfootfont font
8-9
--headingfont typeface
The 
--headingfont
options sets the typeface that is used for headings in the document. The 
typeface
parameter can be one of the following:
typeface
Actual Font
Arial
Helvetica
Courier
Courier
Helvetica
Helvetica
Monospace DejaVu Sans Mono
Sans
DevaVu Sans
Serif
DejaVu Serif
Times
Times
--help
The 
--help
option displays all of the available options to the standard output file.
--helpdir directory
The 
--helpdir
option specifies the location of the on-line help files.
--jpeg[=quality]
The 
--jpeg
option enables JPEG compression of continuous-tone images. The optional 
quality
parameter
specifies the output quality from 0 (worst) to 100 (best).
This option is only available when generating PDF or Level 2 and Level 3 PostScript files.
--landscape
The 
--landscape
option specifies that the output should be in landscape orientation (long edge on top).
This option is only available when generating PostScript or PDF files.
--left margin
The 
--left
option specifies the left margin. The default units are points (1 point = 1/72nd inch); the suffixes
"in", "cm", and "mm" specify inches, centimeters, and millimeters, respectively.
This option is only available when generating PostScript or PDF files.
--linkcolor color
The 
--linkcolor
option specifies the color of links in HTML and PDF output. The color can be specified by
name or as a 6-digit hexadecimal number of the form 
#RRGGBB
.
HTMLDOC 1.8.29 Software Users Manual
8-10
--headingfont typeface
Documents you may be interested
Documents you may be interested