c# axacropdf example : Vb extract data from pdf Library software component asp.net winforms .net mvc HTMLDOC3-part1125

Figure 5-4: The Virtual Directory Creation Wizard Window
Figure 5-5: Entering the Alias Name
HTMLDOC 1.8.29 Software Users Manual
Configuring HTMLDOC with Microsoft IIS
5-5
Vb extract data from pdf - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
extract data from pdf to excel; extract data from pdf c#
Vb extract data from pdf - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
pdf form save with reader; exporting pdf form to excel
Figure 5-6: Entering the HTMLDOC Program Folder
Figure 5-7: Enabling CGI Mode
HTMLDOC 1.8.29 Software Users Manual
5-6
Configuring HTMLDOC with Microsoft IIS
VB.NET PDF Text Extract Library: extract text content from PDF
PDF ›› VB.NET PDF: Extract PDF Text. VB.NET PDF - Extract Text from PDF Using VB. How to Extract Text from PDF with VB.NET Sample Codes in .NET Application.
extract data out of pdf file; filling out pdf forms with reader
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
Home ›› XDoc.PDF ›› VB.NET PDF: Extract PDF Image. VB.NET PDF - Extract Image from PDF Document in VB.NET. VB.NET: Extract All Images from PDF Document.
pdf form field recognition; how to save pdf form data in reader
Figure 5-8: Completion of IIS Configuration
Once configured, the htmldoc.exe  program will be available in the web server directory. For example, for a
virtual directory called cgi-bin , the PDF converted URL for the superproducts.html page would be as
follows:
http://servername/cgi-bin/htmldoc.exe/superproducts.html
The boldface portion represents the location of the HTMLDOC program on the web server.
Additional Configuration for IIS 6.0
IIS 6.0 requires additional configuration steps due to its increased focus on security. Start by running the
Internet Services Manager program (Figure 5-1):
Click on Start
1. 
Click on Settings
2. 
Click on Control Panel
3. 
Double-click on Administrative Tools
4. 
Double-click on Internet Services Manager
5. 
After the Internet Services Manager window (Figure 5-1) appears, perform the following steps to add a
new Wed Service Extension for HTMLDOC:
Click on Web Service Extensions
1. 
Click Add a new Web Service Extension
2. 
Enter the name "HTMLDOC" when the Web Service Extension  window appears
3. 
Click Add... and choose the htmldoc.exe  file from the program folder, typically
C:\Program Files\Easy Software Products\HTMLDOC
4. 
Check the Set extension status to Allowed  box
5. 
Click OK  to add the extension and dismiss the window
6. 
HTMLDOC 1.8.29 Software Users Manual
Additional Configuration for IIS 6.0
5-7
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
VB.NET: Extract PDF Pages and Save into a New PDF File. You VB.NET: Extract PDF Pages and Overwrite the Original PDF File. Instead
extract data from pdf file; vb extract data from pdf
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Image: Extract Image from PDF. |. Home ›› XDoc.PDF ›› C# PDF: Extract PDF Image. How to C#: Extract Image from PDF Document.
collect data from pdf forms; how to save fillable pdf form in reader
Finally, double-click the My Computer icon on the desktop or start the Windows Explorer. When the
explorer window appears, perform the following steps to provide write access to the Windows temporary
folder:
Open the windows temporary file folder, typically C:\WINDOWS\TEMP
1. 
Choose Properties from the File  menu
2. 
Click on the Security  tab
3. 
Click Add..., enter the username for the web server, typically "SERVER\IUSR_SERVER" where
"SERVER" is the name you gave your server, and click OK
4. 
Click on the username you just added in the list
5. 
Check the Read  and Write  permissions
6. 
Click OK  to save the changes
7. 
Using HTMLDOC From Server-Side Scripts and Programs
To make this work the CGI script or program must send the appropriate HTTP attributes, the required empty
line to signify the beginning of the document, and then execute the HTMLDOC program to generate the
HTML, PostScript, or PDF file as needed. Since HTMLDOC looks for CGI environment variables when it is
run, you must also set the 
HTMLDOC_NOCGI
environment variable to a value of 1 before running HTMLDOC
from your CGI script or program.
Another way to generate PDF files from your reports is to use HTMLDOC as a "portal" application. When
used as a portal, HTMLDOC automatically retrieves the named document or report from your server and
passes a PDF version to the web browser. See the next sections for more information.
HTMLDOC 1.8.29 Software Users Manual
5-8
Using HTMLDOC From Server-Side Scripts and Programs
C# PDF Text Extract Library: extract text content from PDF file in
XDoc.PDF ›› C# PDF: Extract PDF Text. C# PDF - Extract Text from PDF in C#.NET. Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File.
export pdf form data to excel; extracting data from pdf into excel
VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
External cross references. Private data of other applications. Flatten visible layers. VB.NET Demo Code to Optimize An Exist PDF File in Visual C#.NET Project.
how to make pdf editable form reader; flatten pdf form in reader
Calling HTMLDOC from a Shell Script
Shell scripts are probably the easiest to work with, but are normally limited to GET type requests. Here is a
script called topdf that acts as a portal, converting the named file to PDF:
#!/bin/sh
#
# Sample "portal" script to convert the named HTML file to PDF on-the-fly.
#
# Usage: http://www.domain.com/path/topdf/path/filename.html
#
#
# Tell HTMLDOC not to run in CGI mode...
#
HTMLDOC_NOCGI=1; export HTMLDOC_NOCGI
#
# The "options" variable contains any options you want to pass to HTMLDOC.
#
options='-t pdf --webpage --header ... --footer ..."
#
# Tell the browser to expect a PDF file...
#
echo "Content-Type: application/pdf"
echo ""
#
# Run HTMLDOC to generate the PDF file...
#
htmldoc $options http://${SERVER_NAME}:${SERVER_PORT}$PATH_INFO
Users of this CGI would reference the URL "http://www.domain.com/topdf.cgi/index.html" to generate a PDF
file of the site's home page.
The options  variable in the script can be set to use any supported command-line option for HTMLDOC; for a
complete list see Chapter 8 - Command-Line Reference.
HTMLDOC 1.8.29 Software Users Manual
Calling HTMLDOC from a Shell Script
5-9
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
VB.NET Components to combine various scanned images to PDF, such as tiff, jpg, png, gif, bmp, etc. Merge Microsoft Office Word, Excel and PowerPoint data to PDF
how to fill in a pdf form in reader; how to extract data from pdf to excel
VB.NET PDF Convert to HTML SDK: Convert PDF to html files in vb.
Embed converted html files in html page or iframe. Export PDF form data to html form in .NET WinForms and ASP.NET. Turn PDF images to HTML images in VB.NET.
extract data from pdf to excel online; extract data from pdf form fields
Calling HTMLDOC from Perl
Perl scripts offer the ability to generate more complex reports, pull data from databases, etc. The easiest way
to interface Perl scripts with HTMLDOC is to write a report to a temporary file and then execute HTMLDOC
to generate the PDF file.
Here is a simple Perl subroutine that can be used to write a PDF report to the HTTP client:
sub topdf {
# Get the filename argument...
my $filename = shift;
# Make stdout unbuffered...
select(STDOUT); $| = 1;
# Tell HTMLDOC not to run in CGI mode...
$ENV{HTMLDOC_NOCGI} = 1;
# Write the content type to the client...
print "Content-Type: application/pdf\n\n";
# Run HTMLDOC to provide the PDF file to the user...
system "htmldoc -t pdf --quiet --webpage $filename";
}
Calling HTMLDOC from PHP
PHP provides a 
passthru()
function that can be used to run HTMLDOC. This combined with the 
header()
function can be used to provide on-the-fly reports in PDF format.
Here is a simple PHP function that can be used to convert a HTML report to PDF and send it to the HTTP
client:
function topdf($filename, $options = "") {
# Tell HTMLDOC not to run in CGI mode...
putenv("HTMLDOC_NOCGI=1");
# Write the content type to the client...
header("Content-Type: application/pdf");
flush();
# Run HTMLDOC to provide the PDF file to the user...
passthru("htmldoc -t pdf --quiet --jpeg --webpage $options '$filename'");
}
The function accepts a filename and an optional "options" string for specifying the header, footer, fonts, etc.
To prevent malicious users from passing in unauthorized characters into this function, the following function
can be used to verify that the URL/filename does not contain any characters that might be interpreted by the
shell:
HTMLDOC 1.8.29 Software Users Manual
5-10
Calling HTMLDOC from Perl
function bad_url($url) {
// See if the URL starts with http: or https:...
if (strncmp($url, "http://", 7) != 0 &&
strncmp($url, "https://", 8) != 0) {
return 1;
}
// Check for bad characters in the URL...
$len = strlen($url);
for ($i = 0; $i < $len; $i ++) {
if (!strchr("~_*()/:%?+-&@;=,$.", $url[$i]) &&
!ctype_alnum($url[$i])) {
return 1;
}
}
return 0;
}
Another method is to use the 
escapeshellarg()
function provided with PHP 4.0.3 and higher to generate a
quoted shell argument for HTMLDOC.
To make a "portal" script, add the following code to complete the example:
global $SERVER_NAME;
global $SERVER_PORT;
global $PATH_INFO;
global $QUERY_STRING;
if ($QUERY_STRING != "") {
$url = "http://${SERVER_NAME}:${SERVER_PORT}${PATH_INFO}?${QUERY_STRING}";
} else {
$url = "http://${SERVER_NAME}:${SERVER_PORT}$PATH_INFO";
}
if (bad_url($url)) {
print("<html><head><title>Bad URL</title></head>\n"
."<body><h1>Bad URL</h1>\n"
."<p>The URL <b><tt>$url</tt></b> is bad.</p>\n"
."</body></html>\n");
} else {
topdf($url);
}
HTMLDOC 1.8.29 Software Users Manual
Calling HTMLDOC from PHP
5-11
Calling HTMLDOC from C
C programs offer the best flexibility and easily supports on-the-fly report generation without the need for
temporary files.
Here are some simple C functions that can be used to generate a PDF report to the HTTP client from a
temporary file or pipe:
#include <stdio.h>
#include <stdlib.h>
/* topdf() - convert a HTML file to PDF */
FILE *topdf(const char *filename)           /* I - HTML file to convert */
{
char      command[1024];                  /* Command to execute */
/*
* Tell HTMLDOC not to run in CGI mode...
*/
putenv("HTMLDOC_NOCGI=1");
/*
* Write the content type to the client...
*/
puts("Content-Type: application/pdf\n");
/*
* Run HTMLDOC to provide the PDF file to the user...
*/
sprintf(command, "htmldoc --quiet -t pdf --webpage %s", filename);
return (popen(command, "w"));
}
/* topdf2() - pipe HTML output to HTMLDOC for conversion to PDF */
FILE *topdf2(void)
{
/*
* Tell HTMLDOC not to run in CGI mode...
*/
putenv("HTMLDOC_NOCGI=1");
/*
* Write the content type to the client...
*/
puts("Content-Type: application/pdf\n");
/*
* Open a pipe to HTMLDOC...
*/
return (popen("htmldoc --quiet -t pdf --webpage -", "w"));
}
HTMLDOC 1.8.29 Software Users Manual
5-12
Calling HTMLDOC from C
Calling HTMLDOC from Java
Java programs are a portable way to add PDF support to your web server. Here is a class called htmldoc that
acts as a portal, converting the named file to PDF. It can also be called by your Java servlets to process an
HTML file and send the result to the client in PDF format:
class htmldoc
{
// Convert named file to PDF on stdout...
public static int topdf(String filename)// I - Name of file to convert
{
String              command;          // Command string
Process             process;          // Process for HTMLDOC
Runtime             runtime;          // Local runtime object
java.io.InputStream input;            // Output from HTMLDOC
byte                buffer [];        // Buffer for output data
int                 bytes;            // Number of bytes
// First tell the client that we will be sending PDF...
System.out.print("Content-type: application/pdf\n\n");
// Construct the command string
command = "htmldoc --quiet --jpeg --webpage -t pdf --left 36 " +
"--header .t. --footer .1. " + filename;
// Run the process and wait for it to complete...
runtime = Runtime.getRuntime();
try
{
// Create a new HTMLDOC process...
process = runtime.exec(command);
// Get stdout from the process and a buffer for the data...
input  = process.getInputStream();
buffer = new byte[8192];
// Read output from HTMLDOC until we have it all...
while ((bytes = input.read(buffer)) > 0)
System.out.write(buffer, 0, bytes);
// Return the exit status from HTMLDOC...
return (process.waitFor());
}
catch (Exception e)
{
// An error occurred - send it to stderr for the web server...
System.err.print(e.toString() + " caught while running:\n\n");
System.err.print("    " + command + "\n");
return (1);
}
}
// Main entry for htmldoc class
public static void main(String[] args)// I - Command-line args
{
String server_name,                 // SERVER_NAME env var
server_port,                 // SERVER_PORT env var
path_info,                   // PATH_INFO env var
query_string,                // QUERY_STRING env var
filename;                    // File to convert
if ((server_name = System.getProperty("SERVER_NAME")) != null &&
HTMLDOC 1.8.29 Software Users Manual
Calling HTMLDOC from Java
5-13
(server_port = System.getProperty("SERVER_PORT")) != null &&
(path_info = System.getProperty("PATH_INFO")) != null)
{
// Construct a URL for the resource specified...
filename = "http://" + server_name + ":" + server_port + path_info;
if ((query_string = System.getProperty("QUERY_STRING")) != null)
{
filename = filename + "?" + query_string;
}
}
else if (args.length == 1)
{
// Pull the filename from the command-line...
filename = args[0];
}
else
{
// Error - no args or env variables!
System.err.print("Usage: htmldoc.class filename\n");
return;
}
// Convert the file to PDF and send to the web client...
topdf(filename);
}
}
HTMLDOC 1.8.29 Software Users Manual
5-14
Calling HTMLDOC from Java
Documents you may be interested
Documents you may be interested