ITPilot 5.5 
User Guide 
Web Administration Tool 
15 
The Denodo Browser embeds a JavaScript engine, which allows it to perform complex 
navigations in several web sources. When deciding what type of browsing tool to use 
(a MSIE browser or a Denodo browser) to extract information from a web source, the 
following factors must be taken into account: 
1.
Efficiency. The Denodo Browser is more efficient than the MSIE browsers, 
since it is lighter. This implies an increase in the response time when accessing 
sources, and a decrease in the CPU load of the machine which houses the 
Browser Pool; this feature is very important when several parallel executions 
are required. 
2.
The  Denodo  Browser  cannot  execute  some  of  the  NSEQL  navigation 
commands (see [NSEQL]).  
3.
The Denodo Browser does not interpret code written in VBScript.  
4.
In some pages, ITPilot’s JavaScript engine may process JavaScript code in a 
different way than Internet Explorer do. This is because these browsers’ 
interpreters might be laxer regarding the syntax used by the web pages. In 
these cases, the desired behavior will be that of Internet Explorer, since very 
probably, the target pages have been designed to work correctly with this 
browser. 
The browser type to use for each browsing sequence is defined at wrapper generation 
time: it can be set to a specific browser type or it can be set to use whatever type of 
browser is configured as the default in the Browser Pool Server (please see the 
Denodo ITPilot Generation Environment Guide [GENER] for more information).  
The MSIE browsers in the Browser Pool Server will use the configuration established 
for Microsoft Internet Explorer and in the system in which the server is executed.  
It is also necessary to consider the security options and cookies, as the pool browsers 
will act according to said configuration. 
In the administration tool, the configuration options for Browser Pool Servers are split 
across three configuration sections. On each section, configuration options are 
grouped in a set of forms. To change a parameter on any of these groups, click the 
edit button ( ) corresponding to that group to make the form enter in edition mode.  
The "Global configuration parameters" section is for parameters like the default 
browser type which will  be used by  the  server, port assignments, and HTML 
conversion options.  
The two remaining sections are for configuring each supported browser type and its 
associated pool. They have similar parameters, dealing with pool sizes and browser 
reutilization policies, and also with timeouts, download controls, and proxies. Denodo 
browsers lack some of the options that can be configured for MSIE. 
5.2.1
Global Configuration Parameters 
5.2.1.1 
Default browser configuration 
This parameter determines the browser type to be used by default in the pool server 
(it will be used by the wrappers configured to use the ‘default’ browser type, instead 
of some specific browser type chosen at wrapper-creation time). The available 
options are: 
MSIE Browser: Microsoft Internet Explorer browser. 
Denodo Browser: the Denodo GUI-less browser. 
Pdf form save in reader - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
filling out pdf forms with reader; how to fill out pdf forms in reader
Pdf form save in reader - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
pdf form save with reader; how to save pdf form data in reader
ITPilot 5.5 
User Guide 
Web Administration Tool 
16 
Figure 10 
Browser type configuration 
5.2.1.2 
Server connectivity 
The parameters of this group are: 
Application Port: port in which the Browser Pool listens to requests. 
Shutdown Port: port in which the server listens the Shutdown signal in order 
to be stopped. 
Auxiliary Port: the auxiliary port is used by the pool for communications with 
its clients.  
Figure  11  shows  the  administration  tool  page  where  to  configure  those 
parameters. 
Figure 11 
Server connectivity configuration 
5.2.1.3 
PDF conversion configuration 
The parameters of this group allow configuring the conversion tools from PDF to HTML 
so that the content of those resources can be extracted by ITPilot: 
PDF To HTML converter: default conversion tool type used to transform the 
PDF resource into HTML 
o
Acrobat HTML: uses the HTML conversion tool from the Adobe Acrobat 
Professional software (it is required that this product be installed). 
o
Acrobat Text: uses the plain text conversion tool from the Adobe 
Acrobat Professional software, from which ITPilot generates an HTML 
file (it is required that this product is installed). 
o
PDFBox 0.7.3 and PDFBox 1.X: use the PDFBox library [PDFBOX] 
C# PDF: PDF Document Viewer & Reader SDK for Windows Forms
SaveFile(String filePath): Save PDF document file to a specified path form (Here, we take a blank form as an open a file dialog and load your PDF document in
pdf data extractor; extract data from pdf
VB.NET Image: How to Save Image & Print Image Using VB.NET
printing multi-page document files, like PDF and Word is used to illustrate how to save a sample RE__Test Public Partial Class Form1 Inherits Form Public Sub New
export excel to pdf form; extract data from pdf form
ITPilot 5.5 
User Guide 
Web Administration Tool 
17 
(bundled with the Denodo Platform) to generate the HTML page. 
Version 1.X of PDFBox (currently PDFBox 1.6) is available since ITPilot 
4.7; version 0.7.3 was included in previous releases of ITPilot and is 
still available.  
Conversion Server port:  port where  the  PDF Conversion Server  will be 
listening from. 
Acrobat Prof. Plugins Directory: path where the Acrobat Professional plugins 
reside. 
5.2.1.4 
Word / Excel conversion configuration  
The parameters of this group allow configuring the conversion tools from Microsoft 
Word/Excel to HTML so that the content of those resources can be extracted by 
ITPilot: 
Open Office Directory: path to the OpenOffice installation. Open Office is used 
for the conversions from Microsoft Word and Microsoft Excel to HTML. 
5.2.1.5 
Conversion configuration 
The parameters of this group allow setting conversion options that apply to all 
converters: 
Remove the temporal files generated by the PDF, Word and Excel converters: 
if selected, the temporal html files generated in document conversions are 
deleted when the wrapper ends its execution. If it is not selected, the files will 
remain in the temporal directory.  
5.2.2
MSIE and Denodo browser configuration 
The parameters of the following groups can be configured for the two browser types 
(sections “MSIE configuration” and “Denodo browser configuration”). 
5.2.2.1 
Browser configuration 
Max Download: Indicates the maximum time a browser will wait to download 
a page (in milliseconds).   
Object Timeout: Maximum time (in milliseconds) that a browser can be used 
outside the pool to deal with a wrapper request. When this time lapses, the 
browser is destroyed. If the value of this parameter is less than 0, the browser 
can remain outside the pool indefinitely. 
Initial Port: Each browser of the pool listens to requests in a port. The value 
of this parameter determines the port number to be used as the first one to 
assign port numbers to the browsers. From this number, consecutive port 
numbers will be used in ascending order. This property is available only for 
Microsoft Internet Explorer. 
Graphical Interface: Indicates whether or not the pool browsers will display a 
graphical interface. To optimize system efficiency, applications in production 
do not normally display browser graphical interfaces. However, it may be 
useful to turn the interface on for debugging purposes. This parameter can 
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
Merge Microsoft Office Word, Excel and PowerPoint data to PDF form. Append one PDF file to the end of another and save to a single PDF file.
how to fill pdf form in reader; how to make pdf editable form reader
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
this RasterEdge XDoc.PDF SDK, you can simply delete a single page from a PDF document using VB.NET or remove any page from a PDF document and save to local
how to type into a pdf form in reader; extract data from pdf file to excel
ITPilot 5.5 
User Guide 
Web Administration Tool 
18 
only be configured for the MSIE browser. 
Silent: with this option activated, none of the dialogs that the browser 
normally opens is displayed  (this  includes JavaScript  dialogs,  certificate 
warnings, etc.). This parameter can only be configured for the MSIE browser. 
Figure  12  shows  the  administration  tool  page  where  to  configure  these 
parameters for the MSIE browser. 
Figure 12 
Browser configuration 
5.2.2.2 
Download controls 
This group of parameters allows the type of contents that should be downloaded 
or executed by the pool browsers to be specified. The content types whose 
download  or  execution  can be configured  are: images, videos,  background 
sounds, script programs, Java applets and ActiveX controls.  If Denodo Browser 
is  used,  only  scripts  programs  can  be  configured.  Figure  13  shows  the 
administration tool page where to configure these parameters for the MSIE 
browser. 
Figure 13 
Download controls 
5.2.2.3 
Cache controls 
This group of parameters is for specifying whether or not the pool browsers should 
use the local cache and/or the proxy cache. Denodo Browser do not allow the proxy 
cache option to be configured. Denodo Browser can configure an additional parameter 
for the maximum number of JavaScript files that can store in its JavaScript cache 
(“Maximum number of cached JavaScript files”). Cached scripts will be executed 
faster  than  the  ones  that  have  to  be  re-downloaded.  Figure  14  shows  the 
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
to extract single or multiple pages from adobe PDF file and save into a The portable document format, known as PDF document, is a widely-used form of file
extracting data from pdf forms to excel; how to fill out a pdf form with reader
C# Image: Save or Print Document and Image in Web Viewer
or image, you can easily save the changes to DLL Library, including documents TIFF, PDF, Excel, Word string fileName = Request.Form["saveFileName"]; string fid
how to extract data from pdf to excel; using pdf forms to collect data
ITPilot 5.5 
User Guide 
Web Administration Tool 
19 
administration tool page where to configure these parameters for the MSIE browser. 
Figure 14 
Cache controls 
5.2.2.4 
Proxy with authentication  
If the Internet is accessed through a proxy with authentication, the following 
parameters (for the two browser types) must be configured: 
Proxy login: user login in the proxy. If Denodo browser is used, this parameter 
also configure the proxy host and port to be used, with the following syntax: 
user@host:port
Proxy password: user password in the proxy. 
Proxy domain (Windows 2000): Windows domain.  
Figure  15  shows  the  administration  tool  page  where  to  configure  these 
parameters for the MSIE browser. 
Figure 15 
Proxy with Authentication 
NOTE: the proxy server settings (host and port) must be configured in the settings 
dialog of the Microsoft Internet Explorer (not from the Denodo options) if this browser 
is used. To access it, open the Connections tab of the Tools > Internet Options dialog 
of Microsoft Internet Explorer. You can configure the proxy using the LAN settings 
button. If the Internet Explorer browser is not correctly configured to browse through 
the proxy server, the ITPilot server will ignore these authentication parameters. 
NOTE: see the documentation of the NSEQL command SetProxyAuthInfo in the 
NSEQL Manual [NSEQL] for more information about configuring Internet access 
through a proxy in ITPilot. 
C# PDF Convert to Tiff SDK: Convert PDF to tiff images in C#.net
Description: Convert to DOCX/TIFF with specified zoom value and save it into stream. Parameters: zoomValue, The magnification of the original PDF page size.
pdf form data extraction; how to save a pdf form in reader
C# Create PDF from Tiff Library to convert tif images to PDF in C#
Description: Convert to PDF and save it on the disk. Parameters: Name, Description, Valid Value. Description: Convert to PDF and save it into stream. Parameters:
extracting data from pdf files; how to save fillable pdf form in reader
ITPilot 5.5 
User Guide 
Web Administration Tool 
20 
5.2.2.5 
Pool size and policy for reusing browsers 
Max pool size: maximum number of browsers in the pool. 
Min pool size: minimum number of browsers. The system will not reuse 
browsers already existing in the pool unless the current number is equal to or 
greater than the value of this parameter. 
Reusable Browsers: indicates if the pool browsers can be reused to deal with 
more than one request. Enabling browser reusability increases the efficiency 
of most applications; however, it may not be suitable in some cases, where 
dealing with a previous request changes the browser response to subsequent 
requests (for example, through the use of cookies). 
Max browser TTL: Maximum Time to Live of a persistent browser. If a 
persistent browser is active more than the specified time, it will be removed 
and a new one will be created with the same page loaded as the former 
browser. This is useful because, due to known problems in some versions of 
Microsoft Internet Explorer, when using this type of browser, performance 
may degrade if the browser has been open for too long. This option only 
applies to persistent browsers, not regular ones (see [GENER] for detail about 
persistent browsers). 
Figure  16  shows  the  administration  tool  page  where  to  configure  these 
parameters for the MSIE browser. 
Figure 16 
Pool size and reutilization policy 
5.3
CONFIGURATION OF THE WRAPPER SERVER  
The configuration options for Wrapper Servers are split across four sections: "List of 
wrappers", "Server configuration", "Embedded Denodo browser configuration" and 
"Extensions". 
5.3.1
List of Wrappers 
From this section, the user can deploy new wrappers in a Wrapper Server, and also 
configure and execute those wrappers which are already deployed. Figure 17 shows 
an instance of the web administration tool in which the user is connected to one of 
the available Wrapper Servers, and the "List of wrappers" section can be seen. (See 
section 5 for information about how to connect to a server). 
C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
key. Quick to remove watermark and save PDF text, image, table, hyperlink and bookmark to Word without losing format. Powerful components
java read pdf form fields; extract data from pdf file
C# Create PDF from PowerPoint Library to convert pptx, ppt to PDF
Description: Convert to PDF/TIFF and save it on the disk. Parameters: Description: Convert to PDF/TIFF and save it into stream. Parameters:
exporting pdf data to excel; make pdf form editable in reader
ITPilot 5.5 
User Guide 
Web Administration Tool 
21 
Figure 17 
List of Wrappers 
Wrapper Servers can contain several databases, where each database has its own 
independent list of wrappers. If only Denodo ITPilot has been installed, and no Virtual 
DataPort, only one database will be available ("itpilot"). If there is more than one 
database defined in the server, the user can switch between them by using the 
"Select database" drop-down list. The list of wrappers will update accordingly. 
5.3.1.1 
Loading, exporting and deleting wrappers 
Usually, wrappers are deployed in the Wrapper Server directly from the wrapper 
generation tool (see [GENER]). However, VQL files containing the definition of a 
wrapper  can  also be loaded manually  from  the administration tool  (for  more 
information about VQL, please read [VQL]). To do so, click on the “Load wrapper” 
button, then select the file to load by clicking the “Choose File” button and graphically 
selecting the file. Once the path is ready, click on the “Upload” button. The wrapper 
will be loaded into the currently selected database, and the wrapper list for that 
database will be updated in the administration tool. 
Wrappers deployed in the Wrapper Server can be exported as VQL files. To do so, 
the user must select the wrappers he wants to export by marking the checkboxes to 
the left of their respective entries in the wrapper list, and then click on the button 
. He will then be presented with a window, where he can choose to export some 
elements whose presence in the generated VQL is optional: the scanners, extension 
jar files, and custom components used by the wrapper or wrappers being exported. 
If those dependencies are not exported along with the wrappers themselves, any 
Wrapper Server which imports the generated VQL file must already have them 
installed, in order for the wrappers to load correctly. 
To delete a wrapper deployed in the Wrapper Server, the user must mark its 
associated checkbox in the wrapper list and then click on the button  . Multiple 
wrappers can be deleted simultaneously in this manner.   
Marking the topmost checkbox, the one with the label “All/None”, will select all the 
ITPilot 5.5 
User Guide 
Web Administration Tool 
22 
wrappers currently visible in the list. 
5.3.1.2 
Wrapper options 
Wrappers in a Wrapper Server can be put under automatic verification. This means 
the Verification Server will monitor the execution of those wrappers, and if it detects 
anomalies in the returned results, it will send an e-mail to a configured address, 
warning that the source pages may have changed and the wrapper may need to be 
modified accordingly.   
Wrappers under automatic verification display “true” in the Verification column, for 
the rest of wrappers “false” will be displayed. To enable or disable automatic 
verification for one or more wrappers, the user have to select the wrappers, marking 
the checkboxes to the left of their respective entries in the wrapper list, and then 
click on the button 
. A popup menu will appear, showing the options "Enable 
verification" and “Disable verification”.  
Note that enabling automatic verification is not enough by itself; the user should 
define rules in the Verification Server specifying what counts as an "anomalous result" 
that triggers the notification (see section 5.4). 
In order to increase the efficiency of the Denodo Browser, components that execute 
sequences using this browser can be configured, at generation time, to execute a 
test of the sequence to collect and store optimization information. During the test 
execution the browser detects what elements of the accessed pages are needed to 
execute the sequence and stores information to identify them. Then, using that 
information, subsequent executions of the sequence can only load those elements. 
Wrappers using the Denodo Browser optimization information collected at generation 
time display “true” in the Denodo browser optimization column. To enable or the use 
of the optimization information for one or more wrappers, the user have to select the 
wrappers, marking the checkboxes to the left of their respective entries in the 
wrapper list, and then click on the button 
. A popup menu will appear, showing 
the options "Enable optimization" and “Disable optimization”.  
Note that enabling Denodo Browser optimization is not enough by itself; the user 
should configure the sequence components to collect the automatic optimization 
information during the generation of the wrapper (see [GENER]). 
The information collection process needs to be rerun when the sequence is changed. 
In some cases, it can also need to be rerun when the pages of the source changes 
although the navigation sequence is still valid. If the collection process is not rerun 
in this scenario, the execution of the sequence using the optimization information will 
fail. If you do not want to regenerate the optimization information and redeploy the 
wrapper, then you need to configure the wrapper to not use the Denodo Browser 
optimization, as explained above. 
5.3.1.3 
Wrapper execution 
The administration tool allows queries to be made against wrappers deployed on a 
Wrapper Server. 
Clicking on the Execution   icon for a wrapper in the wrapper list will lead to the 
wrapper execution page. 
ITPilot 5.5 
User Guide 
Web Administration Tool 
23 
Figure 18 displays the execution page for a wrapper. The checkboxes under "Output 
parameters" allow selecting which output fields of the wrapper are going to be 
displayed in the result table. Input parameters for the wrapper are supplied using the 
text fields under "Input parameters". The “Set as Null” checkbox allows the user to 
not provide any value for an optional input parameter (i.e. setting it as null). This 
checkbox is disabled for mandatory input parameters. The types of both the input 
parameters and output fields are shown between parenthesis. 
Figure 18 
Wrapper Execution Page 
After filling the input values and selecting the output fields, by clicking the “Acept” 
button the administration tool will start the execution of the query. To achieve this, 
it will call the Wrapper Server to invoke the query on the selected wrapper, which 
will be in turn communicated to the appropriate data source. The results, properly 
structured, will be shown in the execution window result list in an asynchronous way: 
the individual rows will appear in the results table as soon as they are available. 
Before pressing the “Acept” button, the results of the execution can be configured to 
be stored in a CSV (Comma-Separated Value)-type file, marking the checkbox 
“Export results to CSV file”. The “Include headers” checkbox allows including the 
names of the output fields as headers in the CSV file. The column separator is also 
configurable. When the export checkbox is marked, clicking on the “Acept” button 
will show a standard download dialog for choosing the desired target folder/file. The 
file will be created as the execution starts, and new results will be written as they 
ITPilot 5.5 
User Guide 
Web Administration Tool 
24 
arrive. 
5.3.2
Server Configuration 
This section allows the user to manage several server-wide configuration parameters: 
Application Port: port through which the Wrapper Server listens and waits for 
requests. 
Shutdown Port: port through which the server listens and waits for the 
Shutdown signal. 
Auxiliary Port: used for communications between the Browser Pool and the 
Wrapper Server. 
Browser pool, Browser pool host and Browser pool port: the Wrapper Server 
requests browser instances to the Browser Pool Server when a wrapper that 
performs web browsing is executed. The administration tool allows configuring 
what Browser Pool Server is going to receive the Wrapper Server requests, by 
using the selector “Browser” (see Figure 19). This selector displays all the 
Browser Pool Servers known to the web administration tool plus the options 
“none” and “custom”. Choose “none” in the selector if no browser pool will be 
used and “custom” to enter custom host and port values. 
Temp directory: allows specifying a directory to store temporal data like the 
HTML documents generated by PDF or Word/Excel converters. Also, the Save 
File component saves files to this directory if no particular directory is specified 
in the component configuration. 
Figure 19 
Wrapper Server configuration 
5.3.3
Embedded Denodo Browser Configuration 
The Denodo Browser can be executed from the ITPilot Wrapper Server without having 
to start a Browser Pool Server in a separate process, since the Wrapper Server 
internally manages a Denodo Browser pool itself. At wrapper generation time, a user 
Documents you may be interested
Documents you may be interested