Aquaforest Searchlight 1.05 Reference Guide
Page 7
4.1.4
OCR Settings 
These tabs will allow the user set the OCR Engine to their taste. Aquaforest Searchlight comes bundled 
with two OCR Engines and each of these Engines has different settings.  
4.1.4.1
Aquaforest OCR Engine Settings 
This page allows the User to choose the settings suitable for the Aquaforest OCR engine.  
Add or remove pages from pdf - SDK Library service:C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Easy to Use C# Code to Extract PDF Pages, Copy Pages from One PDF File and Paste into Others
www.rasteredge.com
Add or remove pages from pdf - SDK Library service:VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Detailed VB.NET Guide for Extracting Pages from Microsoft PDF Doc
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 8
4.1.4.2
Extended OCR Engine Settings. 
This page allows the User to choose the settings suitable for the extended OCR engine. 
4.1.5
Scheduler 
The scheduler allows Aquaforest Searchlight to automate the monitoring and running of document 
libraries. There are three types of schedule types namely: 
Manual 
If this option is selected, Aquaforest Searchlight will start work on the document library 
whenever the user clicks on the start button. Note that Aquaforest Searchlight will process this 
document library only once per click. 
Once per day 
This setting allows the user to select any time during the day that Aquaforest Searchlight will 
start processing the document library. 
Continuous 
This allows a document library to be scheduled to run periodically between a start time and 
end time each day. The periods may be seconds, minutes or hours. For example, a document 
library may be specified to run every hour between 9:00 and 17:00.  
Run Once 
This setting allows the user to schedule the job to run once on a given date and time. 
SDK Library service:VB.NET PDF Password Library: add, remove, edit PDF file password
manipulations. Open password protected PDF. Add password to PDF. Change PDF original password. Remove password from PDF. Set PDF security level. VB
www.rasteredge.com
SDK Library service:VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
can simply delete a single page from a PDF document using VB.NET or remove any page Add necessary references: How to VB.NET: Delete Consecutive Pages from PDF.
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 9
4.2
Editing a Document Library 
Aquaforest Searchlight allows the user to edit the library locations, library settings and the OCR Settings 
at any time. These settings are accessible through the Library Tab. 
4.3
Deleting a Document Library 
Aquaforest Searchlight will allow a user to delete a document library at any time as long as it is not in a 
running state. 
4.4
Processing/Running a Document Library 
Aquaforest Searchlight processes a document library by first carrying out an audit to find out how 
many files need to be converted. After a successful audit, Aquaforest Searchlight can then start 
conversion. Starting a run can either be done by the user or the scheduler. If the Ad-Hoc option is 
selected during the scheduler set up, the user will have to manually click on the “Run” button on the 
dashboard. 
4.5
Review Audits & Conversions 
Since Aquaforest Searchlight processes document in an in place fashion, it is best to always know the 
exact state of the Document Library before conversion begins. This process also helps the user 
compare the state of the Document Library before and after conversion. 
The audit details are made available to user via the Run Details tab under the Library Tab. The audit 
details provide information such as: the list of all the files in the library, the number of searchable files in 
the library, the library size and much more. 
A user can also choose the number of past Audits that should still be kept in Aquaforest Searchlight, 
this option is provided in the Library Settings tab both in the Create New Library wizard and under the 
Library Drill-Down tab. 
SDK Library service:C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
Ability to remove a range of pages from PDF file. Add necessary references: Demo Code: How to Delete Consecutive Pages from PDF in C#.NET.
www.rasteredge.com
SDK Library service:C# PDF Password Library: add, remove, edit PDF file password in C#
String outputFilePath = Program.RootPath + "\\" Output.pdf"; // Remove the password. doc.Save(outputFilePath); C# Sample Code: Add Password to Plain PDF
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 10
4.6
Reports 
Aquaforest Searchlight provides reports that show statistics for particular document libraries, 
conversions as well as error and support reports. Reports can be generated in PDF or Excel formats. The 
following reports are included with Aquaforest Searchlight.  
Aquaforest Searchlight Summary Report – Shows a summary of all the document libraries and 
settings (email settings, license, etc.) currently configured as well as the support status 
Document Library Report – Shows all the statistics related to a particular document library 
including the number conversions performed, success rate, documents processed, etc. 
Audit Report – Shows the results of an audit 
Conversion Report – Shows the statistics of a particular conversion 
Conversion Error Report – Shows all the errors and exceptions that occurred during a particular 
conversion 
4.6.1
Error documents 
With Aquaforest Searchlight, error documents are easy to locate.  The Run Details tab provides filtering 
options which enables users to only display files using set criteria.   
4.6.2
Library Status 
This report can be accessed via the Library Status tab. 
SDK Library service:C# PDF Digital Signature Library: add, remove, update PDF digital
Image: Insert Image to PDF. Image: Remove Image from Redact Text Content. Redact Images. Redact Pages. Annotation & Highlight Text. Add Text. Add Text Box. Drawing
www.rasteredge.com
SDK Library service:C# PDF remove image library: remove, delete images from PDF in C#.
Image: Insert Image to PDF. Image: Remove Image from Redact Text Content. Redact Images. Redact Pages. Annotation & Highlight Text. Add Text. Add Text Box. Drawing
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 11
4.6.3
Generating Log files 
Log files can be generated using the “Generate Log” button which can be found on the Run Details 
tab under the Library Tab.  This enables users to capture the information generated by any given Run 
ID into a PDF file which can be sent to the support team. This provides a file by file assessment of a 
document library before and after a run is executed. It shows the files that have been converted 
successfully and those that have failed.  
This following page illustrates the use of combo boxes to filter the results being displayed on the User 
Interface. 
SDK Library service:C# PDF bookmark Library: add, remove, update PDF bookmarks in C#.
Help to add or insert bookmark and outline into PDF file in .NET framework. Ability to remove and delete bookmark and outline from PDF document.
www.rasteredge.com
SDK Library service:C# PDF metadata Library: add, remove, update PDF metadata in C#.
Add metadata to PDF document in C# .NET framework program. Remove and delete metadata from PDF file. Also a PDF metadata extraction control.
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 12
5
Microsoft SharePoint Document Stores 
Aquaforest  Searchlight  can be  configured  to monitor  multiple  SharePoint libraries.  Below  are  some 
concepts that should be taken into consideration during configuration.  
5.1
Versioning 
Since  Aquaforest  Searchlight  uses  in-place  processing,  the  source  document  is  replaced  by  the 
resulting PDF file. However, if versioning is turned on, the resulting PDF file will be created as another 
version of the input file in SharePoint. If versioning is turned off then the resulting PDF file replaces the 
source file and archiving is automatically activated.  
5.2
Archiving 
To avoid making inadvertent changes to the source document, Aquaforest Searchlight will ensure the 
archiving  of  source  documents  if versioning  is  turned  off  in  SharePoint.  Archiving  is  the  process  of 
copying over the source documents to an archive location specified by the user before performing 
any sort of processing on them. 
5.3
Metadata 
Metadata  will  be  used  to  store  the  “Searchability”  status  of  documents.  Checks  are  made  to 
determine if a document has been modified since it was last OCRed and therefore may require re-
processing.  
5.4
Security 
The user will have to provide the security credentials of the SharePoint library they wish to monitor 
during configuration. 
SDK Library service:VB.NET PDF remove image library: remove, delete images from PDF in
Image: Insert Image to PDF. Image: Remove Image from Redact Text Content. Redact Images. Redact Pages. Annotation & Highlight Text. Add Text. Add Text Box. Drawing
www.rasteredge.com
SDK Library service:VB.NET PDF metadata library: add, remove, update PDF metadata in
Add permanent metadata to PDF document in VB .NET framework program. Remove and delete metadata content from PDF file in Visual Basic .NET application.
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 13
6
File System Document Stores 
PDF Search light can be configured to monitor folders on the windows file system. Below are a few 
issues that need to be considered when using the Windows File System. 
6.1
File Name Length 
The windows operating system has a limit to file name length it can process. Aquaforest Searchlight 
always runs an audit before any conversion is carried out. Before the start of an audit, if any files with 
long names are found it will be reported to the user and the user can either shorten the file names or 
move the files. 
6.2
File Access Permissions 
If there are any secured locations that are to be monitored, you will have to configure the Aquaforest 
Searchlight Service with the security credentials of a user that has permissions to access that particular 
location. 
6.3
Archiving 
To avoid any loss of document, Aquaforest Searchlight is created to enforce archiving of input 
document. This is the process of copying over input documents to an archive location specified by the 
user before processing them. 
6.4
Metadata 
Metadata will be held in the Aquaforest Searchlight database to store details of the searchability 
status of a document. Checks are made to determine if a document has been modified since it was 
last OCRed and therefore may require re-processing. 
Aquaforest Searchlight 1.05 Reference Guide
Page 14
7
Aquaforest Searchlight Modules 
7.1
Multi-Core Module (Included with the 
standard product) 
This module is used to take full advantage of the number 
processors available on a computer.  
The current release allows users to process up to 10 files in 
parallel thereby reducing the time needed to execute a 
job.  
The chart gives some indication of the improvement in 
throughput that can be expected when using the multi-
core module. 
7.2
Extended (IRIS) OCR Module (Included with the standard product) 
OCR engines are the components that perform the task of text recognition on image files and 
extraction. Aquaforest Searchlight ships two OCR Engines namely the Aquaforest OCR Engine and the 
Extended (IRIS) OCR Engine. Below is an explanation of the OCR Engines. 
The Aquaforest OCR Engine is also included as a standard part of the product and can be used to 
convert Image PDFs and TIFFs to searchable PDF documents. This engine has support of about 24 
European Languages, but you can only OCR using one language at a time.  
The Extended Engine has the following benefits over and above the standard Aquaforest OCR engine: 
IRIS OCR Engine providing enhanced recognition 
New PDF Rasterizer component 
DOCX Output option 
Improved RTF Output 
CSV and Spreadsheet ML output options 
Supports over 100 Languages. 
Optional Asian Language Support 
Support for multiple languages within a single document from the same alphabet - e.g. French+ 
German + Italian 
See section 8.3.5 for a detailed description of all the available Extended OCR settings. 
7.3
Extended OCR Advanced Compression (Extra Cost Option) 
Aquaforest Searchlight uses IRIS’s New Intelligent High-Quality Compression (IHQC). IHQC offers the 
most impressive PDF colour compression without compromising visual quality, text resolution and 
legibility of your documents. The IHQC module will be available if you purchase the IHQC license. See 
section 8.3.6 for a detailed explanation of the settings available for Advanced Compression. 
Aquaforest Searchlight 1.05 Reference Guide
Page 15
7.4
Metadata Extraction Module (Extra Cost Option) 
Pingar Entity Extractor for SharePoint automatically enters keywords from the content of structured 
documents.  With Pingar Metadata Extraction for SharePoint, you can automatically identify the 
following business entities within documents: 
Relevant Keywords  
Taxonomy Terms 
People 
Organizations 
Locations 
Addresses  
Phone Numbers 
Email Addresses 
URLs 
Dates 
Times 
Ages 
Money Amounts 
Credit Card Numbers 
Bank Account Information 
For more information please contact support@aquaforest.com  
7.5
Advanced iFilter Module (Extra Cost Option) 
The freely available Adobe iFilter indexes PDF standard text well, but a more advanced solution is 
required for additional items such as metadata including titles, subjects, authors, keywords, PDF 
portfolios, annotations, text and data from forms, bookmarks, attachments, create time/date, number 
of page.   Using such an iFilter can result in more precise search results. 
For more information please contact support@aquaforest.com  
Aquaforest Searchlight 1.05 Reference Guide
Page 16
8
Aquaforest Searchlight User Interface 
8.1
Getting Started 
When Aquaforest Searchlight is launched for the very first time, a getting started page is displayed to 
introduce  the  user  to  the  different  features  of  Aquaforest  Searchlight  and  provide  assistance  in 
creating the first document library.  
Documents you may be interested
Documents you may be interested