Aquaforest Searchlight 1.05 Reference Guide
Page 17
8.2
Aquaforest Searchlight Dashboard 
The  dashboard  gives  a  summary  of  the  status  of  any  document  libraries  currently  processing  or 
scheduled to process. A document library’s previous conversions can be reviewed by selecting it from 
the list. 
8.2.1
Dashboard Fields 
Fields 
Description 
Name 
Name of the document library 
Library Type 
The type of the document library: 
SharePoint 
File System 
Last Run 
Time and date of the last run 
Schedule 
Manual or Automatic 
% Searchable 
The percentage  of  documents  that  is  currently  searchable in 
the document library 
Status 
Current status of the document library eg: 
Running 
Completed 
Error 
Aborted 
(Icons) 
Abort, Pause, Start 
Add or remove pages from pdf - software SDK cloud:C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Easy to Use C# Code to Extract PDF Pages, Copy Pages from One PDF File and Paste into Others
www.rasteredge.com
Add or remove pages from pdf - software SDK cloud:VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Detailed VB.NET Guide for Extracting Pages from Microsoft PDF Doc
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 18
8.3
Library 
8.3.1
Library Status 
This  screen  provides  a  detailed  breakdown  of  all  the  document  libraries  currently  configured  in 
Aquaforest  Searchlight.  Each  document  library  will  have  detailed  information  about  each  of  the 
documents it contains and details about each document. 
software SDK cloud:VB.NET PDF Password Library: add, remove, edit PDF file password
manipulations. Open password protected PDF. Add password to PDF. Change PDF original password. Remove password from PDF. Set PDF security level. VB
www.rasteredge.com
software SDK cloud:VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
can simply delete a single page from a PDF document using VB.NET or remove any page Add necessary references: How to VB.NET: Delete Consecutive Pages from PDF.
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 19
8.3.2
Library Settings 
Options 
Description 
Document Library Name 
Name/Title/Description of the document library 
Document Library Type 
The type of the document library: 
SharePoint 
File System 
Locations 
One or more document locations to be processed. 
Choose Library Icon  
This is a button that allows users to check the file system for a library 
icon. 
Processing Mode 
Audit Only  – analyse the document library to find out the 
documents  that  need  to  be  converted  without  actually 
converting them 
Audit & OCR – perform audit on the document library and 
nd 
do  convert  the  documents  that  have  been  identified  as 
candidates for processing 
Cores 
This  determines  the  maximum  number  of  CPU  cores  that  will  be 
used when running the job. 
SharePoint Versioning 
This setting can be used to automatically turn versioning on. 
Publish Major Version  
Publish major version after OCR 
SharePoint Exclude Locations  A set of URLs that will not be included in processing. 
software SDK cloud:C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
Ability to remove a range of pages from PDF file. Add necessary references: Demo Code: How to Delete Consecutive Pages from PDF in C#.NET.
www.rasteredge.com
software SDK cloud:C# PDF Password Library: add, remove, edit PDF file password in C#
String outputFilePath = Program.RootPath + "\\" Output.pdf"; // Remove the password. doc.Save(outputFilePath); C# Sample Code: Add Password to Plain PDF
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 20
Check-in Comment 
The  check-in  comment  applied  to  the  updated  SharePoint  file 
version. 
8.3.3
Document Settings 
Options 
Description 
Document Selection 
Rule 
The criteria to use to identify candidate documents for processing when 
auditing 
Criteria 
Description 
Process PDF 
Whether or not to process PDF documents 
Process TIFF 
Whether or not to process TIFF files 
Delete Original 
TIFF 
Whether  or  not  to  delete  the  original  TIFF  files 
after they  have been converted to  searchable 
PDFs 
Image Only 
Whether or not to process Image-only PDFs.  
An Image-only PDF is a PDF that originated from 
a scanned document or other digital image.  An 
Image-only PDF does not contain any text, just 
pictures. 
Hidden Text 
Whether  or  not  process  PDF  documents  with 
hidden text in them 
software SDK cloud:C# PDF Digital Signature Library: add, remove, update PDF digital
Image: Insert Image to PDF. Image: Remove Image from Redact Text Content. Redact Images. Redact Pages. Annotation & Highlight Text. Add Text. Add Text Box. Drawing
www.rasteredge.com
software SDK cloud:C# PDF remove image library: remove, delete images from PDF in C#.
Image: Insert Image to PDF. Image: Remove Image from Redact Text Content. Redact Images. Redact Pages. Annotation & Highlight Text. Add Text. Add Text Box. Drawing
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 21
A Hidden Text PDF has pages that are Image-
only with hidden (type 3) text.  Such files are 
typically the output of running an OCR PDF 
process on an Image Only PDF. 
Partially 
Searchable 
Whether  or not to  process PDF documents that 
are  partially  searchable,  i.e.,  some  pages  are 
searchable and some are image-only 
Fully Searchable  Whether  or not to  process PDF documents that 
are fully searchable  
Date Created  
Process  documents  that  have  been  created 
between a defined time period 
Date Modified 
Process  documents  that  have  been  modified 
between a defined time period 
Retry 
Whether  or  not  to  re-process  documents  that 
have previously failed to convert 
Limit 
Limit  the  number  of  documents  to  process  per 
run 
Archive Folder 
The folder location where original documents will be archived 
Archive Template 
The template to use to rename the archived file name. The default is: 
%FILENAME%%TIMESTAMP%.%EXT% 
Archive  source  Tiffs  to 
Archive folder 
If  enabled,  this  will  Archive  your  source  Tiffs  to  the  Archive  folder 
specified above. 
Archive  source  PDFs  to 
Archive folder 
If enabled, this will Archive the source PDFs to the Archive folder 
(even when versioning is enabled within SharePoint). 
Temp Folder 
The location to use as the working folder. The default is: 
%TEMP%/pdfsearchlight 
Output File Name 
The template to use to rename the original file name: The default is: 
%FILENAME.pdf 
Continue on Error 
Whether or not to continue if an error occurs with a file in the document 
library 
Retain Creation Date 
Retain the creation date of the source document (SharePoint creation 
date, FileSystem creation date and created date in PDF properties) 
Retain Modified Date 
Retain the modified date of the source document (SharePoint modified 
date, FileSystem modified date and modified date in PDF properties) 
Retain Created By 
Retain the created user of the source document (SharePoint created by, 
FileSystem owner and author in PDF properties) 
Retain Modified By 
Retain the created  user of the  source  document  (SharePoint modified 
by) 
software SDK cloud:C# PDF bookmark Library: add, remove, update PDF bookmarks in C#.
Help to add or insert bookmark and outline into PDF file in .NET framework. Ability to remove and delete bookmark and outline from PDF document.
www.rasteredge.com
software SDK cloud:C# PDF metadata Library: add, remove, update PDF metadata in C#.
Add metadata to PDF document in C# .NET framework program. Remove and delete metadata from PDF file. Also a PDF metadata extraction control.
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 22
8.3.4
Aquaforest OCR Settings 
Options 
Description 
Deskew  
Straighten the image 
Auto-Rotate 
Automatically rotate pages so that text flows left to right 
Despeckle 
Remove specks below the specified pixel size from the image 
Line Removal 
This  removes  lines  and  boxes  during  OCR  processing  to  improve 
recognition – particularly in cases where characters “touch” lines 
Advanced Flags 
Command line flags to be passed through to the underlying executable 
Box/Graphics 
Processing 
By default, if an area of the document is identified as a graphic area 
then  no  OCR  processing  is  run  on  that  area.  However,  certain 
documents may include areas or boxes that are identified as “graphic” 
or “picture” areas but that actually do contain useful text. 
To ensure  that  the OCR  engine can  be forced to  process such  areas 
there are two options : 
“Treat  all  Graphics  Areas  as  Text”.  This  option  will  ensure  the  entire 
document is processed as text. 
“Remove  Box  Lines  in  OCR  Processing”.  This  option  is  ideal  for  forms 
software SDK cloud:VB.NET PDF remove image library: remove, delete images from PDF in
Image: Insert Image to PDF. Image: Remove Image from Redact Text Content. Redact Images. Redact Pages. Annotation & Highlight Text. Add Text. Add Text Box. Drawing
www.rasteredge.com
software SDK cloud:VB.NET PDF metadata library: add, remove, update PDF metadata in
Add permanent metadata to PDF document in VB .NET framework program. Remove and delete metadata content from PDF file in Visual Basic .NET application.
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 23
where sometimes boxes around text can cause an area to be identified 
as graphics. This option removes boxes from the temporary copy of the 
imaged used by the OCR  engine. It does  not remove boxes  from the 
final image. Technically, this option removes connected elements with a 
minimum area (by default 100 pixels). 
JBIG2 Compression 
This option will compress bitonal images in generated PDFs using JBIG2 
compression rather than the default Group 4 compression scheme. This 
will result in smaller PDF file sizes, at a cost of increasing processing time. 
PDF/A1-b  
Select Yes if the result file must be PDF/A1-b Compliant 
MRC 
This enables Mixed Raster Compression which can dramatically reduce 
the output size of PDFs comprising of colour scans. 
DPI  
Specify the DPI of the TIFF that will be used when converting TIFF to PDF. 
Set to Auto by default, alternatively can be set to 300, 200 or 150 to force 
a specific resolution. 
Remove Hidden Text 
Remove  existing  hidden  text  (text  that  was  added  as  a  result  of  a 
previous OCR) from the PDF file so that the resulting searchable PDF file 
does not have two layers of the same text. 
Retain Metadata 
Copy metadata from the source PDF to the Searchable result PDF 
Retain Bookmarks 
Copy bookmarks from the source PDF to the Searchable result PDF 
Aquaforest Searchlight 1.05 Reference Guide
Page 24
8.3.5
Extended OCR Settings 
Aquaforest Searchlight 1.05 Reference Guide
Page 25
Options 
Description 
Autorotate 
Detect page orientation and correct if required 
Deskew 
Rotates the image to correct its skew angle. 
RemoveDarkBorders 
Removes  the  dark  surrounding  from  bitonal,  grayscale  or 
color images. The dark surrounding of the image is whitened.  
Note: The dark border should be touching the edge of the 
image/page for this to work. 
Remove Hidden Text 
Remove existing hidden text (text that was added as a result 
of  a  previous  OCR)  from  the  PDF  file  so  that  the  resulting 
searchable PDF file  does  not  have two layers of the same 
text. 
Remove Visible Text 
Avoid OCRing visible text (text as a result of conversion from 
an electronic document such as Word to PDF) 
RemoveBlankPage 
Set  this  to  true  to  remove  blank  pages  from  Tiff  or  PDF 
documents.  A  value  needs  to  be  set  for  sensitivity  (see 
below). 
Sensitivity 
The sensitivity, from 1 to 100. With a high sensitivity, less blank 
pages are detected. 
Despeckle 
Removes all the groups of connected pixels with a number 
of pixels below the parameter.  Suggested range: 1-20. 
Workdepth 
This parameter (0 – 255) defines how deeply the OCR engine 
will analyze a page with 255 being the deepest.  For poorer 
quality documents, higher values can give better recognition 
results.  
JPEGQuality 
This parameter (0 – 255) determines the compression/quality 
of color JPEG images in generated PDFs.  0 gives the smallest 
file size whilst 255 gives the best quality.  The default value is 
128. 
PDFVersion 
This determines the PDF version of the generated PDF : 
1.4 
1.5 
1.6 
1.7 
PDFA1B (PDF/A-1b) 
Language 
Determines the language to be used for OCR.   
English(Default) 
Faroese  
German           
Friulian  
French          
Greenlandic  
Spanish          
Haitian_Creole  
Italian          
Rhaeto_Roman  
British          
Sardinian  
Swedish         
Kurdish  
Danish          
Cebuano  
Norwegian        
Bemba  
Dutch            
Chamorro  
Portuguese       
Fijan  
Aquaforest Searchlight 1.05 Reference Guide
Page 26
Brazilian        
Ganda  
Galician         
Hani  
Icelandic        
Ido  
Greek            
Interlingua  
Czech            
Kicongo  
Hungarian       
Kinyarwanda  
Polish           
Malagasy  
Romanian         
Maori  
Slovak           
Mayan  
Croatian         
Minangkabau  
Serbian          
Nahuatl  
Slovenian        
Nyanja  
Luxemb           
Rundi  
Finnish          
Samoan  
Turkish          
Shona  
Russian          
Somali  
Byelorussian     
Sotho  
Ukrainian        
Sundanese  
Macedonian        Tahitian  
Bulgarian        
Tonga   
Estonian         
Tswana  
Lithuanian      
Wolof   
Afrikaans        
Xhosa   
Albanian         
Zapotec  
Catalan          
Javanese  
Irish_Gaelic     
Pidgin_Nigeria  
Scottish_Gaelic  
Occitan  
Basque           
Manx  
Breton           
Tok_Pisin  
Corsican         
Bislama  
Frisian          
Hiligaynon  
Nynorsk          
Kapampangan  
Indonesian      
Balinese  
Malay            
Bikol  
Swahili          
Ilocano  
Tagalog          
Madurese  
Japanese*         
Waray  
Korean*           
None** 
Schinese*         
Serbian_Latin  
Tchinese*         
Latin   
Quecha           
Latvian 
Aymara  
*
Requires the Extended OCR Asian Module
**
No Language just a Latin alphabet
t
DPI 
Sets the DPI of images in the output file.   Set to  Auto by 
default, alternatively can be set to 300, 200 or 150 to force 
a specific resolution. 
AdvancedDespeckle 
The size of the speckles to remove. 
RemoveWhitePixels 
By default, despeckle removes black pixels. If set to true, 
despeckle  will  remove  white  pixels  rather  than  black 
pixels. 
Binarization 
Whether or not to perform binarization on the document. 
Documents you may be interested
Documents you may be interested