devexpress pdf viewer asp.net mvc : Extract pages pdf preview SDK Library service wpf .net html dnn aquaforest%20searchlight%201.05%20reference%20guide0-part786

Aquaforest Searchlight 
Reference Guide 
Version 1.05 
December 2014 
© Aquaforest Limited 2001-2014 
14 
Web: www.aquaforest.com 
E-mail: info@aquaforest.com  
m 
Extract pages pdf preview - SDK Library service:C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Easy to Use C# Code to Extract PDF Pages, Copy Pages from One PDF File and Paste into Others
www.rasteredge.com
Extract pages pdf preview - SDK Library service:VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Detailed VB.NET Guide for Extracting Pages from Microsoft PDF Doc
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page i
Contents 
 Product Overview .................................................................................................................................... 1 
1.1  The Business Problem: Documents that are not searchable. ..................................................... 1 
1.2  The Solution: Aquaforest Searchlight ............................................................................................. 1 
1.3  Supported Document Stores ........................................................................................................... 2 
1.4  Supported Operating Systems ........................................................................................................ 2 
1.5  Aquaforest Searchlight Modules .................................................................................................... 2 
1.5.1 
Multi-Core Module (Included as Standard) ........................................................................... 2 
1.5.2 
Extended OCR Module (Included as Standard)................................................................... 2 
1.5.3 
Extended OCR Asian Language Module (Extra Cost) ......................................................... 2 
1.5.4 
Extended OCR Advanced Compression Module (Extra Cost) ........................................... 2 
1.5.5 
SharePoint Metadata Extractor (Extra Cost) ......................................................................... 2 
1.5.6 
Advanced PDF iFilter (Extra Cost) ........................................................................................... 2 
 Installation and Licensing ........................................................................................................................ 3 
2.1  Installation .......................................................................................................................................... 3 
2.2  System Requirements ....................................................................................................................... 3 
2.2.1 
SharePoint Online (Office 365) System Requirements .......................................................... 3 
2.3  Microsoft SharePoint Requirements................................................................................................ 3 
2.4  Licensing ............................................................................................................................................. 3 
2.4.1 
Entering License Keys ................................................................................................................ 3 
2.5  Trial License Mode ............................................................................................................................ 4 
 Searchlight Architecture ......................................................................................................................... 4 
3.1  Processing Model .............................................................................................................................. 4 
3.1.1 
Audit and Candidate Identification ....................................................................................... 4 
3.1.2 
Searchability Status ................................................................................................................... 4 
3.1.3 
Supported Formats .................................................................................................................... 4 
3.2  Aquaforest Searchlight Windows Service ...................................................................................... 4 
 Document Library Management ........................................................................................................... 5 
4.1  Creating a Document Library ......................................................................................................... 5 
4.1.1 
Select Library Locations ............................................................................................................ 5 
4.1.2 
SharePoint URL format .............................................................................................................. 6 
4.1.3 
Document Settings .................................................................................................................... 6 
4.1.4 
OCR Settings ............................................................................................................................... 7 
4.1.5 
Scheduler .................................................................................................................................... 8 
SDK Library service:How to C#: Preview Document Content Using XDoc.Word
How to C#: Preview Document Content Using XDoc.Word. Get Preview From File. You may get document preview image from an existing Word file in C#.net.
www.rasteredge.com
SDK Library service:How to C#: Preview Document Content Using XDoc.PowerPoint
How to C#: Preview Document Content Using XDoc.PowerPoint. Get Preview From File. You may get document preview image from an existing PowerPoint file in C#.net.
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page ii
4.2  Editing a Document Library ............................................................................................................. 9 
4.3  Deleting a Document Library .......................................................................................................... 9 
4.4  Processing/Running a Document Library ...................................................................................... 9 
4.5  Review Audits & Conversions .......................................................................................................... 9 
4.6  Reports .............................................................................................................................................. 10 
4.6.1 
Error documents ....................................................................................................................... 10 
4.6.2 
Library Status ............................................................................................................................ 10 
4.6.3 
Generating Log files ................................................................................................................ 11 
 Microsoft SharePoint Document Stores ............................................................................................... 12 
5.1  Versioning ......................................................................................................................................... 12 
5.2  Archiving .......................................................................................................................................... 12 
5.3  Metadata ......................................................................................................................................... 12 
5.4  Security ............................................................................................................................................. 12 
 File System Document Stores ................................................................................................................ 13 
6.1  File Name Length ............................................................................................................................ 13 
6.2  File Access Permissions ................................................................................................................... 13 
6.3  Archiving .......................................................................................................................................... 13 
6.4  Metadata ......................................................................................................................................... 13 
 Aquaforest Searchlight Modules .......................................................................................................... 14 
7.1  Multi-Core Module (Included with the standard product) ....................................................... 14 
7.2  Extended (IRIS) OCR Module (Included with the standard product) ..................................... 14 
7.3  Extended OCR Advanced Compression (Extra Cost Option) ................................................. 14 
7.4  Metadata Extraction Module (Extra Cost Option) ..................................................................... 15 
7.5  Advanced iFilter Module (Extra Cost Option)............................................................................. 15 
 Aquaforest Searchlight User Interface ................................................................................................ 16 
8.1  Getting Started................................................................................................................................ 16 
8.2  Aquaforest Searchlight Dashboard ............................................................................................. 17 
8.2.1 
Dashboard Fields ..................................................................................................................... 17 
8.3  Library ............................................................................................................................................... 18 
8.3.1 
Library Status ............................................................................................................................ 18 
8.3.2 
Library Settings ......................................................................................................................... 19 
8.3.3 
Document Settings .................................................................................................................. 20 
8.3.4 
Aquaforest OCR Settings ........................................................................................................ 22 
8.3.5 
Extended OCR Settings........................................................................................................... 24 
8.3.6 
Advanced Compression Settings .......................................................................................... 28 
8.3.7 
Scheduler Settings ................................................................................................................... 29 
8.3.8 
Alert Settings ............................................................................................................................. 30 
SDK Library service:C# WinForms Viewer: Load, View, Convert, Annotate and Edit PDF
Erase PDF images. • Erase PDF pages. Miscellaneous. • Select PDF text on viewer. • Search PDF text in preview. • View PDF outlines. Related Resources.
www.rasteredge.com
SDK Library service:C# WPF Viewer: Load, View, Convert, Annotate and Edit PDF
Erase PDF images. • Erase PDF pages. Miscellaneous. • Select PDF text on viewer. • Search PDF text in preview. • View PDF outlines. Related Resources.
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page iii
8.3.9 
Run Details ................................................................................................................................ 30 
8.3.10  Run Details Context Menu ...................................................................................................... 31 
8.4  Support ............................................................................................................................................. 31 
8.5  Diagnostic Tool ................................................................................................................................ 31 
8.6  Settings ............................................................................................................................................. 32 
8.6.1 
License Settings ........................................................................................................................ 32 
8.6.2 
Email Settings ............................................................................................................................ 33 
8.6.3 
Themes ...................................................................................................................................... 33 
 Aquaforest Searchlight Installation Files .............................................................................................. 34 
10 
Acknowledgements ........................................................................................................................... 35 
SDK Library service:VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
Remove bookmarks, annotations, watermark, page labels and article threads from PDF while compressing. Also a preview component enables compressing and
www.rasteredge.com
SDK Library service:C# PDF Page Insert Library: insert pages into PDF file in C#.net
applications. Support adding and inserting one or multiple pages to existing PDF document. Forms. Ability to add PDF page number in preview. Offer
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 1
1
Product Overview 
Aquaforest Searchlight is an in-place document processing tool that is designed to monitor and make 
files within an organization Searchable.  
It is able to integrate with Microsoft SharePoint, Windows File Systems and File System-based Document 
Management Systems such as Worldox.  
Aquaforest Searchlight revolves around Document Libraries. A Document Library in Aquaforest 
Searchlight is an object that has references to one or more Document Management System locations. 
Aquaforest Searchlight then monitors these locations and makes sure that the TIFF and PDF documents 
contained in them are made searchable.  
1.1
The Business Problem: Documents that are not searchable. 
Studies have shown that in most organizations over 20% of documents are not fully text searchable so 
will not be located by text search or discovery exercises.  In addition a greater percentage of 
documents may not be tagged with appropriate metadata.  With the increase in distributed capture 
and ad-hoc publishing to document stores such as Microsoft SharePoint, there is a need for a solution 
to this problem that doesn’t require a strict capture-time process. 
Many types of documents are not searchable without special processing. For example:   
Scanned TIFF Files 
Image PDF Files 
Faxes 
These types of file need to be processed with Optical Character Recognition (OCR) technology to 
create a text version of the file contents which allows a searchable PDF to be created by merging the 
original page images with the text.  The text is stored in the PDF file as a hidden layer overlaying each 
page image.  This enables the file to be searched. 
Documents stored in Microsoft SharePoint may often be lacking key metadata required to enable 
straightforward metadata searches.  For example, attributes such as “Keywords” or “Company” may 
not have been fully indexed when the document was stored in SharePoint. The Aquaforest Searchlight 
Metadata Extractor module can be configured to automatically add metadata to new and existing 
documents. 
In order to enable searches across files in SharePoint, Windows Search or other Document 
Management Systems the searchable files need to be indexed by the system.  System iFilters manage 
this automatically for Microsoft Office but for PDF files a separate iFilter is required.  A free iFilter is 
available from Adobe which does a good job but only indexes basic PDF content, not PDF titles, 
subjects, authors, keywords, annotations, bookmarks, attachments, create time/date, number of 
pages. 
1.2
The Solution: Aquaforest Searchlight 
Audits document stores to determine which documents require processing 
Document Stores are monitored to deal with new and updated documents.  
Dashboard provides a convenient summary of the state of all managed stores. 
Provides detailed conversion reporting.   
convenient GUI which enables management of all stores via a single interface 
OCR Support for 23 languages including English, Spanish, German, French 
SDK Library service:How to C#: Preview Document Content Using XDoc.excel
How to C#: Preview Document Content Using XDoc.Excel. Get Preview From File. You may get document preview image from an existing Excel file in C#.net.
www.rasteredge.com
SDK Library service:C# Word - Extract or Copy Pages from Word File in C#.NET
Images. Convert Word to ODT. Convert PDF to Word. Convert ODT to Word. Document Page: Delete Word Pages. Page: Move Word Page Position. Page: Extract Word Pages.
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 2
1.3
Supported Document Stores 
Windows File Systems 
SharePoint 2010  
SharePoint 2013 
SharePoint Online (Office 365) 
Worldox and other Document Management Systems where files are held in a Windows file 
system 
1.4
Supported Operating Systems 
Windows 2008 Server, Windows 2012 Server, Windows 7, Windows 8 
1.5
Aquaforest Searchlight Modules 
1.5.1
Multi-Core Module (Included as Standard) 
Take full advantage of multi-core architectures for maximum 
performance.
1.5.2
Extended OCR Module (Included as Standard) 
Adds the IRIS OCR Engine for more comprehensive Language support 
(over 100 languages) and enhanced accuracy for certain document 
types. 
1.5.3
Extended OCR Asian Language Module (Extra Cost) 
Adds support for Korean, Japanese, Simplified Chinese & Traditional 
Chinese. 
1.5.4
Extended OCR Advanced Compression Module (Extra 
Cost) 
Adds support for advanced Mixed Raster Compression that can 
dramatically reduce the size of color scanned documents. 
1.5.5
SharePoint Metadata Extractor (Extra Cost) 
Adds the Pingar Metadata Extractor for SharePoint with Aquaforest 
Searchlight integration. 
1.5.6
Advanced PDF iFilter (Extra Cost) 
Adds the Foxit PDF iFilter for maximum indexing performance and PDF 
searchability. 
SDK Library service:C# PowerPoint - Extract or Copy PowerPoint Pages from PowerPoint
Conversion. Convert PowerPoint to PDF. Convert PowerPoint Pages. Page: Delete PowerPoint Pages. Page: Move Page: Extract PowerPoint Pages. Annotate PowerPoint. Text
www.rasteredge.com
SDK Library service:C# PDF File Split Library: Split, seperate PDF into multiple files
Separate PDF file into single ones with defined pages. Advanced component for splitting PDF document in preview without any third-party plug-ins
www.rasteredge.com
Aquaforest Searchlight 1.05 Reference Guide
Page 3
2
Installation and Licensing 
2.1
Installation 
The product is installed via the aquaforest_searchlight.msi install package that can be downloaded 
from Aquaforest’s download page: http://aquaforest.com/en/searchable_pdf_download.asp  
2.2
System Requirements 
Supported Operating Systems 
Windows 7 (32-bit|64-bit) 
Windows 8 (32-bit|64-bit) 
Windows Server 2008 R2 (32-bit|64-bit) 
t) 
Windows Server 2012 
Disk Space 
480 MB 
Memory 
Minimum 4GB (recommended 8GB) 
Visual C++ Redistributable 
Visual C++ 2008 Redistributable (x86) and 
Visual C++ 2012 Redistributable (x86) 
.NET Framework 
3.5 and 4.5 
2.2.1
SharePoint Online (Office 365) System Requirements 
Supported Operating Systems 
Windows 7 SP1 and above (32 bit|64 bit) 
Windows 8 (32bit|64bit) 
Windows Server 2008 R2 SP1 and above (32bit|64bit) 
Windows Server 2012  
Additional tools 
SharePoint Server Client Components SDK  
2.3
Microsoft SharePoint Requirements 
In order to make use of the SharePoint functionality, Microsoft SharePoint 2010 or 2013 (Standard or 
Enterprise) is required.  Note that the metadata service is required before the Entity Extraction module 
can be used. 
2.4
Licensing 
2.4.1
Entering License Keys 
License keys may be entered by using the “settings” tab from the Aquaforest Searchlight application. 
Without a purchased license key the product operates in trial mode.  The trial license provides access 
to the following modules: 
Aquaforest OCR 
Extended OCR enabling users to choose the IRIS OCR engine. 
Asian Language Support. 
Multi-Core Module for parallel processing. 
Aquaforest Searchlight 1.05 Reference Guide
Page 4
Further Modules are also available upon request, these are: 
Intelligent High Quality Compression 
Pingar Integration 
iFilter Integration 
2.5
Trial License Mode  
In this mode there is a limit of 100 documents that may be converted although there is no limit on the 
number of documents that may be audited. 
3
Searchlight Architecture 
3.1
Processing Model 
Document Management System
File System
SharePoint
1
Worldox
Audit
Document Library
Audit Result
Candidate 
Documents
(*.tiff, *.pdf)
Other 
Documents
Convert to 
Searchable 
PDF
1
Alfresco
Processing 
Settings
OCR 
Settings
Document
Locations
F
IGURE 
3.1:
P
ROCESSING 
M
ODEL
3.1.1
Audit and Candidate Identification 
Before processing a document library, Aquaforest Searchlight will perform an Audit (analysis) on the 
document library in order to determine which documents are candidates for processing by examining 
each  document’s  searchability status  (see  next  section) and  the  document  library’s  processing 
settings. 
3.1.2
Searchability Status 
This determines whether a PDF file needs to be processed according to the Conversion Rules.  Status 
values include Unknown, Searchable, Error, Partially Searchable amongst others.  
3.1.3
Supported Formats 
Aquaforest Searchlight currently supports only TIFF and PDF documents as input. As a result, candidate 
documents will always be of TIFF and/or PDF format. 
3.2
Aquaforest Searchlight Windows Service 
The service controls the execution of all job runs in Aquaforest Searchlight. It is used by the scheduler 
and enables the monitoring and processing of document libraries at regular time intervals without 
interfering with other work being performed on the machine it is installed in. 
Aquaforest Searchlight 1.05 Reference Guide
Page 5
4
Document Library Management 
Aquaforest Searchlight revolves around the concepts of document libraries, a document library is a set 
of documents which Aquaforest Searchlight monitors and ensures are converted where required in 
accordance with the Document Library Conversion Rules. This section will discuss the different 
concepts associated with Document Libraries. 
4.1
Creating a Document Library 
Creating Document Libraries in Aquaforest Searchlight is managed by a wizard. This wizard can be 
launched by clicking the “Create New Library” button on the Dashboard tab. The wizard contains five 
pages that will guide you through the set up. 
The wizard provides  helpful information  throughout  the  different stages of  the  document  library 
creation process which aids in better understanding the various steps and settings involved. Refer to 
sections on Library Settings and OCR Settings for detailed description of each of the settings. 
4.1.1
Select Library Locations 
This section enables users to specify the locations or URL of the documents they wish to monitor. To add 
a collection of documents to the document library follow the steps below. 
Select the Document Management system type you wish to add, this will be SharePoint or the 
Windows File System. 
When that is selected, a group box will be displayed that will allow the user to provide the 
location of the document collection and the security credentials (Username and Password). 
Aquaforest Searchlight 1.05 Reference Guide
Page 6
This will then display all the document collections on folders found at that particular location 
allowing the user to select which documents to add to the document library. 
If the documents are selected, the user should click on the “Add Another Location” button to 
add more documents to the library. 
If the User is happy with the documents added, a next button is provided to move to the next 
stage of the library set up. 
4.1.2
SharePoint URL format 
Below is an example of how to set the SharePoint URL format when setting up a document library in 
Searchlight. 
SharePoint 2010, actual URL:   
http(s)://SharePoint2010/site/myLibrary/myForms/AllItems.aspx 
Supported URL format in Searchlight: 
http(s)://SharePoint2010/site/myLibrary 
SharePoint 2013, actual URL:  
http(s)://SharePoint2013/site/Library/_layouts/15/start.aspx#/mylibrary/Forms/AllItems.aspx 
Supported URL format in Searchlight:        
http(s)://SharePoint2013/site/Library/mylibrary 
4.1.3
Document Settings 
This tab allows the user to specify more rules and criteria for the selection of documents to be added 
to the Document Library. These criteria include date created, date modified, file types to add, and 
document count limit. 
Documents you may be interested
Documents you may be interested