mvc open pdf in browser : Extract text from image pdf file SDK software service wpf windows winforms dnn autobahndx350-part786

Autobahn DX 
Reference Guide  
Version 3.5 
January 2015 
© Copyright 2005-2015 Aquaforest Limited  
ted  
http://www.aquaforest.com/ 
Extract text from image pdf file - Select, copy, paste PDF images in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract photos pdf; extract jpg from pdf
Extract text from image pdf file - VB.NET PDF Image Extract Library: Select, copy, paste PDF images in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract pictures pdf; extract images from pdf online
CONTENTS 
1
PRODUCT OVERVIEW AND CONCEPTS ............................................................................... 4
1.1
O
VERVIEW
................................................................................................................................ 4
2
AUTOBAHN DX ARCHITECTURE AND CONCEPTS ........................................................... 6
2.1
A
UTOBAHN 
W
INDOWS 
S
ERVICE
................................................................................................ 6
2.2
XML
J
OB 
D
EFINITION 
F
ILES
..................................................................................................... 6
2.3
A
UTOBAHN 
A
DMINISTRATION
................................................................................................... 7
2.3.1
Quick Job .......................................................................................................................... 7
2.3.2
Job Manager ..................................................................................................................... 7
2.3.3
Designer ........................................................................................................................... 7
2.3.4
Monitor ............................................................................................................................. 7
2.4
D
OCUMENT 
D
IRECTORIES
......................................................................................................... 7
2.5
D
OCUMENT 
P
ROCESSING
........................................................................................................... 7
2.6
J
OB 
S
TATUS
............................................................................................................................... 7
2.7
A
UTOBAHN 
DX
.N
ET 
J
OB 
API ................................................................................................... 7
2.8
M
ULTI
-C
ORE
/CPU
S
UPPORT
..................................................................................................... 7
2.9
F
ILE 
A
CCESS 
P
ERMISSIONS
........................................................................................................ 7
2.10
F
ILE 
N
AME 
L
ENGTH
.................................................................................................................. 8
2.10.1
File Name Length - UNC Paths ........................................................................................ 8
2.10.2
File Name Length 
Autobahn DX Working Folder Paths ............................................... 8
3
INSTALLATION AND LICENSING........................................................................................... 9
3.1
S
YSTEM 
R
EQUIREMENTS
........................................................................................................... 9
3.2
P
RODUCT 
L
ICENSING
................................................................................................................. 9
3.3
E
NTERING 
L
ICENSE 
K
EYS
........................................................................................................ 10
4
AUTOBAHN DX QUICK START.............................................................................................. 10
5
USING THE QUICK JOB TAB .................................................................................................. 13
5.1.1
Job Definition Section..................................................................................................... 14
5.1.2
OCR Options Section ...................................................................................................... 15
5.1.3
OCR PDF Options Section ............................................................................................. 16
5.1.4
PDF to TIFF Options Section ......................................................................................... 17
5.1.5
Split Options Section ...................................................................................................... 17
5.1.6
Other Options Section..................................................................................................... 17
5.1.7
Task Log Section ............................................................................................................. 18
5.2
S
ECURITY 
S
ETTINGS
................................................................................................................ 19
5.2.1
Target Document Security .............................................................................................. 19
5.3
D
OCUMENT 
M
ETADATA
.......................................................................................................... 20
5.4
D
OCUMENT 
D
ISPLAY 
O
PTIONS
................................................................................................ 21
5.4.1
Display Modes ................................................................................................................ 21
5.4.2
Settings ........................................................................................................................... 22
5.5
A
DVANCED 
F
LAGS
.................................................................................................................. 22
6
THE AUTOBAHN DX ADMINISTRATION TOOL ............................................................... 23
6.1
J
OB 
M
ANAGER
........................................................................................................................ 23
6.2
J
OB 
D
ESIGNER
......................................................................................................................... 24
6.2.1
Menu Items ..................................................................................................................... 24
6.2.2
Fields .............................................................................................................................. 25
6.2.3
Workflow Processing versus In-Place Processing.......................................................... 27
6.2.4
Example In-Place Job Setup ........................................................................................... 27
6.2.5
Step Types ....................................................................................................................... 28
6.2.6
Step Type Properties ....................................................................................................... 29
6.2.7
Convert TIFF to PDF ..................................................................................................... 30
6.2.8
OCR Image-Only PDF ................................................................................................... 31
6.2.9
Convert Any File to PDF ................................................................................................ 33
6.2.10
Merge TIFFs to PDF ...................................................................................................... 34
C# PDF Text Extract Library: extract text content from PDF file in
PDF file. Ability to extract highlighted text out of PDF document. Supports text extraction from scanned PDF by using XDoc.PDF for .NET Pro. Image text extraction
extract images from pdf files without using copy and paste; extract image from pdf acrobat
VB.NET PDF Text Extract Library: extract text content from PDF
Extract and get partial and all text content from PDF file. Extract highlighted text out of PDF document. Image text extraction control provides text extraction
extract jpg pdf; how to extract images from pdf files
6.2.11
Set PDF Properties ......................................................................................................... 35
6.2.12
Custom Script ................................................................................................................. 36
6.2.13
Merge PDF ..................................................................................................................... 36
6.2.14
Split PDF ........................................................................................................................ 37
6.2.15
Merge TIFFs ................................................................................................................... 37
6.2.16
Split TIFF ....................................................................................................................... 37
6.2.17
Read Inbox ...................................................................................................................... 38
6.2.18
Send Documents ............................................................................................................. 38
6.2.19
Convert PDF to TIFF ..................................................................................................... 39
6.2.20
Extract Text from PDF ................................................................................................... 39
6.2.21
Sharepoint Download ..................................................................................................... 39
6.2.22
Sharepoint Upload .......................................................................................................... 39
6.2.23
Stamps............................................................................................................................. 40
6.2.24
Compress Image PDF..................................................................................................... 40
6.3
M
ONITOR
................................................................................................................................ 41
6.4
J
OB 
S
CHEDULING
.................................................................................................................... 42
6.4.1
Ad-Hoc ............................................................................................................................ 43
6.4.2
Watched Folder / Continuous Scheduling ...................................................................... 43
6.4.3
Daily Scheduling ............................................................................................................. 43
6.5
E
MAIL 
O
PTIONS
....................................................................................................................... 43
6.6
R
UNNING 
J
OBS VIA 
J
OB 
M
ANAGER OR 
D
ESIGNER
................................................................... 44
7
SCRIPTING CUSTOM STEPS .................................................................................................. 45
7.1
C
USTOM 
S
CRIPT 
E
XAMPLE
...................................................................................................... 45
7.2
C
USTOM 
E
XAMPLE 
S
CRIPT
...................................................................................................... 46
7.3
F
URTHER 
E
XAMPLES
............................................................................................................... 47
7.3.1
Postscript to PDF: custom_ps.wsf .................................................................................. 47
7.3.2
MSG to PDF: custom_MSG.wsf ..................................................................................... 47
8
JOB DEFINITION XML FILES ................................................................................................ 49
8.1
O
VERVIEW OF 
J
OB 
D
EFINITION 
C
REATION AND 
P
ROCESSING
.................................................. 49
8.2
J
OB 
ID
S
................................................................................................................................... 49
8.3
S
AMPLE 
J
OB 
D
EFINITION 
F
ILE 
(E
XCLUDING 
S
TEP 
D
ETAILS
) ................................................... 49
8.4
S
AMPLE 
S
TEP 
D
ETAILS
............................................................................................................ 51
9
EXTENDED STEP TYPES: STEP TYPE DEFINITION XML FILES.................................. 53
9.1
S
AMPLE 
S
TEP
T
YPE 
D
EFINITION
............................................................................................... 53
10
AUTOBAHN DX COMMAND LINE INTERFACE ............................................................ 55
10.1.1
General Job Options ....................................................................................................... 55
10.1.2
Split Parameters [used with splittiff and splitpdf operations] ........................................ 56
10.1.3
Conversion Settings [used with tifftopdf and ocrimagepdf operations] ......................... 56
10.1.4
PDF Conversion Options [used with topdf operations] ................................................. 57
10.1.5
PDF File Processing ...................................................................................................... 59
10.1.6
OCR [used with ocrimagepdf and tifftopdf when searchable pdf has been chosen] ...... 59
10.1.7
PDF Output File Settings 
[used with pdfprops] .......................................................... 60
10.1.8
Sharepoint Settings 
[used with sharepointdownload and sharepointupload] ............ 61
10.1.9
Compress PDF Settings (used with compresspdf) .......................................................... 62
11
AUTOBAHN DX .NET API .................................................................................................... 63
11.1
API
E
XAMPLE
......................................................................................................................... 63
12
OCR PROPERTIES FILE AND THE ADVANCE PRE PROCESSING OPTION .......... 65
12.1
P
ROPERTIES 
F
ILE
..................................................................................................................... 65
12.2
A
DVANCE 
P
RE 
P
ROCESSING
.................................................................................................... 68
13
THE MERGE FLAG FEATURE ............................................................................................ 69
14
EXTENDED OCR MODULE ................................................................................................. 70
14.1
T
RIAL 
L
ICENSING
.................................................................................................................... 70
C# PDF insert image Library: insert images into PDF in C#.net, ASP
Create high resolution PDF file without image quality losing in ASP.NET application. Add multiple images to multipage PDF document in .NET WinForms.
extract pdf pages to jpg; extract image from pdf online
VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
Reduce image resources: Since images are usually or large size, images size reducing can help to reduce PDF file size effectively.
online pdf image extractor; how to extract images from pdf file
14.2
N
EW 
J
OB 
M
ANAGER 
S
TEPS
..................................................................................................... 70
14.3
E
XTENDED 
C
OMMAND 
L
INE 
I
NTERFACE
................................................................................. 72
15
IHQC MODULE ...................................................................................................................... 77
15.1
T
RIAL 
L
ICENSING
.................................................................................................................... 77
15.2
IHQC
PROPERTIES
................................................................................................................... 77
15.3
C
OMMAND 
L
INE 
I
NTERFACE
................................................................................................... 77
16
MULTICORE MODULE ........................................................................................................ 79
16.1
T
RIAL 
L
ICENSING
.................................................................................................................... 79
16.2
U
SING THE 
M
ULTI
C
ORE 
M
ODULE
........................................................................................... 79
16.3
C
OMMAND 
L
INE 
I
NTERFACE
................................................................................................... 80
17
ACKNOWLEDGEMENTS ..................................................................................................... 80
18
PRODUCT FOLDER STRUCTURE ..................................................................................... 82
C# PDF File Split Library: Split, seperate PDF into multiple files
Application. Best and professional adobe PDF file splitting SDK for Visual Studio .NET. outputOps); Divide PDF File into Two Using C#.
extract images pdf; extract vector image from pdf
VB.NET PDF insert image library: insert images into PDF in vb.net
VB.NET code to add an image to the inputFilePath As String = Program.RootPath + "\\" 1.pdf" Dim doc New PDFDocument(inputFilePath) ' Get a text manager from
extract photos from pdf; how to extract a picture from a pdf
 P
RODUCT 
O
VERVIEW AND 
C
ONCEPTS
1.1  Overview 
Autobahn DX 
is a  Document Processing product designed to  fit into an organization’s  document
workflow.  It is able to process and convert a variety of different types of document including TIFF 
images, Microsoft Office documents and HTML pages, convert those documents to searchable PDFs 
and perform a variety of other customizable activities. 
Autobahn includes PDF Junction (Professional Edition) and TIFF Junction (Professional Edition). For 
reference, this matrix highlights the functionality of Aquaforest’s document con
version and processing 
products: 
TIFF Junction Standard
TIFF Junct
ion Professional
PDF Junction Standard
PDF Junction Professional
Autobahn DX (Workstation)
Autobahn DX (Server)
Autobahn DX (Extended OCR)
Autobahn DX (Extended OCR Asian)
Autobahn DX ( Extended OCR 
-
IHQC)
Autobahn DX ( Extended OCR Asian 
Autobahn
DX (Multicore)
Convert TIFF to PDF 
Split & Merge TIFFs 
Convert PDF to TIFF 
Extract Raw Text from PDF 
OCR & Convert TIFF to Searchable PDF  
OCR  &  Convert  Image-Only  PDF  to  Searchable 
PDF 
Split & Merge PDFs 
Set Security on PDFs 
Multi Core Processing 
Extended OCR 
Asian Extended OCR 
Intelligent High Quality Compression 
Convert Microsoft Office Documents to PDF* 
Convert  HTML,  Text  and  Other  Documents  to 
PDF* 
Process Files, Folders or Entire Trees 
Command Line Interface 
Support for Windows 2003, 2008, XP Professional, 
Vista and 7 
Graphically Define Document Processing 
Windows Service  
C# PDF File Compress Library: Compress reduce PDF size in C#.net
Reduce image resources: Since images are usually or large size, images size reducing can help to reduce PDF file size effectively.
pdf extract images; extract images from pdf acrobat
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
When you have downloaded the RasterEdge Image SDK for also provided you with detailed PDF processing demo Imaging.Demo directory with the file name RasterEdge
extract text from image pdf file; extract images from pdf c#
Scheduled  &  Ad-hoc  Job  Support  via  XML  Job 
Tickets 
Watched Folders 
.Net API Interface 
Customizable Script Support 
Email Alerts 
Read  Mailbox  &  Send  Converted  Documents  by 
Email 
Multi-User access to watched folders 
*Requires native application present on server. 
 A
UTOBAHN 
DX
A
RCHITECTURE AND 
C
ONCEPTS
User Application
User Application
Autobahn
Windows Service
Autobahn Administrator
Autobahn Administrator
In
Work
Out
JobDefintions
XML Job Definition
Document Directories
Autobahn 
.Net Job API
TIFF Junction
PDF Junction
Other
Document Processing
Current
Completed
Job Status
Autobahn Architecture Overview
1
2
4
6
3
5
7
Designer
Monitor
Schedule
Run
Job Manager
2.1  Autobahn Windows Service 
This is the heart of the product and controls the execution of both scheduled jobs and ad-hoc jobs 
whether submitted via the Autobahn Manager or via the Autobahn Job API.  The service analyses the 
XML Job Definition files on start-up and when new files are created in the Job Definition directory by 
the Autobahn Manager, or via the Job API.  The XML Job Definition Files describe the steps to be 
carried out to complete the job and the Autobahn Service will spawn sub-jobs (such as TIFF Junction 
or PDF Junction) where required. Job Status records and logs are maintained and can be reviewed in 
the Job Monitor and Job Manager. 
2.2  XML Job Definition Files 
Each Job has one or more XML Job Ticket files that define a number of aspects of the job including: 
Job ID 
Job Name 
Scheduling Information 
Input Directory 
Work Directory 
Output Directory 
Etc. 
Section 8 of this document describes the XML Job Definition Files in full detail. 
2.3  Autobahn Administration 
This is a windows application that provides the primary administration interface and comprises the 
following main sections: 
2.3.1  Quick Job 
Jobs can 
be defined and run interactively which provides a convenient method for testing the product’s 
capabilities and running simple jobs.   
2.3.2  Job Manager 
This provides a method of managing the scheduled jobs previously defined in the Process Designer 
they can be selected and then deleted, edited (in the process designer) or scheduled.  
2.3.3  Designer 
This provides a graphical interface to allow creation of a series of steps that make up a job.  The 
process specification can then be saved (as  an  XML Job File), and run or scheduled  via the Job 
Manager section of the application. 
2.3.4  Monitor 
This shows the current service status and provides a monitor interface to currently executing jobs.  It 
also allows the service to be stopped or started. 
2.4  Document Directories 
Each job will have a set of directories containing the source documents, and directories for work, errors 
and output.   
2.5  Document Processing 
Each step in a Job will involve a separate Job  Element process being spawned by the Autobahn 
Service.  This may involve its own Sub-Job XML File and always will in the case where the step will 
execute TIFF Junction or PDF Junction. 
2.6  Job Status 
To support the Job Monitor, a mechanism is required to indicate the progress of current jobs,  in 
particular start time and current log file output.   
2.7  Autobahn DX .Net Job API  
A .Net API is provided to allow user application to create and execute ad-hoc jobs.  See section 11 for 
further details. 
2.8  Multi-Core/CPU Support 
Enhanced support for multi-core/CPU architectures was added in version 2.1.  Whilst it has always 
been possible to run multiple concurrent jobs to exploit multiples cores/CPUs, processing of single 
large TIFF or image PDF files to searchable PDF has been single threaded and only been able to 
exploit a single core/CPU. 
Version 2.1 introduced threaded processing on 
the “
OCR an Image-
Only PDF” and “Convert TIFF to 
PDF” (when using OCR).  These step properties include a “Threads” option which may be set to 1
, 2, 3 
or 4.  This option can provide a performance increase of up to 3.5 for multi-page files on a quad 
core/CPU machine. 
The threads setting is used to determine how many processing threads are used.  This is implemented 
by splitting the input TIFF or PDF into an appropriate number of parts (based on page ranges) and 
processing each part in parallel. 
2.9  File Access Permissions 
Administrators of Autobahn DX should be aware that “Quick Job” operations are run in the context of 
the current logged on user so rely on the permissions granted to that user and may to process files on 
remote file systems may make use of either UNCs or mapped drives visible to that user.  Conversely, 
Jobs in the Job Manager are run by the Autobahn DX windows service, so when accessing remote file 
systems UNC paths should be used rather than mapped drives.  The job will run as the user specified in 
the “Log On” property page of the service so it may be necessary to 
change the user ID if required for 
security purposes. 
2.10  File Name Length 
Windows has a file name length of 260 characters and a folder name length limit of 248 characters.  
There are potentially two areas where this could impact Autobahn DX processing. 
2.10.1  File Name Length - UNC Paths 
If a local file path is at or close to one of the windows limits, it can potentially cause issues.  For 
example this local file 
C:\doocuments\major accounts payable 2010\.......with 260 characters.pdf 
When accessed remotely via a UNC, such as the one below will exceed the 260 character limit when 
Autobahn DX is scanning folders for files to process.  This can even affect files that are to be filtered 
out (e.g. .msg files in the case where *.pdf has been specified as a filter). 
\\servername\c$:\doocuments\major accounts payable 2010\.......with 260 characters.pdf 
The best solution for this problem is to create a share such that the UNC path will not exceed the limit.   
For example create a share to C:\doocuments\major accounts payable 2010 with a short name such as 
“dp2” will then
allow access via a UNC such as \\servername\dp2\.......with 260 characters.pdf 
In  other  words,  in  Designer  the  source  folder  is \\servername\dp2  rather  than 
\\servername\c$:\doocuments\major accounts payable 2010 
2.10.2  File Name Length 
Autobahn DX Working Folder Paths 
For integrity reasons, Autobahn DX will (by default) copy source files and writes processed files to 
working folders before copying to the target output folders.  The location of the working folders is 
defined in job manager 
for example C:\Aquaforest\Autobahn DX 3.03\work\1008 
As  an  example,  given  a  file C:\Accounts\Business Documents 2010\Invoices\.... with 260 
characters.pdf and the source folder defined as C:\Accounts\Business Documents 2010\Invoices  then 
the  working  file  will  be C:\Aquaforest\Autobahn DX 3.03\work\1008\ Invoices\.... with 260 
characters.pdf which will exceed the limit. 
The best solution is to shorten  the working folder path via the  Designer screen 
for  example  to 
C:\dw\1008 instead of C:\Aquaforest\Autobahn DX 3.03\work\1008 
 I
NSTALLATION AND 
L
ICENSING
3.1  System Requirements 
Supported Operating Systems 
Windows 7 (32bit | 64bit) 
Windows 8 (32bit | 64bit) 
Windows Server 2003 (32bit | 64bit) 
t) 
Windows Server 2008 (32bit | 64bit) 
Windows Server 2012 
Disk Space 
500 Mb 
.Net Framework 
3.5 and 4.0 
3.2  Product Licensing 
Autobahn DX has four license levels which are described below: 
License 
Description 
Workstation 
This license only allows use of the Quick Job tab.   
To  test  this  license  in  trial  mode  select  the  WORKSTATION  radio 
button from the “Modules & Licensing” tab.
Server 
This license allows use of all of the tabs. 
To test this license in trial mode select the SERVER radio button from 
the “Modules & Licensing” tab.
Extended OCR  
This module is applied on-top of the SERVER license and enables access 
to the IRIS OCR engine for enhanced recognition. 
To test this license in trial mode select the SERVER | Extended OCR 
radio button from the “Modules & Licensing” tab.
See section 15 for more details. 
ails. 
IHQC 
This module is applied to the SERVER + EXTENDED OCR license and 
enables access to IRIS COMPRESSION. 
To test this license in trial mode select the SERVER | Extended OCR | 
IHQC 
radio button from the “Modules & Licensing” tab.
See section 16 for more details. 
Asian Language 
Support 
This module is applied to the SERVER + EXTENDED OCR license and 
enables Asian Language support. 
To test this license in trial mode select the SERVER | Extended OCR | 
Asian Language radio button from the “Modules & Licensing” tab.
See section 16 for more details. 
Multicore 
This module is applied on-top of the SERVER license and enables use of 
multiple cores when running jobs. 
To test this license in trial mode select the SERVER | Multi-Core radio 
button from the “Modules & Licensing” tab.
See section 17 for more details.   
Documents you may be interested
Documents you may be interested