mvc open pdf in browser : Extract images pdf control software utility azure html .net visual studio autobahndx356-part792

60 
Bulgar 
18 
Slovenian 
19 
Latvian 
20 
Lithuanian 
21 
Estonian 
22 
Turkish 
23 
/keepimages 
If set to true, the original page images will be used in the result file, 
with  the  despeckled  or  deskewed  images  used  just  for  the  OCR 
process. 
/graphicsproc 
“all” : 
Treat all Graphics Areas as Text. 
“box” : 
Remove Box Lines in OCR Processing. 
/extractimages 
One of the following : 
Auto 
TIFF  Junction  will  select  the  most  appropriate 
method. 
Via Bitmap 
The PDF is rasterized using bitmap conversion 
Extract TIFF 
The  embedded TIFF  images are  extracted 
directly.  
Convert to TIFF 
The PDF is rasterized using conversion to 
PDF. 
Native  
/mrc 
This  enables  Mixed  Raster  Compression  which  can  dramatically 
reduce the output size of PDFs comprising color scans.  Note that this 
option cannot be used in conjunction with the “Native” Image Method 
for OCRing PDFs as the Native method does not adjust the images 
within the PDF. 
/optimiseocr 
See section 12.2 for a full explanation of this option. 
n. 
10.1.7  PDF Output File Settings 
[used with pdfprops] 
Parameter 
Notes 
/userpassword 
Sets the user password for the output document 
/ownerpassword 
Sets the owner document for the output document. 
/permissions 
A comma separated list of document permissions 
Permission 
Description 
allowprinting 
Allow high-quality printing 
allowmodifycontents 
Allow assembly (see below) and 
other document medications 
allowcopy 
Allow text and graphic copying 
and extraction 
allowmodifyannotations  Allow 
modification 
of 
annotations 
allowfillin 
Allow filling of form fields 
allowscreenreaders 
Allow  extraction  of  text  and 
Extract images pdf - Select, copy, paste PDF images in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
how to extract images from pdf file; extract image from pdf file
Extract images pdf - VB.NET PDF Image Extract Library: Select, copy, paste PDF images in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document
extract image from pdf; extract images from pdf files without using copy and paste
61 
graphics  in  support  of 
accessibility. 
allowassembly 
Allow  rotation,  insertion  or 
deletion of pages. 
allowdegradedprinting 
Allow low-quality printing 
allowall 
Allow all the permissions 
/strength 
Set to 128 to make use of security settings 
/author 
Sets the PDF information dictionary value. 
/title 
/subject 
/keywords 
/creator 
/pagelayoutSinglepage 
Single Page (SinglePage) 
/pagelayoutContinuous 
Continuous(OneColumn) 
/pagelayoutContinuousfacingleft 
ContinuousFacing [odd pages left] (TwoColumnLeft) 
/pagelayoutContinuousfacingright 
ContinuousFacing [odd pages right] (TwoColumnRight) 
/pagemodeusenone 
No Thumbnails or Bookmarks Visible (UseNone) 
/pagemodeuseoutlines 
Bookmarks Visible (Use Outlines) 
/pagemodeusethumbs 
Thumbnails Visible (UseThumbs) 
/pagemodefullscreen 
Full Screen Mode (FullScreen) 
/hidetoolbar 
The viewer’s tool bar will be hidden
/hidemenubar 
The viewer’s menu bar will be hidden
/hidewindowui 
The viewer’s UI elements (scrollbars etc
.) will be hidden 
/fitwindow 
The viewer 
will resize the document’s window to fit the size of 
the first displayed page. 
/centerwindow 
The document window will be positioned in the center of the 
screen. 
/nonfullscreenpagemodeusenone 
On  exiting  full  screen  mode,  neither  outline  nor  thumbnail 
images are shown. 
/nonfullscreenpagemodeuseoutline 
On exiting full screen mode outlines are visible. 
/nonfullscreenpagemodeusethumbs 
On exiting full screen mode thumbnails are visible. 
10.1.8  Sharepoint Settings 
[used with sharepointdownload and sharepointupload] 
C# PDF Text Extract Library: extract text content from PDF file in
Ability to extract highlighted text out of PDF document. Image text extraction control provides text extraction from PDF images and image files.
extract photos pdf; extract images from pdf
VB.NET PDF Text Extract Library: extract text content from PDF
Extract highlighted text out of PDF document. Image text extraction control provides text extraction from PDF images and image files.
pdf image extractor; extract pictures from pdf
62 
Parameter 
Notes 
/sharepointurl  
Site, the URL of the SharePoint site that you want to access, e.g. 
http://localhost:10480/testsite 
/sharepointlib 
Library, the name of the library that you want to access, e.g. 
"Test Library" 
/sharepointext 
An optional extension mask that limits those files to manipulate, 
e.g. “pdf,tif”
/sharepointrecurse 
If  set  to  “True”  sub
-folders  of  the  Sharepoint  Library  are 
handled. 
10.1.9  Compress PDF Settings (used with compresspdf) 
Parameter 
Notes 
/mrcq 
JPEG quality setting (percentage value 1 - 100) for use in saving the background 
and foreground images. Default value is 75  
/mrcb 
Sampling size for the background portion of the image. The higher the number, the 
larger  the  size  of  the  image  blocks  used  for  averaging  which  will  result  in  a 
reduction in size but also quality. Default value is 3 
/mrcf 
Sampling size for the foreground portion of the image. The higher the number, the 
larger  the  size  of  the  image  blocks  used  for  averaging  which  will  result  in  a 
reduction in size but also quality. Default value is 3 
/advancedflags 
A number of advanced flags are available for use under guidance from Aquaforest 
technical support.  Contact support@aquaforest.com  if needed. 
/pdfa 
convert the compressed document to PDF/A-1b format 
/nojb2 
use G4 fax compression rather than JBIG2 for bitonal images 
/debug 
generate additional informational messages 
/allowtext 
allow PDFs containing text to be processed 
C# Create PDF from images Library to convert Jpeg, png images to
C#.NET Project DLLs for Conversion from Images to PDF in C#.NET Program. C# Example: Convert More than Two Type Images to PDF in C#.NET Application.
extract pdf images; extract image from pdf online
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
VB.NET: Extract All Images from PDF Document. This is an example that you can use it to extract all images from PDF document. ' Get page 3 from the document.
extract jpeg from pdf; pdf image text extractor
63 
11  A
UTOBAHN 
DX
.N
ET 
API 
An API is provided which allows a .Net application to allow execution of existing job definitions and 
creation “on  the  fly”  of new jobs 
from XML Job Ticket  files.   The API DLL is  located  in  the 
AUTOBAHN\bin folder and a sample Visual Studio 2008 project is provided in the AUTOBAHN 
\code examples\AutobahnAPIExample folder where AUTOBAHN is the folder where Autobahn DX 
has been installed 
by default this is C:\Aquaforest\Autobahn DX 3.03. 
11.1  API Example 
using System; 
using System.Threading; 
using Aquaforest.Autobahn.API; 
namespace ConsoleApplication2 
class Class1 
[STAThread] 
static void Main(string[] args) 
IJob job = null
string JobFinished; 
string Jobstatus; 
try 
/* Run Job and Wait to Complete */ 
job = new Job(1001); 
job.Start(); 
job.WaitForExit(); 
JobFinished=job.JobFinished(); 
Jobstatus=job.Jobstatus(); 
if(Jobstatus=="Error") 
Console.WriteLine("Job Failed"); 
else if(Jobstatus=="Stopped") 
if(JobFinished=="True") 
Console.WriteLine("Job Completed"); 
else 
Console.WriteLine("Job 
Was 
Terminated"); 
job.Dispose(); 
C# PDF Convert to Images SDK: Convert PDF to png, gif images in C#
Professional .NET library and Visual C# source code for creating high resolution images from PDF in C#.NET class. Cut and paste any areas in PDF pages to images.
extract photos from pdf; extract image from pdf c#
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
Page: Extract, Copy and Paste PDF Pages. Easy to Use C# Code to Extract PDF Pages, Copy Pages from One PDF File and Paste into Others in C#.NET Program.
extract pdf pages to jpg; how to extract pictures from pdf files
64 
/* Run Job and allow 10 seconds to Complete */ 
job = new Job(1001); 
job.Start(); 
job.WaitForExit(10000); 
JobFinished=job.JobFinished(); 
Jobstatus=job.Jobstatus(); 
if(Jobstatus=="Error") 
Console.WriteLine("Job  Failed  -  Check  Job 
Log for Details"); 
else if(Jobstatus=="Stopped") 
if(JobFinished=="True") 
Console.WriteLine("Job Completed"); 
else 
Console.WriteLine("Job 
Was 
Terminated due to Timeout"); 
job.Dispose(); 
catch (Exception oExp) 
Console.WriteLine(oExp.Message); 
Console.ReadLine(); 
Constructors 
public Job(int jobid) 
Create Job object using an existing jobid. 
public Job(string jobdeffile) 
Create Job object using a temporary job definition file. 
Methods 
public Start() 
Starts the Job. 
public void WaitForExit(int ms) 
Waits for the job to exit, for up to ms milliseconds. The  job is 
stopped if it has not completed. 
public void WaitForExit() 
Waits indefinitely for the job to compete. 
public virtual void Dispose() 
Disposes of the resources associated with the Job. 
Public string Jobstatus() 
Returns the status of the job which may be eitheStopped or Error.  
ror.  
This  should  be  checked  in  conjunction  with  the  value  of 
JobFinished() to determine whether the job completed before being 
stopped. 
Public string JobFinished() 
Indicates whether the job has completed (return value True) or has 
has 
been stopped (return  value False) as  a result of timeout  being 
ng 
exceeded. 
Public void ClearError(string JobStatusPath) 
When a job is error, ClearError(string jobstatusPath) will clear the 
error job and set the job status to stopped. 
VB.NET Create PDF from images Library to convert Jpeg, png images
VB.NET Guide for Converting Raster Images to PDF File Using VB.NET Sample Code. VB.NET Example of More than Two Images to PDF Conversion. This VB.
extract text from image pdf file; extract image from pdf in
C# PDF Convert to Jpeg SDK: Convert PDF to JPEG images in C#.net
Following demo code will show how to convert all PDF pages to Jpeg images with C# .NET. // Load a PDF file. String inputFilePath
extract vector image from pdf; pdf extract images
65 
12  OCR
P
ROPERTIES 
F
ILE AND 
T
HE 
A
DVANCE 
P
RE 
P
ROCESSING 
O
PTION
12.1  Properties File 
The following are descriptions of those properties in the file Properties.xml that are most likely to be 
changed to improve engine performance. If you require further information regarding any properties in 
the file then please contact Aquaforest via support@aquaforest.com  for assistance. 
Binarize 
This setting determines how the image will be converted into a bitonal one for OCR. The 
following are valid options: 
-1 
This utilizes a technique whereby those parts of the image that have certain characteristics 
indicative of characters are extracted from the underlying image. This approach can give the 
best results on pages such as magazine images, news print, etc and will handle light text on 
darker backgrounds. This approach can cause an increase  in processing time with certain 
images. 
This utilizes the binarization capabilities built into the OCR engine and whilst it can give 
good results in limited situations it is not generally recommended. 
>0 
A value greater than 0 (the recommended default is 200) will use a simple threshold 
technique comparing the intensity of the pixel to the threshold value to determine whether it 
should be set to black or white. This simple approach is the fastest option. 
BoxSize 
Setting a value above 0 will cause the removal of enclosing boxes from the image used for 
the OCR processing. The default recommended is 100, i.e. where the box edges are 100 pixels or 
greater. 
BackgroundFactor - Sampling size for the background portion of the image. The higher the number, the 
larger the size of the image blocks used for averaging which will result in a reduction in size but also 
quality. Default value is 3 
DotMatrix - Set this to True to improve recognition of dot-matrix fonts. Default value is False. If set to 
true for non dot-matrix fonts then the recognition can be poor 
ForegroundFactor - Sampling size for the foreground portion of the image. The higher the number, the 
larger the size of the image blocks used for averaging which will result in a reduction in size but also 
quality. Default value is 3 
Jbig2EncFlags 
These are the flags that will be passed to the application used to generate JBIG2 
versions of images used in PDF generation (assuming this compression is enabled). Options are as 
follows: 
-b <basename>: output file root name when using symbol coding 
-d --duplicate-line-removal: use TPGD in generic region coder 
-p --pdf: produce PDF ready data 
-s --symbol-mode: use text region, not generic coder 
66 
-t <threshold>: set classification threshold for symbol coder (def: 0.85) 
-T <bw threshold>: set 1 bpp threshold (def: 188) 
-r --refine: use refinement (requires -s: lossless) 
-O <outfile>: dump thresholded image as PNG 
-2: upsample 2x before thresholding 
-4: upsample 4x before thresholding 
-S: remove images from mixed input and save separately 
-j --jpeg-output: write images from mixed input as JPEG 
-v: be verbose 
67 
Language 
The acceptable vales are as follows: 
0 - English 
1 - German 
2 - French  
3 - Russian  
4 - Swedish  
5 - Spanish  
6 - Italian  
7 - Russian English  
8 - Ukrainian  
9 - Serbian  
10 - Croatian  
11 - Polish  
12 - Danish  
13 - Portuguese  
14 - Dutch  
19 - Czech  
20 - Roman  
21 - Hungar  
22 - Bulgar  
23 - Slovenian  
24 - Latvian  
25 - Lithuanian  
26 - Estonian  
27 - Turkish 
MaxDeskew 
Maximum angle by which a page will be deskewed 
Morph 
Morphological options that will be applied to the binarized image before OCR. If left blank 
none is applied. Common options include those listed below but  for more options please contact 
support@aquaforest.com
d2.2 
2x2 dilation applied to all black pixel areas, useful for faint prints. 
e2.2 
2x2 erosion applied to all black pixel areas, useful for heavy prints. 
c2.2 
closing process that performs a 2x2 dilation followed by a 2x2 erosion with the result 
that holes and gaps in the characters are filled. 
NoPictures - By default, if an area of the document is indentified as a graphic area then no OCR 
processing is run on that area.  However, certain documents may include areas or boxes that are 
ident
ified as “graphic” or “picture” areas but that actually do contain useful text.  Setting NoPictures to 
True will cause it to ignore areas identified as pictures whilst setting it to False will force OCR of areas 
identified as pictures. 
OneColumn - The default value for this is true which improves the handling of single column text. 
Better handling of multi-column text such as magazine or news print can be achieved. 
PdfToImage 
The SDK ships with two engines for the conversion of PDF pages to images for OCR. 
The default engine is used when this is set to 0 but if certain PDF source documents are proving 
problematic then the alternate engine can be used by changing this value to 1. 
68 
PdfToImageIncludeText 
When  set  to  False  this  will  prevent  the  conversion  of  real  text  (i.e. 
electronically generated as opposed to text that is part of a scanned image) from being rendered in the 
page images extracted from the PDF. This is because the text is already searchable and so generally 
does not require OCR. The value can be set to True however if the OCR is required on this real text. 
Quality - JPEG quality setting (percentage  value 1  - 100) for use in saving the background and 
foreground images. Default value is 75 
RemoveLines 
The value used in Line removal. If blank no line removal will occur. The normal value 
to use to enable line removal is 100.5 but it you are experience difficulties with this value or have any 
questions then please contact support@aquaforest.com . 
12.2  Advance Pre Processing 
This option can be used to run each page OCR with 2 or more different settings and then chose the best 
set of results. 
When the /optimiseocr is specified in the advanced flag field.  The OCR and image processing engines 
will use the settings in the ImagePreProcessingDefaults section of the file Properties.xml modified by 
any properties set on the OCR and PreProcessing objects.   
This will enable the use of these default settings first (without modification by the properties set on the 
OCR  and  PreProcessing  objects)  followed  by  the  same  defaults  modified  by  the  values  in  the 
ImagePreProcessing sections from ID="1" to ID="n" where n is the last consecutive set defined in 
Properties.xml. 
Using heuristics and dictionary lookup the quality of the OCR output is then compared in order to 
determine the optimum set to output. In this way it is possible to define different sets of OCR and pre-
processing conditions that are suited to different types of source documents. This approach can also 
improve the handling of documents that contain different types of pages, e.g. scanned at different 
qualities, containing different languages, containing standard and dot matrix prints, etc. 
Sample Section of Properties.xml 
<ImagePreProcessing ID="1"
<Binarize>-1</Binarize
<Morph>c2.2</Morph
</ImagePreProcessing
<ImagePreProcessingDefaults
<RemoveLines></RemoveLines
<Binarize>200</Binarize
<BlackPixelLimit>0.65</BlackPixelLimit
<BoxSize>0</BoxSize
<GrayscaleQuality>0</GrayscaleQuality
<Jbig2EncFlags>-s</Jbig2EncFlags
<Language>0</Language
<MaxDeskew>10</MaxDeskew
<MinDeskewConfidence>3.0</MinDeskewConfidence
<Morph></Morph
<Mrc
<ForegroundFactor>3</ForegroundFactor
<BackgroundFactor>3</BackgroundFactor
<Quality>75</Quality
</Mrc
<Ocr
<DotMatrix>False</DotMatrix
<OneColumn>False</OneColumn
<NoPictures>False</NoPictures
<Tables>False</Tables
</Ocr
69 
<PdfImageExtraction
<PdfToImage>0</PdfToImage
<PdfToImageMinRes>200</PdfToImageMinRes
<PdfToImageMaxRes>300</PdfToImageMaxRes
<PdfToImageIncludeText>False</PdfToImageIncludeText
</PdfImageExtraction
<RemoveLines></RemoveLines
<SavePredespeckle>False</SavePredespeckle
<TextLayerExtraction
<MaxBoxes>0</MaxBoxes
<FilterWidth>130</FilterWidth
<FilterHeight>130</FilterHeight
<FilterRatio>1</FilterRatio
<FilterPercentage>0.6</FilterPercentage
<FilterWidthInverted>40</FilterWidthInverted
<FilterHeightInverted>40</FilterHeightInverted
<FilterRatioInverted>0.95</FilterRatioInverted
<FilterPercentageInverted>0.5</FilterPercentageInverted
</TextLayerExtraction
</ImagePreProcessingDefaults>
13  T
HE 
M
ERGE 
F
LAG 
F
EATURE
This feature is used to give the user a certain level of control over which folders to be included in the 
merge operations (“Merge Tiffs”, “Merge PDF”, “Merge Tiffs to PDF” and “Extended Merge Tiffs to 
PDF”). It pr
ovides the user with a mechanism of flagging folders that are to be included for processing.  
To use this feature, the following steps need to be followed: 
Choose a name you want to set as the flag name. For instance, “_ready”.
Open Autobahn.config file l
ocated at “<InstallDirectory>
\Autobahn DX 3.03\config\
” and 
change the value of <add key="mergeflag" value="" /> to <add key="mergeflag" 
value="ready.adx.merge" />.  
Note: The file extension must be “*.adx.merge” for this to work.
Next create the 0 size by
te file named “_ready.adx.merge” and copy and paste in each folder 
that requires processing. 
Restart the service to load the new configuration.  
Note: restarting the service will cause all jobs that are running through the job manager to 
terminate.  
Documents you may be interested
Documents you may be interested