PDF Converter Services - User & Developer Guide
PDF Converter Services - User & Developer Guide - Version 8.0 - 07/12/15 
© Copyright 2015, Muhimbi Ltd 
Page 21 of 124 
3.2.15  The TaskMonitorSettings class 
Optional settings for the service's Task Monitor (for the current request only). 
Property 
Type 
Description 
MaxHungCount 
int 
Maximum  number  of  seconds  before  a 
converter is considered  'hanging' and  will 
be terminated. Specify '0' to use the default 
value from the config file. 
MaxPendingCount 
int 
Maximum number of seconds to wait after a 
request for termination has been made and 
the program has not responded. Specify '0' 
to use the default value in the config file. 
MaxRunDuration 
int 
Maximum run time in seconds after which a 
conversion  process  will  be  terminated. 
Specify '0' to use the default value in the 
config file. 
Pdf find and replace text - search text inside PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn how to search text in PDF document and obtain text content and location information
how to select text in a pdf; search text in multiple pdf
Pdf find and replace text - VB.NET PDF Text Search Library: search text inside PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn How to Search Text in PDF Document and Obtain Text Content and Location Information in VB.NET application
how to select text in pdf; how to search a pdf document for text
PDF Converter Services - User & Developer Guide
PDF Converter Services - User & Developer Guide - Version 8.0 - 07/12/15 
© Copyright 2015, Muhimbi Ltd 
Page 22 of 124 
3.3  Working with ProcessBatch (Merging / Splitting files) 
The Muhimbi Document Conversion Service allows multiple files to be merged 
into a single PDF file or a single file to be split into separate files. These actions 
are carried out using the ProcessBatch method described in this section. 
3.3.1  Merging files 
The key features of the merging facility are as follows: 
1.  Convert and merge any supported file format / URL (inc. HTML, AutoCAD, 
MS-Office, InfoPath, TIFF) or merge existing PDF files. 
2.  Apply different watermarks on each individual file as well as on the entire 
merged file (e.g. page numbering). 
3.  Apply PDF Security settings and restrictions on the merged file. 
4.  Optionally skip (and report) corrupt / unsupported files. 
5.  Add PDF Bookmarks for each converted file. 
6.  Apply any ConversionSetting supported by the regular conversion process. 
VB.NET PDF replace text library: replace text in PDF content in vb
and ASP.NET webpage. Find and replace text in PDF file in preview without adobe PDF reader component installed. Able to pull text
select text in pdf file; text searchable pdf
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
When you have downloaded the RasterEdge Image SDK for .NET, you can unzip the package to find the RasterEdge.Imaging.PDF.dll in the bin folder under the root
select text pdf file; convert pdf to searchable text
PDF Converter Services - User & Developer Guide
PDF Converter Services - User & Developer Guide - Version 8.0 - 07/12/15 
© Copyright 2015, Muhimbi Ltd 
Page 23 of 124 
The Web Service method that controls merging of files is called ProcessBatch 
(highlighted in the screenshot above). It accepts a ProcessingOptions object 
that  holds  all  information  about  the  source  files  to  convert  and  the 
MergeSettings to apply, which may include security and watermarking related 
settings. A BatchResults object is returned that, when it comes to merging of 
files, always contains a single file that holds the byte array for the merged PDF 
file. 
For a full code example see section 4.7 Merging multiple files into a single PDF 
using .NET
3.3.2  Splitting files 
The key features of the splitting facility are as follows: 
1.  Split a single PDF file into one or more individual PDF files.  
2.  Split based on number of pages or bookmarks.  
3. 
Automatically  generate  numbered  file  names  using  .NET’s  for
matting 
syntax, e.g. 'split-{0:D3}.pdf' will use 3  digits for the sequential numbers 
starting at ‘split
-
001.pdf’. When splitting b
y bookmark then an optional {1} 
parameter  can  be inserted in  the  file  name  to  include the name of the 
bookmark as well.  
4.  Can be combined in combination with other actions, e.g. convert & merge.  
A note about splitting based on bookmark levels: PDFs store bookmarks at the 
page level, so it is not clear on what part of the page a heading starts or ends. 
As a result an extra page will always be exported for each file split based on 
bookmark levels. 
For example let’s assume the following document:
Page 1: Contains chapter 1 and sections 1.1. and 1.2.  
Page 2: Contains the last paragraph of 1.2 and all of chapter 2.  
Page 3: Contains Chapter 3.  
When splitting this document based on bookmarks using ‘1’ as the batch size 
then the following files will be created: 
File 1: Contains page 1 and 2 as expected.  
File 2: Contains pages 2 and 3 even though Chapter 2 is only really part of 
page 2. This is because there is no way to know if Chapter 2 runs over into 
page 3 or not.  
File 3: Contains Chapter 3.  
VB.NET PDF File & Page Process Library SDK for vb.net, ASP.NET
document. If you find certain page in your PDF document is unnecessary, you may want to delete this page directly. Moreover, when
search pdf files for text; pdf find and replace text
VB.NET Create PDF Library SDK to convert PDF from other file
Create writable PDF file from text (.txt) file in VB.NET project. you can download the RasterEdge .NET Image SDK and find the PDF processing component DLL
search pdf for text; make pdf text searchable
PDF Converter Services - User & Developer Guide
PDF Converter Services - User & Developer Guide - Version 8.0 - 07/12/15 
© Copyright 2015, Muhimbi Ltd 
Page 24 of 124 
The object classes involved in splitting files is similar to the ones used by the 
merging facility described in 3.3.1.  
The Web Service method that controls splitting (as well as merging) of files is 
called ProcessBatch.  It  accepts  a ProcessingOptions  object  that  holds  all 
information about the files to process and the operations to apply. A Results 
object is returned that, when it comes to splitting of files, contains one or more 
results that hold the contents of the file as well as the suggested output file 
name, which you may us to save the file locally. 
As the ProcessingOptions class accepts both MergeSettings and SplitOptions it 
is possible to convert and merge a set of input files (see 3.3.1) and then split up 
the results, all in a single web service call. Just populate the various properties 
and the system will take care of the rest. 
Details about the various classes involved can be found below. A code sample 
can be found in section 4.9. 
C# HTML5 PDF Viewer SDK deployment on Visual Studio .NET
Unzip the download package and you can find a project XDoc.PDF.HTML5 Viewer Demo or XDoc.PDF.HTML5 Editor Once done debugging with x86 dlls, replace the x86
search pdf for text in multiple files; search pdf documents for text
VB.NET PDF - Deploy VB.NET HTML5 PDF Viewer on Visual Studio.NET
to How to Build Online VB.NET PDF Viewer in Unzip the download package and you can find a project named XDoc Once done debugging with x86 dlls, replace the x86
search a pdf file for text; converting pdf to searchable text format
PDF Converter Services - User & Developer Guide
PDF Converter Services - User & Developer Guide - Version 8.0 - 07/12/15 
© Copyright 2015, Muhimbi Ltd 
Page 25 of 124 
3.3.3  The ProcessingOptions class 
This object is the only parameter passed into the ProcessBatch method. It 
allows all parameters required for the batch operation to be passed in. 
Property 
Type 
Description 
MergeSettings 
MergeSettings 
Settings  associated  with  PDF  Merge 
operations, see 3.3.4. 
OCRSettings 
OCR 
Settings 
Optional settings for when the source file is 
Image based and OCR must be carried 
out. 
SourceFiles 
SourceFile[] 
An array of files associated with the batch 
operation. 
SplitOptions 
FileSplitOptions  Settings  associated  with  PDF  Split 
operations, see 3.3.2. 
SubscriptionSettings 
Subscripti 
onSettings 
Internal Muhimbi use only, please ignore 
3.3.4  The MergeSettings class 
Any settings associated with a PDF Merge batch process are communicated 
using this class.  
Property 
Type 
Description 
BreakOnError 
Bool 
Specify if any error should abort the entire 
batch process or if the offending file should 
be skipped. 
OmitErrorPages 
Bool 
Control if error pages are inserted in the 
merged  document  for  files  that  fail  to 
convert.  This  only  has  effect  if 
BreakOnError is set to 'False'. 
OutputFormatSpecific 
Settings 
OutputFormat 
SpecificSettings 
An instance of an object that contains 
settings specific to the output format, e.g. 
ViewerPreferences or Font Embedding 
settings when the output format is PDF 
(See section 7 for details).  
OpenPassword 
String 
The ‘open password’ to be app
lied to the 
PDF file containing all merged documents. 
See 3.2.3 for details. 
OwnerPassword 
String 
The ‘owner password’ to be applied to the 
PDF file containing all merged documents. 
See 3.2.3 for details. 
PDFProfile 
PDFProfile 
The  PDF Profile to use for the PDF file 
containing  all  merged  documents.  See 
3.2.3 for details. 
SecurityOptions 
SecurityOptions  Security restrictions to apply to the PDF file 
containing  all  merged  documents.  See 
3.2.3 for details. 
Watermarks 
Watermark[] 
Watermarks  to  apply  to  the  PDF  file 
containing  all  merged  documents.  Note 
that  it  is  still  possible  to  specify 
Watermarks for each individual file in the 
C# PDF File Permission Library: add, remove, update PDF file
Text: Replace Text in PDF. Image: Insert Image to PDF. Image: Remove Image from using RasterEdge.XDoc.PDF; In the following code table, you will find a piece of
how to select text in pdf image; find text in pdf image
VB.NET PDF File Permission Library: add, remove, update PDF file
to PDF. Text: Delete Text from PDF. Text: Replace Text in PDF. In the following code table, you will find a VB NET code sample for how to set PDF file permissions
pdf text searchable; how to select text on pdf
PDF Converter Services - User & Developer Guide
PDF Converter Services - User & Developer Guide - Version 8.0 - 07/12/15 
© Copyright 2015, Muhimbi Ltd 
Page 26 of 124 
batch as  well  using  the SourceFile.Con-
versionSettings property (see 3.3.6). 
DocumentStartPage 
DocumentStart 
Page 
When  printing  double  sided  it  is  often 
desirable to let each document in a merged 
file start on (usually) the right hand page. 
Behaviour of how documents are aligned in 
a merge set can be controlled using this 
property. 
3.3.5  The FileSplitOptions class 
Any settings associated with PDF Split operations are communicated using 
this class.  
Property 
Type 
Description 
FileSplitType 
FileSplitType  How to split the file: ByNumberOfPages or 
ByBookmarkLevel. 
BatchSize 
Int 
When splitting by the number of pages set 
this value to the number of pages to use 
per file. 
BookmarkLevel 
Int 
When splitting by bookmark set this value 
to the bookmark level to split on. 
FileNameTemplate 
String 
Template to use for generating file names 
using .NET formatting standards, e.g. ‘spf
-
{0:D3}.pdf’ generates names starting with 
‘spf
-00
1.pdf’. 
When splitting by bookmark 
then  an  optional  {1}  parameter  can  be 
inserted  in  the  file  name  to  include  the 
name of the bookmark as well. 
3.3.6  The SourceFile class 
An array of SourceFile objects is passed to the server as part of the 
ProcessingOptions class. 
Property 
Type 
Description 
ConversionSettings  ConversionSettings  The settings to use for this particular file, 
including  Quality,  Watermarks  and  page 
ranges. See 3.2.3 for details. 
File 
Byte[] 
The content of the file to process or the 
Byte  array  of  the  URL  to  convert 
System.Text.Encoding.UTF8.GetBytes(url) 
MergeSettings 
FileMergeSettings  Settings associated with merging this file. 
See 3.3.7 for details. 
OpenOptions 
OpenOptions 
Any options for opening the file, see 3.2.2 
for details. 
PDF Converter Services - User & Developer Guide
PDF Converter Services - User & Developer Guide - Version 8.0 - 07/12/15 
© Copyright 2015, Muhimbi Ltd 
Page 27 of 124 
3.3.7  The FileMergeSettings class 
File specific settings associated with merging individual documents are passed 
using this class. 
Property 
Type 
Description 
TopLevelBookmark 
String 
The 
name to  use  as  the  ‘top  level 
bookmark’ in the combined PDF file.
3.3.8  The BatchResults class 
The results of a batch operation are passed back in the BatchResult class.  
Property 
Type 
Description 
Results 
BatchResult[] 
One or more results coming out of the 
batch operation. Note that in case of 
file merge operation  the merged file 
is always stored in element 0. 
3.3.9  The BatchResult class 
Individual results, part of the BatchResults class, are passed using the 
BatchResult class. 
Property 
Type 
Description 
File 
Byte[] 
The  file  associated  with  the  result, 
e.g. the split or merged file. 
Filename 
String 
The suggested file name to use for 
saving the file. Please note that this is 
just a suggestion and can be ignored. 
This  is  mainly  used  when  splitting 
PDF files, see 3.3.2. 
OCRResult 
OCRResult 
Object containing the result of OCR 
processing of a document. 
PDF Converter Services - User & Developer Guide
PDF Converter Services - User & Developer Guide - Version 8.0 - 07/12/15 
© Copyright 2015, Muhimbi Ltd 
Page 28 of 124 
3.4  OCR (Optical Character Recognition) 
The Muhimbi Document Conversion Service  provides support  for two  OCR 
scenarios: Converting bitmap based content to searchable and indexable PDFs 
AND extracting text from bitmap based content. For examples see chapter 6. 
3.4.1  The OCRSettings class 
An instance of this class is optionally passed in the OCRSettings property of the 
ConversionSettings class for operations where OCR needs to be carried out during 
conversion.   
Property 
Type 
Description 
Performance 
OCRPerfor 
mance 
Indicate what  performance / accuracy  to 
use. Slow will give best result, but usually 
takes  longer  (depending  on  the  source 
material).  
Language 
String 
The language to use for recognizing text. 
Can be any  value of  the OCRLanguage 
enumeration  or custom  values  if  custom 
character  sets  /  languages  have  been 
defined.  
PDF Converter Services - User & Developer Guide
PDF Converter Services - User & Developer Guide - Version 8.0 - 07/12/15 
© Copyright 2015, Muhimbi Ltd 
Page 29 of 124 
Property 
Type 
Description 
WhiteList 
String 
Optional  string  of  characters  to  limit 
recognition  to.  For  example  specify 
1234567890 to only recognize numbers to 
prevent a 1 being recognized as i or l. 
BlackList 
String 
Optional  string  of  characters  to  skip 
recognition  for.  For  example  specify 
1234567890 to not recognize any 
numbers, which will improve accuracy for 
normal  text  providing  the  text  doesn’t 
contain numbers. 
Regions 
OCRRegion[]  Optional regions to OCR if only part of the 
page or document need processing. 
Paginate 
bool 
Should the source files be paginated (for 
images that span multiple pages)? 
3.4.2  The OCRRegion class 
When OCR must be carried out on a section of a document, rather than the entire 
document, a set of regions can optionally be passed into the OCRSettings.Regions 
property.  
Property 
Type 
Description 
Id 
String 
Optional  tag  which can  later be  used  to 
retrieve the recognised text. (Not supported 
in 7.1) 
String 
The X coordinate of the region 
in pt (1/72”)
String 
The Y coordinate of the region 
in pt (1/72”)
Width 
String 
The Width of the region 
in pt (1/72”
Height 
String 
The Height of the region 
in pt (1/72”)
StartPage 
int 
The  index  of  the  first  page  this  region 
applies to. 
EndPage 
int 
The last page this region applies to. 
PageInterval 
int 
The interval the region applies to 
(e.g. ‘2’ to 
skip  every  other  page  in  double  sided 
documents) 
PageRange 
String 
An  optional  string  representation  of  the 
range of pages the region applies to. For 
example “1,3,7,10
-
15”. If specified, this is in 
addition  to  the  values  stored  in  the 
StartPage and EndPage properties. 
PDF Converter Services - User & Developer Guide
PDF Converter Services - User & Developer Guide - Version 8.0 - 07/12/15 
© Copyright 2015, Muhimbi Ltd 
Page 30 of 124 
3.4.3  The OCRResult class 
For OCR operations that return text, details are returned in an instance of the 
OCRResult class. 
Property 
Type 
Description 
RegionTexts 
RegionText[] 
Individual  results  for  the  various 
regions specified in OCRRegion
Text 
string 
The  full  textual  result  of  OCR 
processing. 
3.4.4  The RegionText class 
Text associated with a region is returned in an instance of the RegionText 
class.  
Property 
Type 
Description 
RegionId 
String 
The ID of the region the text belongs 
to, as specified in OCRRegion.Id. 
PageNumber 
int 
The page number the text belongs to. 
Text 
String 
The OCRed text for the region. 
Documents you may be interested
Documents you may be interested