how to upload only pdf file in c# : Search text in pdf image control Library system azure .net console PDF-Converter---User-Guide-(1)12-part489

PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 121 of 140 
Appendix - Web Services Object Model 
Although the Object Model exposed by the web service is easy to understand, 
the  system  provides  very  powerful  functionality,  including  watermarking, 
merging and fine grained control over how PDF files are generated. 
As outlined in the image below, the web service contains 3 main methods: 
Convert: Convert the file in the sourceFile byte array using the specified 
openOptions and conversionSettings. The generated PDF or XPS file is 
returned as a byte array as well. 
GetConfiguration: Retrieve  information  about  which  converters  are 
supported and the associated file extensions. Consider calling this service 
once  to  retrieve  a  list  of  valid  file  extensions  and  check  if  a  file  is 
supported before it is submit to the web service. This will prevent a lot of 
redundant traffic resulting in increased scalability. 
GetDiagnostics: Run a diagnostics test that carries out an internal end-
to-end test for each specified converter type. Call this method to check if 
the service and all prerequisites have been deployed correctly. 
The ApplySecurityApplyWatermark  and ProcessChanges  methods  are 
identical at this moment in time and are provided for convenience only. They 
all take exactly the same parameters as the Convert method, but they can act 
on PDF files only and basically apply whatever combination of Watermarks, 
Security Settings and other information is provided. 
The WSDL can be found at the following location. Change localhost to the 
actual host name if the MDCS is located on a different machine.  
 full  discussion  of  the  entire  object  model  is  out  of  the  scope  of  this 
document. For full details see the PDF Converter Services User & Developer 
as well as this blog post
Search text in pdf image - search text inside PDF file in, ASP.NET, MVC, Ajax, WinForms, WPF
Learn how to search text in PDF document and obtain text content and location information
how to select text in pdf reader; pdf select text
Search text in pdf image - VB.NET PDF Text Search Library: search text inside PDF file in, ASP.NET, MVC, Ajax, WinForms, WPF
Learn How to Search Text in PDF Document and Obtain Text Content and Location Information in VB.NET application
convert pdf to searchable text; convert pdf to searchable text online
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 122 of 140 
Appendix - Merge codes 
Available from 
Field Name 
WM on 
WM on 
WM on 
Long version of the date, e.g. 18 April 2011
Long version of the current time, e.g. 12:35:48
Short version of the date, e.g. 7/03/2011. 
Short version of the current time, e.g. 12:35. 
The number of the current page in the PDF file. 
This value is automatically updated for every 
The total number of pages in the PDF file. 
Any column name 
Any SharePoint column / field defined on the list 
such as {Title}, {Author}. Please use (case 
sensitive) internal field names. A full list can be 
found at
(Lists only) 
Returns the name of the Web server. This may or 
may not be the same as SERVER_NAME 
depending on type of name resolution you are 
using on your Web server (IP address, host 
Returns a string that contains the URL of the 
page that referred the request to the current page 
using an HTML <A> tag. Note that the URL is the 
one that the user typed into the browser address 
bar, which may not include the name of a default 
Returns the raw, encoded URL, for example, 
Returns a string describing the browser that sent 
the request. 
The Windows account that the user is 
impersonating while connected to your Web 
server. Use REMOTE_USER to view the raw user 
name that is contained in the request header. 
The IP address of the remote host (identifying the 
user) that is making the request. 
The name of the host that is making the request. 
If the server does not have this information, it will 
set REMOTE_ADDR and leave this empty. 
The name of the user as it is derived from the 
authorization header sent by the client, before the 
user name is mapped to a Windows account. If 
you have an authentication filter installed on your 
Web server that maps incoming users to 
accounts, use LOGON_USER to view the 
mapped user name. 
The server's host name, DNS alias, or IP address 
as it would appear in self-referencing URLs. 
Gives the base portion of the URL, without any 
querystring or extra path information, for example, 
The user’s name, if available (requires 7.2+).
The user’s 
email, if available (requires 8.0+). 
Due to limitations in SharePoint 2007, automatic watermarking for Insert and Update events are not supported on 
Document Libraries. They are supported on Lists and in SharePoint 2010. Use Workflows as an alternative (see 
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
Home ›› XDoc.PDF ›› VB.NET PDF: Extract PDF Image. Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document in VB.NET Project.
text searchable pdf file; search a pdf file for text
VB.NET PDF insert image library: insert images into PDF in
VB.NET code to add an image to the inputFilePath As String = Program.RootPath + "\\" 1.pdf" Dim doc New PDFDocument(inputFilePath) ' Get a text manager from
select text in pdf file; how to make a pdf document text searchable
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 123 of 140 
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
PDF ›› C# PDF: Extract PDF Image. How to C#: Extract Image from PDF Document. Support PDF Image Extraction from a Page, a Region on a Page, and PDF Document.
search pdf for text in multiple files; search pdf files for text
C# Create PDF from images Library to convert Jpeg, png images to
If you want to turn PDF file into image file format in C# application, then RasterEdge XDoc.PDF for .NET can also help with this.
pdf make text searchable; search pdf documents for text
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 124 of 140 
Appendix - Override default conversion settings 
The Muhimbi PDF Converter for SharePoint is based on an extremely flexible 
central conversion engine. This engine supports many more options than can 
realistically  be  displayed  in  the  limited  space  available  in  a  SharePoint 
Designer or Nintex Workflow Activity.  As a result the software defaults to the 
most common options. 
Although it has always been possible to override these default settings (See 
the Administration Guide, section 2.3.2), those changes are global and affect 
all operations across the SharePoint Farm. To improve this situation version 
6.1 introduces a new facility that allows the default settings to be overridden 
on a request by request basis. 
The Convert Document  workflow activity  (See  chapter 9 Cross-Converting 
between document types) has been extended and the previously reserved 
Optional Parameters field can now be used 
to specify ‘override settings’ 
XML based syntax.  
Although very powerful, the XML syntax and possible values for each XML 
Element may not immediately be obvious to all users. For full information see 
the class diagrams and details of the OpenOptions and ConversionSettings 
classes in the Developer Guide.  
The latest version of this Appendix can be found in this blog post
The values that can be overridden are as follows. 
<ConverterSpecificSettings type="ConverterSpecificSettings_WordProcessing"> 
<OutputFormatSpecificSettings type="OutputFormatSpecificSettings_PDF"> 
C# PDF insert image Library: insert images into PDF in, ASP
Free PDF image processing SDK library for Visual Studio .NET program. Powerful .NET PDF image edit control, enable users to insert vector images to PDF file.
cannot select text in pdf file; search pdf for text
C# PDF insert text Library: insert text into PDF content in
Text to PDF. C#.NET PDF SDK - Insert Text to PDF Document in C#.NET. Providing C# Demo Code for Adding and Inserting Text to PDF File Page with .NET PDF Library.
pdf text select tool; pdf make text searchable
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 125 of 140 
Please note: 
When entering values only specify those fields you want to override, leave 
all other fields completely ou
t (don’t just provide empty values, delete the 
entire line. (See the examples below) 
All values are case sensitive. 
Boolean values (true / false) need to be in all lowercase
There  is  no  need  to  specify  the  name  of  the  enumeration,  e.g.  in 
In  the ConverterSpecificSettings 
element  you  must  specify  the  ‘type’ 
attribute to specify the exact type. 
When specifying multiple values, e.g. in the SecurityOptions element, then 
please separate these options using a blank space. 
The  OutputFormatSpecificSettings  property  requires  version  7.0  of  the 
PDF Converter or newer. 
A number of examples are provided below. 
C# PDF Convert to Text SDK: Convert PDF to txt files in
be converted to plain text. Text can be extracted from scanned PDF image with OCR component. Professional PDF to text converting library
select text in pdf file; how to make a pdf file text searchable
C# PDF replace text Library: replace text in PDF content in
The following demo code will show how to replace text in specified PDF page. PDFDocument doc = new PDFDocument(inputFilePath); // Set the search options.
select text in pdf; convert pdf to searchable text online
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 126 of 140 
Make output format dynamic 
If  a  workflow  must  have  the  ability  to  convert  to  different  file  formats, 
depending on a workflow parameter or column value, then you cannot use the 
normal drop down menu to pre-select the output format. Instead specify the 
following XML, position the cursor after <Format> and add a reference to the 
field that holds the output format, e.g. XLS, PDF, DOCX etc. 
Convert MS-Word files with different revision tracking options 
MS-Word files support revision tracking, which is ideal for visualising what has 
changed in a  document.  By  default  the  PDF  Converter  displays the Final 
version of the document and doesn
’t show the individual revisions. However, 
in some situations you may want to display these revisions and control how 
they are displayed (in-line or in balloons). 
The XML to override these settings is as follows 
<ConverterSpecificSettings type="ConverterSpecificSettings_WordProcessing"> 
The possible values for RevisionsAndCommentsMarkupMode are: 
InLine: Show all revisions Inline. 
Balloon: Show all revisions in balloons. 
Mixed: Show only comments and formatting in balloons. 
The possible values for RevisionsAndCommentsDisplayMode are: 
FinalShowingMarkup: Show the document with all proposed changes 
Final: Show the document with all proposed changes included. 
OriginalShowingMarkup: Show the original document with all proposed 
changes highlighted. 
Original: Show the document before any changes were made. 
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 127 of 140 
Trim page numbers when converting to PDF 
In some situations you may not be interested in all pages of the converted file, 
e.g you only want to convert the cover page (Page 1). To achieve this just set 
the StartPage and EndPage to 1 as follows: 
Specify ‘open’ passwords for secured documents
If your MS-Word files have been saved using a password then these files 
cannot  be  converted.  However,  if  the  password  is  known  then  it  can  be 
specified as follows. 
Disable refreshing of content 
By default the PDF Converter refreshes all content in an MS-Word file, e.g. 
embedded fields, table of contents, smart parts, etc. If this is not desired then 
specify the following XML: 
Specify PDF profile, e.g. PDF/A or a specific PDF Version 
The PDF Converter provides full support for PDF/A output (See Administration 
Guide), however if you want to use it from workflows it is an all or nothing 
approach using a flag in the configuration file. To control PDF/A on a request 
by request basis either use our Web Services Interface or the following XML: 
<!-- Set the output profile --> 
<!-- Force post processing --> 
<OutputFormatSpecificSettings type="OutputFormatSpecificSettings_PDF"> 
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 128 of 140 
This will make sure that all converted files conform to the PDF/A standard. 
However, if the source file is already in PDF format, and needs converting to 
PDF/A, then the SkipPDFFiles setting will need to be disabled
The PDFProfile element supports the following values, please note that the 
use  of  this  functionality  requires  a  Muhimbi  PDF  Converter  Professional 
PDF_A1B: Use the PDF/A1b standard for long term archiving.  
PDF_A2B: Use the PDF/A2b standard for long term archiving. 
PDF_1_1: PDF 1.1 output (Compatible with Acrobat 2.0 (1994) and later).   
PDF_1_2: PDF 1.2 output (Compatible with Acrobat 3.0 (1996) and later).  
PDF_1_3: PDF 1.3 output (Compatible with Acrobat 4.0 (2000) and later).  
PDF_1_4: PDF 1.4 output (Compatible with Acrobat 5.0 (2001) and later).  
PDF_1_5: PDF 1.5 output (Compatible with Acrobat 6.0 (2003) and later).  
PDF_1_6: PDF 1.6 output (Compatible with Acrobat 7.0 (2005) and later).  
PDF_1_7: PDF 1.7 output (Compatible with Acrobat 8.0 (2006) and later).  
Change conversion range 
Some document formats such as Excel and PowerPoint allow sheets to be 
hidden. By default the PDF Converter converts all Visible Sheets / Slides, but 
perhaps you are only interested in the Active / Selected spreadsheet. This can 
be controlled using the following XML: 
The possible values for Range are: 
VisibleDocuments: Skips, in case of Excel and PowerPoint, any hidden 
tabs or slides. 
AllDocuments: Export all tabs or slides in a workspace.  
ActiveDocuments: Exports, in case of Excel, the selected tabs 
Specify Converter Specific Settings 
Quite  a  few  of  our  converters  support  settings  that  are  specific  to  that 
particular file  format. For  an example  see  the  Revision  Tracking example 
above. Although enhancements are made all the time, at the time of writing 
the following Converter Specific Settings are available. 
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 129 of 140 
For more detail see the Class Diagrams in the Developer Guide. 
Specify Viewer Preferences 
As of version 7.0 the PDF Converter allows PDF Viewer Preferences to be 
specified, e.g. Center the PDF Reader Window, Hide the Menu and Toolbars, 
display the bookmarks pane, etc. For full details see this blog post
An  example  that  shows  how  to  set  these  preferences  is  provided  below. 
Naturally it can be combined with the other ‘overrides’ discussed previously.
<OutputFormatSpecificSettings type="OutputFormatSpecificSettings_PDF"> 
Control Font Embedding, PDF Version, PDF Fast Web View 
As of version 7.0 a number of facilities have been added to the PDF Converter 
Professional add-on license. These features allow fonts to be  embedded / 
stripped, Fast Web View (Linearisation) to be enabled and the PDF Version to 
be changed (anything between PDF 1.1 and 1.7, including PDF/A1b and A2b). 
For details see this blog post
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 130 of 140 
An example that shows how to specify these new features using the XML 
based  override  syntax  can  be  found  below.  Please  make  sure  that 
PostProcessFile is set to true in order to pick up these settings. 
<OutputFormatSpecificSettings type="OutputFormatSpecificSettings_PDF"> 
Specifying which InfoPath views to convert 
As mentioned in the MS-Word revision tracking example above, it is possible 
to specify Converter Specific Settings.  
In this example we’ll show how to use 
this  facility  to  specify which  InfoPath  views to convert. The same  can be 
achieved at design time
or by setting workflow variables
, but the example 
provided  below  allows  view  names  to  be  specified  at  run-time  and  only 
requires a single workflow step. 
Let’s have a look
at the code needed for doing the same via our Web Services 
based object model
(sample code is C#, other languages follow the same 
ConverterSpecificSettings_InfoPath csc =  
new ConverterSpecificSettings_InfoPath(); 
csc.ConversionViews = new InfoPathView[2]; 
csc.ConversionViews[0] = new InfoPathView(); 
csc.ConversionViews[0].Name = "NAME-OF-VIEW1"
csc.ConversionViews[1] = new InfoPathView(); 
csc.ConversionViews[1].Name = "NAME-OF-VIEW2"
// ** As we are overriding settings, we need to override ALL of them 
csc.ConvertAttachments = true; 
csc.AutoTrustForms = false; 
csc.ProcessFullTrustForms = true; 
csc.StripDataObjects = true; 
csc.StripDotNETCode = true
conversionSettings.ConverterSpecificSettings = csc; 
What is important to realise is that when specifying ConverterSpecificSettings
it  is essential  that ALL values are specified  as  fields that are not  will be 
initialised to their default value. The default value for a boolean field is ‘false’, 
which in this example would mean that attachments are not converted and 
InfoPath Data Objects are not stripped. Change these values in line with your 
needs, but unless you are 100% sure what each value means, keep them as 
specified in this example. 
When serialising the code into XML we get the following: 
<ConverterSpecificSettings type="ConverterSpecificSettings_InfoPath"> 
Documents you may be interested
Documents you may be interested