PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 41 of 140 
9.2  Cross-Converting file types using Nintex Workflow 
Similar  to  Muhimbi’s  other  Nintex  Workflow  activities,  the 
Document activity integrates with Nintex Workflow at a deep level. It supports 
SharePoint  2007,  2010  and  2013,  allows  errors  to  be  handled  and  even 
supports integration with Nintex’ iterators to deal with multiple items and loops.
As this Workflow Activity is similar to the generic PDF Conversion Activity it is 
worth looking at the example in Chapter 4 Converting Documents using Nintex 
Workflow. All parameters are identical with the following exceptions: 
Output Format: This field is specific to the Convert Document activity and 
allows the output format to be specified, e.g. doc, xls, pdf, txt, csv, etc. 
Optional  parameters: See Appendix - Override default conversion 
Output  Item  ID: The type of this field is Text rather than Item ID. The 
reason for this is that a future version of the software may return multiple, 
comma separated, values for certain actions. 
Please  note  that you may  need  to  make  some  small  modifications if you 
intend  to  convert  InfoPath  to  Excel,  HTML  or  MS-Word.  For  details  see 
section 9.4 Convert InfoPath to MS-Word, Excel, XPS and PDF. 
9.3  Cross-Converting file types using a Web Service call 
Converting files to non-PDF formats using web service calls works identical to 
converting files  to PDF.  The only difference is that  the Format property  on 
the ConversionSettings object must be set to the file type you are converting 
to. For details see the existing Convert to PDF  sample code in chapter 7 
Processing documents using Web Services
Pdf text search tool - search text inside PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn how to search text in PDF document and obtain text content and location information
search text in pdf image; pdf text search tool
Pdf text search tool - VB.NET PDF Text Search Library: search text inside PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn How to Search Text in PDF Document and Obtain Text Content and Location Information in VB.NET application
search text in multiple pdf; select text in pdf reader
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 42 of 140 
9.4  Convert InfoPath to MS-Word, Excel, XPS and PDF 
The PDF Converter’s cross
-conversion facility opens up a whole new world of 
possibilities such as converting between DOC and DOCX, XLS and XLSX, but 
more  importantly  it  also  supports  conversion  between  completely  different 
document types such as Excel to MS-Word and HTML to Excel. 
This  section  describes  another  new  conversion  type  that  should  be  of 
particular interest to InfoPath users as it is now possible to convert InfoPath 
forms to MS-Word, Excel and HTML.  
Conversion  to these  new formats generally  works very well, but  there  are 
some  limitations  due  to  the  nature  of  these  non-PDF  based  destination 
formats. Specifically: 
1. Attachments: When converting an InfoPath form to PDF the software also 
converts all  attachments and  merges  them  into  the main  PDF.  This is 
possible because you can represent almost any file format in PDF and 
merge them together. Unfortunately this is not possible when converting to 
HTML, MS-Word or Excel. 
2. View Selection: The software provides a number of ways to specify which 
view or views to convert (See chapter 8). When converting to PDF it is 
possible  to  specify  multiple  views,  which  the  converter  then  merges 
together into a single document. When converting to HTML, MS-Word or 
Excel it is only possible to convert a single view as these file formats don’t 
support merging. As a workaround it is possible to 
create a ‘conversion 
specific view’ and co
mbine the content of multiple views in it.  
Print Views are also ignored when converting to HTML, Word or Excel. 
Instead you will need to use 
Muhimbi’s View Selection facilities
if you wish 
to convert any view other than the default View. 
3. Formatting: PDF is a very flexible format that allows any content to be 
placed  anywhere  on  the  page.  MS-Word,  Excel  and  HTML  are  not 
necessarily this flexible. For example, Excel uses a ‘cell based approach’ 
to  display  content.  If  an  InfoPath  form  is  not specifically  designed  for 
export  to  Excel,  e.g.  it  uses  nested  tables  or  different  column  widths 
across  a page, then you may need to  optimise your InfoPath form  for 
conversion, or create a ‘conversion specific view’.
Some hints and tips related to converting to the various non-PDF formats can 
be found below. 
VB.NET PDF- View PDF Online with VB.NET HTML5 PDF Viewer
Easy to search PDF text in whole PDF document. VB.NET HTML5 PDF Viewer: View PDF Online. PDF file is loaded as sample file for viewing on the viewer. Select tool.
convert pdf to searchable text; how to make a pdf file text searchable
C# HTML5 PDF Viewer SDK to view PDF document online in C#.NET
Easy to search PDF text in whole PDF document. C# HTML5 PDF Viewer: View PDF Online. PDF file is loaded as sample file for viewing on the viewer. 1. Select tool.
search multiple pdf files for text; how to make a pdf document text searchable
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 43 of 140 
InfoPath to HTML (MHT) 
When converting InfoPath to HTML the resulting file is a self contained MHT 
file that most modern browsers can display. All information including images, 
HTML and style sheets are included in this single file.  
From left to right, the same Form in InfoPath, converted to PDF and converted to HTML 
As this image shows, InfoPath data can be represented in HTML really well so 
it is usually not needed to make any changes to the XSN file. 
InfoPath to MS-Word 
Depending on how an InfoPath form has been designed, some work may be 
required  to  make  things  look better when  converting to MS-Word. This  is 
mainly  due  to  the  fact  that  MS-Word  does  not  like  dimensions  that  are 
expressed in percentages, while it is common in InfoPath to create a table grid 
and populate that grid with controls that take up 100% of the available cell 
Results when converted to MS-Word before optimisation (left) and afterwards (right). 
C# PDF Text Highlight Library: add, delete, update PDF text
a multifunctional PDF document annotation tool, which can example illustrates how to perform PDF text highlight function NET project, according to search option
how to select text in a pdf; select text in pdf file
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
Raster Edge XDoc.PDF SDK is such an extraction tool can be installed easily in VB.NET application, the extraction process will be greatly simplified.
how to search a pdf document for text; select text pdf file
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 44 of 140 
Looking at the ‘before optimisation’ conversion results in the image displayed 
above, there are 2 things that stand out: 
1. Dimension of text fields: The dimensions of most text fields are not quite 
right.  This  can  easily  be  changed  by  opening  the  form  in  InfoPath 
Designer and chan
ging the width of the various fields from ‘100%’ to the 
actual dimensions in cm or inches. 
Missing ‘year’ in date picker  fields
:  Due the way the Date Picker is 
structured internally, modifying its width does not translate properly when 
displayed in MS-Word. To solve this, change the date picker field to a 
regular text field either by creating a conversion specific view, or using a 
display rule. 
The InfoPath to MS-Word facility can generate output in doc, docx, rtf, txt, html 
and odt formats. 
InfoPath to Excel 
InfoPath  to  Excel  conversion  for  existing forms  that are not  optimised  for 
conversion to Excel are probably the trickiest ones to get right. If the ‘look and 
feel’ of the Excel sheet 
is not important then no change is required. However, 
if the Excel 
forms need to ‘look good’ then you may need to rethink the way 
the form is designed.  
Results when converted to Excel before optimisation (left) and afterwards (right).
Looking at the ‘before optimisation’ in the image above things don’t look too 
bad, but clearly it is not the same as the original. The main issues are as 
1. Column Widths:  As Excel uses a  cell / grid based approach it  is not 
possible  to  mix  different  column  widths.  The  information  in  the  form’s 
header requires different column width and spans than the columns used 
in the repeating table further down the page. By changing the horizontally 
oriented fields in the header to individual rows we no longer have this 
C# WPF PDF Viewer SDK to view, annotate, convert and print PDF in
Rotate a PDF Page. PDF Read. Text: Extract Text from PDF. Text: Search Text in PDF. Users can add various annotations to PDF, such as text, text box, note
convert pdf to word searchable text; how to search text in pdf document
VB.NET PDF - WPF PDF Viewer for VB.NET Program
copy, paste, C#.NET rotate PDF pages, C#.NET search text in PDF, C# RasterEdge WPF PDF Viewer for VB.NET is a PDF utility annotation generation tool.
find text in pdf image; text searchable pdf file
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 45 of 140 
2. Number formats: 
Depending on a cell’s content
, Excel sometimes tries to 
be ‘clever’. Most of the time this works great, but in this case a field with 
value  ‘007’  is  changed into  a ‘7’. This could  be fixed  by changing  the 
content  of  the  InfoPath  field  into  a  formula  and  concatenating  an 
apostrophe in front of it. 
The InfoPath to Excel facility can generate output in xls, xlsx, csv and ods 
C# PDF Convert to Tiff SDK: Convert PDF to tiff images in C#.net
RasterEdge C#.NET PDF to TIFF converting library control (XDoc.PDF) is a multifunctional PDF document converting tool, which can perform high-fidelity PDF
search pdf files for text programmatically; search pdf for text in multiple files
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
Using our PDF document manipulation APIs, users can easily customize and set the PDF page adding tool to freely choose the specific location of the new page.
pdf text select tool; converting pdf to searchable text format
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 46 of 140 
10  Merging multiple files into a single PDF 
The PDF Converter comes with the ability to merge multiple files,  PDF or 
otherwise, into a single PDF file, either manually using S
harePoint’s UI
, via a 
SharePoint Designer workflow, a Nintex Workflow or via a Web Service call. 
For details about starting each merged document on an odd or even page (for 
the purpose of double sided printing) see this blog post
10.1  Merging files Using the SharePoint User Interface 
Chapter 2 Converting documents using the SharePoint U.I. describes how to 
convert individual as well as multiple files to PDF format. When multiple input 
files  are  selected  the  default  behaviour  is  to  convert  all  files  individually. 
clicking the ‘
Merge Files
’ option 
allows the files to be combined into 
a single PDF file as per the screenshot below. 
You can specify the following options: 
Select the field to use for bookmarks: If you wish you can automatically 
generate  a  PDF  bookmark  for  each  file  that  is  merged.  This  makes 
navigating  through the PDF file  a  lot  easier. You  can  select  any  field 
defined on the document library or ‘–
‘ to skip the bookmarking 
process.  The  default  field  is  ‘
’,  which  usually  contains  the  most 
descriptive data. 
Enabled  /  disable  documents: For each file you can specify if they 
should  be  included in the merged  document  or  not.  This  can be very 
useful when selecting an entire folder to convert and merge. 
VB.NET PDF Text Highlight Library: add, delete, update PDF text
C#.NET rotate PDF pages, C#.NET search text in PDF is a multifunctional PDF document annotation tool, which can sample code shows how to highlight PDF text in VB
text searchable pdf; how to select text in pdf and copy
XDoc.HTML5 Viewer for .NET, All Mature Features Introductions
search text-based documents, like PDF, Microsoft Office Word, Excel, and PowerPoint (2003 and 2007 versions). The well built-in text search tool is compatible
search pdf files for text programmatically; search multiple pdf files for text
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 47 of 140 
Manually  change  bookmark  text: Selecting a field to populate the 
bookmarks  with  will  automatically  generate  the  text  for  each 
bookmark. However, if you wish you can manually change this value to 
anything you like. Please take  into  account  that  any  manually  entered 
values will be overwritten if you select a different bookmark field name. 
Change sequence of documents: By default all documents are ordered 
by  modification  date,  with the oldest  one  on top. You  can change the 
sequence using the up and down arrows. It is also possible to select the 
name of the field to sort by, e.g. the creation date
Include  document  bookmarks: Each source document may already 
have its own bookmarks, e.g. existing PDF Files or MS-Word headings. By 
default these are all stripped out, but if you wish you can select to merge 
the  bookmarks  as  well.  For  each  document  they  will  automatically  be 
moved to sit underneath any custom bookmark name specified for the file. 
Copy meta-data source: Specify which file to copy the meta-data from to 
the generated PDF file. 
Change file name: As we are dealing with multiple files we cannot use 
the name of the source file to generate the destination file name. For the 
merged file we default the file name to the name of the folder the files are 
located in.  If  the files are  in  the root folder then we use the name  of 
the Document Library. You can override the default generated name and 
select a different folder if needed as well.  
Further  operations  such  as  applying watermarks and PDF  security can  be 
carried out as a post processing step using simple workflows. 
Please note that the maximum number of files that can be merged is 200. You 
will  automatically  receive  a  warning  message  when  this  threshold  is 
For details about changing  the default PDF Bookmark and Sort fields see 
18.12 Changing the default merge bookmark and sort fields
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 48 of 140 
10.2  Merging files Using a SharePoint Designer workflow 
In addition to being able to convert and merge files using the SharePoint user 
interface  it  is  also  possible  to  automate  this  activity  using  a  SharePoint 
Designer Workflow. 
In this section we’ll show 
how to create a workflow that automatically adds a 
cover page to a document whenever it is created or updated. If the document 
is not already in PDF Format it will convert the file as part of the merging 
process as well. For a good introduction about using the PDF Converter in 
combination with SharePoint Designer workflows see chapter 3 Converting 
documents via a SharePoint workflow
The SharePoint Designer Workflow Activity is named Merge Documents into 
PDF. After adding it to your workflow you will see the following Workflow 
The following fields are available: 
These Documents: This field specifies the list of documents / URLs to 
merge (and convert if needed). Each file must be specified on a new line 
and each line may contains three ‘;’ separated values:
File  Path: The path to the file to merge or URL of web page to 
convert. This may already be a PDF file, but if not 
and the file format 
is supported by the converter 
then it will be converted first. The path 
can  be  relative  to  the  current  site  (e.g. Shared Documents/Some 
(e.g. /sites/Finance/ 
Shared Documents/Some  Folder/Some  file.docx). SharePoint 
Designer Workflow Lookups are fully supported, which can be used to 
dynamically  generate  the  path  for  the  current  file,  e.g. [%Current 
Item:URL Path%]
In SharePoint 2010 & 2013 always use forward 
slashes in your file path, see KB2529610
. When specifying a file, 
please make sure the path does not include the host name, e.g. 
‘http://your site/…’.
If you wish to convert web pages then the 
path MUST start with http:// or https://. 
Include  Bookmarks: The source file may already include PDF 
Bookmarks, or may be able to generate such bookmarks as part of the 
conversion process, e.g. an MS-Word file. Specify true  to copy these 
bookmarks to the merged PDF file, or false to strip out any bookmarks. 
This value is optional. 
Custom  Bookmark  value: The this field
parameter  (see  below  for 
details) can be overridden using the third parameter. Specify the name 
of  the  ‘top  level  bookmark’  for  the  file,  specify  ""  to  remove  the 
bookmark for this document or don’t specif
y anything at all to use the 
value stored in the column referenced by the this field
parameter. For 
an example see the exercise below. 
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 49 of 140 
This File: An optional filename (and path) to write the merged document 
to. When not specified, the same name as the document that triggered the 
workflow will be used with a ‘.pdf’ file extension.
Please make sure the 
path does not include the host name, e.g. ‘http://your site/…¶.
For details 
see Appendix - Specifying path and file names
This Field: In a way similar to the User Interface for the merge facility (see 
10.1), it is possible to specify a name of the column which contents will be 
used  to  populate  the  PDF  Bookmark  for  the  merged  document.  For 
example, specifying name or title  makes it very easy to jump between the 
various sections of the merged PDF file. 
Variable: List ID: If you wish to carry out further actions on the generated 
PDF file, e.g. perform a check-in, then you can optionally write the ID of 
the List the PDF was written to in a workflow variable. 
Variable: List Item ID: Similarly to List ID, the Item ID of the generated 
PDF file can optionally be written to a workflow variable. 
Let’s create a sample to automatically add a cover page 
to each document. In 
this  example  we  will  use  SharePoint  Designer  2010,  but  the  steps  for 
SharePoint Designer 2007 & 2013 are nearly identical. 
1.  Make sure you have the appropriate privileges to create workflows on a 
site collection.  
2.  Create,  or navigate to, the Document Library that  will be  used  for this 
workflow and add a simple MS-Word file named cover page.docx. This file 
can be in any format and, if its content is static, it is recommend to use a 
PDF file for this purpose so it doesn’t need to be convert
ed repeatedly for 
every merge operation.  
3.  Open SharePoint Designer, open the relevant Site, create a new workflow, 
associate it with the Document Library used in step #4 and enable all Start 
Options to make sure the workflow is triggered when an item is created or 
4.  Add a condition to check that the type  property of the current item does 
not equal pdf. Otherwise the workflow will recursively trigger whenever the 
merged file is written to the same document library. 
5.  Add the Merge Documents into PDF workflow Action and click the these 
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 50 of 140 
6.  Add a line  for the location of the cover  page, note that our Document 
Library  is  named Automatic Merging. There  is  no  need  to  specify  the 
optional Include Bookmark and Custom Bookmark values,  although  you 
can if you wish to.  
7.  The second file to merge is the one that triggered the workflow. Position 
the  cursor  on  the  2nd  line  of  the  String  Builder  and  click  the Add or 
Change Lookup button. Select Current Item as the Data Source and URL 
Path as the Field  from  source. Click  OK to close the 
Lookup  for 
window. We want to include the source document’s bookmarks so 
enter ;true  at the end of the second line.  
Your String Builder should now look similar to the screenshot under step 
#5. Click OK to accept the changes.   
8.  In this example we want the (merged) output file to use the same name 
and path as the source file that triggered the workflow, so there is no need 
to change the this file
9.  Click the this field
parameter and select the field you wish to use for the 
content of the PDF Bookmarks. In this example we’ll select
We  are all  done,  publish  the  workflow and add an  MS-Word  file with  the 
content to merge to the Document Library. After a few seconds a PDF file will 
be created consisting of the cover page and the content. Open the PDF file 
and  use  the  Bookmark  pane  to  quickly  navigate  to  the  start  of  the  2 
Documents you may be interested
Documents you may be interested