pdf library c# : Exporting pdf data to excel Library application component asp.net azure windows mvc PDF-Converter---User-Guide-(1)5-part1780

PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 51 of 140 
10.3  Merging files Using a Nintex workflow 
Similar to all other Nintex Activities provided by Muhimbi, the Merging files 
(and URLs) to PDF activity integrates with Nintex Workflow at a deep level. It 
supports SharePoint 2007, 2010 and 2013, allows errors to be handled and 
even supports integration with Nintex’ iterators to deal with multiple items and 
loops. For  a comprehensive example and details about how to enable the 
Nintex Workflow integration see Chapter  4.  You may also  want  to look  at 
section  10.2  for  a  tutorial  about  a  similar  SharePoint  Designer  workflow 
activity. 
The fields supported by this Workflow Activity are as follows: 
Destination Path: Enter the path to write the merged file to, either:  
o
Leave it empty to use the same filename (and path) as the file that 
triggered the workflow.  
o
A relative path to a subsite / document library / folder, e.g. Shared 
Documents/Some Folder/Some File.pdf. 
o
An  absolute  path  to  a  different  site  collection,  e.g. 
/sites/Finance/Shared Documents/Some Folder/Some File.pdf. Please 
make sure the path does not include the host name, e.g
. µhttp://your 
site/…¶.
For details see Appendix - Specifying path and file names
Source Files: This field specifies the list of documents to merge (and 
convert if needed). Each file must be specified on a new line and each line 
may contain 
three ‘;’ separated values:
o
File Path: The path to the file, or URL, to merge. This may already be 
a PDF file, but if not 
and the file format is supported by the converter 
then it will be converted first. The path can be relative to the current 
site  (e.g. Shared Documents/Some File.docx or  absolute 
(e.g. /sites/Finance/Shared 
Documents/Some 
Folder/ 
Exporting pdf data to excel - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
using pdf forms to collect data; pdf data extractor
Exporting pdf data to excel - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
vb extract data from pdf; java read pdf form fields
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 52 of 140 
Some  file.docx). Nintex Workflow References are fully supported, 
which can be used to dynamically generated the path for the current 
file,  e.g. {ItemProperty:FileLeafRef} Some  string  manipulation  to 
generate the exact path to the file may be needed. When specifying a 
file please make sure the path does not include the host name, e.g. 
µhttp://your site/…¶.
When converting a web page then the path MUST 
start with http:// or https:// 
o
Include  Bookmarks: The source file may already include PDF 
Bookmarks, or may be able to generate such bookmarks as part of the 
conversion process, e.g. an MS-Word file. Specify true  to copy these 
bookmarks to the merged PDF file, or false to strip out any bookmarks. 
This value is optional 
o
Custom Bookmark value: The Bookmark field (see below for details) 
can be overridden using the third parameter. Specify the content of the 
‘top level bookmark’ for the file, specify "" to remove the bookmark for 
this document or don’t specify anything at all to use the value stored in 
the content specified in the Bookmark field.  
Bookmark: In a way similar to the User Interface for the merge facility 
(see 10.1), it is possible to specify a name of the column, or any kind of 
Nintex  Reference,  which  contents  will  be  used  to  populate  the  PDF 
Bookmark  for  the  merged  document.  For  example,  specifying 
Name or Title (using the appropriate Nintex Workflow Syntax) makes it 
very easy to jump between the various sections of the merged PDF file. 
PDF List ID: If you wish to carry out further actions on the generated PDF 
file, e.g. merge additional documents or perform a check-in, then you can 
optionally write the ID of the List the PDF was written to in a workflow 
variable of type String
PDF List Item ID: Similarly to PDF List ID, the Item ID of the generated 
PDF file can optionally be written to a workflow variable of type Item ID  (in 
SharePoint 2007) or Integer (in SharePoint 2010 / 2013). 
Source  List  ID  &  List  Item: The item that triggered the workflow is 
merged by default. You can optionally specify the ID of a different List and 
List Item using workflow variables. Please use the same data types as 
used by PDF List ID and PDF List Item ID
Error  Handling: 
Similar  to  the  way  some  of  Nintex’  own  Workflow 
Activities  allow  errors  to  be  captured  and  evaluated  by  subsequent 
actions, all of Muhimbi’s Workflow Activities allow the same. By defaul
t this 
facility is disabled meaning that any error terminates the workflow. 
C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
PDF Library in C#.NET Class. Best C#.NET PDF to Microsoft Office Word converter SDK for exporting PDF to Word in Visual Studio .NET.
extracting data from pdf forms; how to type into a pdf form in reader
C# PDF Convert to SVG SDK: Convert PDF to SVG files in C#.net, ASP
without quality loss. C# sample code for quick integration in .NET framework program for exporting PDF from SVG. In some situations
how to make a pdf form fillable in reader; extract data from pdf form to excel
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 53 of 140 
10.4  Merging files Using a K2 workflow 
This section describes the Merge Documents method provided by 
Muhimbi’s 
K2 SmartObjects. For a detailed tutorial about how to use the PDF Converter 
from K2 see sections 5.2 (K2 Studio) and 5.3 (K2 Designer).  
10.4.1  Prerequisites 
Before  creating the  workflow,  please  make sure  Muhimbi’s K2 Integration 
facilities  have  been  deployed  as  described  in  the  Administration  Guide, 
Appendix 
Deploying K2 Integration facilities. Basic knowledge of creating 
workflows in K2 Studio / Designer, and having the privileges, is assumed. 
This  section  was  written  based  on 
SharePoint  2010.  Muhimbi¶s  PDF 
Converter for SharePoint integrates equally well with SharePoint 2007 & 2013, 
but  the  actual  steps  for  creating  K2  workflows  differ  in  each  SharePoint 
version, particularly in SharePoint 2013. Please refer to  K2¶s tutorials and 
documentation for your particular environment. 
10.4.2  The Merge SmartObject Method 
The Merge Documents method can be added to a workflow by dragging the 
standard K2 SmartObject 
Event onto the workflow’s design surface. Use the 
SmartObject Wizard’s Context Browser to add 
Environment tab / SmartObject 
Server(s) / SmartObject Server / Muhimbi / Muhimbi Document Converter for 
SharePoint / Methods / Merge Documents into PDF
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
Free evaluation library for exporting PDF to Text in both C#.NET WinForms application and ASP.NET WebForms. RasterEdge.XDoc.Excel.dll. RasterEdge.XDoc.PDF.dll.
pdf form save with reader; extract data from pdf table
C# PDF Convert to Images SDK: Convert PDF to png, gif images in C#
NET. Support exporting PDF to multiple image forms, including Jpg, Png, Bmp, Gif, Tiff, Bitmap, .NET Graphics, and REImage. Support
extract data from pdf forms; filling out pdf forms with reader
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 54 of 140 
The fields are as follows: 
1. SharePoint Site URL: 
Similar to K2’s other SharePoint SmartObjects and 
Wizards, the URL of the site collection the workflow is acting on must be 
specified. This value can be hardcoded, but the better solution is to use 
the Context Browser to select the Process/Activity Data tab (the 3
rd
one) 
and  navigate  to XML Fields / [Your Project Name] / EventDetails / 
EventDetails / Site URL. 
2. Bookmark Field: In a way similar to our User Interface for merging file 
(See 10.1), it is possible to specify a column name which will be used to 
populate PDF Bookmarks. For example, specifying Name or Title makes it 
very easy to use a PDF Reader’s Bookmarks pane to navigate between 
the various sections of the merged PDF file. 
3. Destination URL: The path and file name to write the merged file to. For 
details about how to specify paths in Muhimbi’s softwar
e see Appendix - 
Specifying path and file names
4. Source Documents: This field specifies the list of documents to merge 
(and convert if needed). As K2 Studio does not support line breaks, files 
are separated using pipes ( | ) surrounded by a single space, each file may 
optionally contain three ‘;’ separated values:
a. File Path: The path to the file, or URL, to merge. This may already be 
in PDF format, but if not 
and the file format is  supported by  the 
converter 
then it will be converted first. The path can be relative to 
the current site (e.g. Shared Documents/Some File.docx) or absolute 
(e.g. /sites/Finance/Shared Documents/Some Folder/Some file.docx). 
When specifying a file please make sure the path does not include the 
host name, e.g. µhttp://your site/…¶. When converting a web page then 
the path MUST start with http:// or https://. For details about how to 
specify paths see Appendix - Specifying path and file names
b. Include Bookmarks: The  source  file  may  already  include  PDF 
Bookmarks, or may be able to generate such bookmarks as part of the 
conversion process, e.g. an MS-Word file. Specify true  to copy these 
bookmarks to the merged PDF file, or false to strip out any bookmarks. 
This value is optional. 
c. Custom Bookmark value: The Bookmark Field parameter  (see 
above for details) can be overridden using the third parameter. Specify 
the content of the ‘top level bookmark’ for the file, specify "" to remove 
the bookmark for this 
document or don’t specify anything at all to use 
the value stored in the content specified in the Bookmark parameter.  
Although a merge list will typically be generated by looping over files using a 
workflow,  the end result passed into the Source Documents field  will look 
similar to: 
Shared Document/file1.docx | Shared Document/file2.pdf | … etc 
Or 
SomeLib/file1.docx;true;Introduction | SomeLib/file2.msg;;Summary 
How to C#: Basic SDK Concept of XDoc.PDF for .NET
as annotation creating, deleting, modifying, importing, exporting, and so on. and events necessary to load a PDF document from file or query data and save
how to fill out a pdf form with reader; how to extract data from pdf file using java
VB.NET PDF: Basic SDK Concept of XDoc.PDF
as annotation creating, deleting, modifying, importing, exporting, and so on. and events necessary to load a PDF document from file or query data and save
how to type into a pdf form in reader; pdf form data extraction
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 55 of 140 
10.5  Merging files Using a web Service call 
For a detailed example about how to convert and merge multiple files using 
Muhimbi’s powerful web services interface see 
this Knowledge Base article
C# Create PDF from images Library to convert Jpeg, png images to
Create PDF from images in both .NET WinForms and ASP.NET application. .NET converter control for exporting high quality PDF from images in C#.NET.
how to extract data from pdf to excel; extract data from pdf to excel
VB.NET PDF - Convert PDF with VB.NET WPF PDF Viewer
Data. Data: Auto Fill-in Field Data. Field: Insert PDF, VB.NET Word, VB.NET Excel, VB.NET part illustrates some conversion tabs and features for PDF exporting.
cannot save pdf form in reader; save data in pdf form reader
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 56 of 140 
11  Splitting PDFs into multiple documents 
The PDF Converter comes with the ability to split PDF files up into multiple 
files using either a SharePoint Designer workflow or a Web Service call.  
The key features of the PDF splitting facility are as follows: 
1.  Split a single PDF file into one or more individual PDF files.  
2.  Split based on the number of pages or PDF bookmarks.  
3. 
Automatically  generate  numbered  file  names  using  .NET’s  formatting 
syntax, e.g. 'split-{0:D3}.pdf' will use 3 digits for the sequential numbers 
starting at ‘split
-
001.pdf’. When splitting b
y bookmark then an optional {1} 
parameter can be inserted in the file name to include the name of the 
bookmark as well.  
4.  Can be combined in combination with other actions, e.g. convert & merge.  
A note about splitting based on bookmark levels: PDFs store bookmarks at 
the page level, so it is not clear on what part of the page a heading starts or 
ends. As a result an extra page will always be exported for each file split 
based on bookmark levels. 
For example let’s assume the following document:
Page 1: Contains chapter 1 and sections 1.1. and 1.2.  
Page 2: Contains the last paragraph of 1.2 and all of chapter 2.  
Page 3: Contains Chapter 3.  
When splitting this document based on bookmarks using ‘1’ as the batch size 
then the following files will be created: 
File 1: Contains page 1 and 2 as expected.  
File 2: Contains pages 2 and 3 even though Chapter 2 is only really part 
of page 2. This is because there is no way to know if Chapter 2 runs over 
into page 3 or not.  
File 3: Contains Chapter 3.  
11.1  Splitting files Using a SharePoint Designer workflow 
In  this section we’ll  show 
how to use a  SharePoint  Designer Workflow to 
automatically split  up  an  existing  PDF  file into multiple files containing  10 
pages each. This is quite a common scenario for organisations that deal with 
massive documents who frequently split up these kind of files in batches of 
100 pages to keep the files manageable. If your document is using a format 
other  than  PDF  then  make  sure  your  use  our Convert to PDF Workflow 
Activity first as described in section 3. 
C# WPF PDF Viewer SDK to convert and export PDF document to other
Data. Data: Auto Fill-in Field Data. Field: Insert PDF, VB.NET Word, VB.NET Excel, VB.NET part illustrates some conversion tabs and features for PDF exporting.
extract data from pdf form; online form pdf output
VB.NET Create PDF from images Library to convert Jpeg, png images
REImage. .NET converter control for exporting high quality PDF from images. Turn multiple image formats into one or multiple PDF file.
extracting data from pdf files; can reader edit pdf forms
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 57 of 140 
The SharePoint Designer Workflow Activity is named Split PDF. After adding it 
to your workflow you will see the following Workflow Sentence.  
The workflow sentence is consistent with our other Workflow Activities and is 
largely self-describing. The following fields are available: 
This document: The document to split up. For most workflows selecting 
Current  Item will suffice, but some custom scenarios may require a 
different item to be looked up. You may also want to check that the file 
type 
of the document is ‘pdf¶
before trying to split it up.  
This file: The name and location the split files will be written to are stored 
in this value. Leave this field empty to use the same folder and file name 
as the source file, but with sequential numbers added. However, you can 
optionally specify a path and / or filename template.  
o
Path: Enter a path, including the Document Library and any folder 
names, to write the split files to. E.g. “
shared documents/split files/
”. 
You can even specify a different site collection by starting the path 
with a '/' (never start with 'http:'!
). When just specifying a path, without 
the file name, then make sure to use a trailing ‘/’. 
o
File Name: The file name can be anything and allows the standard 
.NET string formatting facilities for numbering, e.g. 'split-{0:D3}.pdf' will 
use 3 digits for the sequential numbers starting at ‘split
-
001.pdf’. When 
splitting by bookmark then an optional {1} parameter can be inserted in 
the file name to include the name of the bookmark as well.  
Number of pages / bookmark level: Specify if you wish to split based on 
the number of pages or the level of the bookmark .  
Batch  size: When splitting based on the number of pages then this 
parameter must be set to the maximum number of pages to include in 
each  split  file.  When  splitting  based  on  the  bookmark  level  then  this 
parameter should contain the ‘depth’ at which to split. E.g. specify ‘1’ to 
split on top level chapters (Chapter 1, chapter 2, etc.) or a higher number 
to split at a deeper level (e.g. ‘2’ splits on Chapter 1, 1.1, 1.2, 2, 2.1 etc.) 
Output 
Parameter ‘List ID’:
The ID of the list the split files were written 
to. This can later in the workflow be used to perform additional tasks on 
the file such as performing a check-in or out.  
Output 
Parameter ‘List Item IDs’:
Unlike our other workflow activities, 
this parameter will return a string with ‘;’ separated values of the generated 
item IDs. This list can then be used by other (custom) activities, e.g. the 
ones created by our Workflow Power Pack
, to process the individual files 
further.  
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 58 of 140 
With all the theory out of the way, let’s create a simple example to split up 
PDF files in batches of 10 pages. . 
1.  Make sure you have the appropriate privileges to create workflows on a 
site collection.  
2.  Create a new workflow using SharePoint Designer.  
3.  Associate the workflow with the library of your choice. Do not tick any of 
the boxe
s next to the ‘Automatically start….’ options, we want to start this 
workflow manually. If you wish to run this workflow automatically then you 
may want to add an extra column to determine if a file has been split 
before,  similar  to  the  technique  used  in  14.1 Secure PDFs using 
SharePoint Designer Workflows
4.  Design the workflow as per the following screen. In summary it does the 
following:  
o
Check if the file is in PDF format. Otherwise it cannot be split.  
o
The ‘split’ files are written to a folder named ‘Split Files’ so make sure 
this folder exists. e.g. "Shared Documents/Split Files/spf-
{0:D5}.pdf”
You can leave our sample file name or merge the file’s name in using 
workflow lookups.  
o
Log the generated list of Item IDs to the workflow history.  
Publish the workflow and create / convert / upload a PDF file in the document 
library. From the file's context menu select 'Workflows' and run your workflow. 
Depending on the size of the document the split files will be generated in a 
matter of seconds 
11.2  Splitting files Using a web Service call 
For  a  detailed  example  about  how  to  split  PDFs  into  multiple  files  using 
Muhimbi’s powerful web services interface see 
this Knowledge Base article
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 59 of 140 
12  Converting HTML and web pages to PDF format 
As of version 4.0 the PDF Converter comes with the ability to convert HTML 
fragments as well as entire web pages to PDF format, either manually, via a 
SharePoint Designer workflow, Nintex Workflow or via a Web Service call.  
12.1  Manually converting a web page 
When the Muhimbi.PDFConverter.ConvertWebPage.Site  feature  is  enabled 
on a site collection then an option to convert the current web page to PDF 
format is automatically added to the Personal Actions menu. 
Select this option to convert the current page and download it as a PDF file. 
This is perfect for quickly saving a list or web page as a PDF file. 
Please  note  that  due to  excessive  use  of Dynamic  HTML and JavaScript 
some SharePoint 2010 pages may not convert as expected. SharePoint 2007 
does not suffer from this problem. 
The default page size, orientation, margin and scale mode can be set in the 
Service’s  confi
 file.  For  details  see HTML Specific switches  in  the 
Administration Guide, subsection Tuning the Document Conversion Settings
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 60 of 140 
12.2  Converting HTML / web pages using SPD Workflows 
The  PDF  Converter  for  SharePoint  ships  with  a  separate  SharePoint 
Designed Workflow Activity that allows HTML fragments or web pages to be 
converted  to  PDF  format.  This  chapter  contains  an  example  of  how  this 
functionality can be used to convert a SharePoint list to PDF format. This is 
only an example, the Workflow Activity can be used to convert any Web Page 
to PDF format and is not just limited to SharePoint pages
6
The latest version of this tutorial can be accessed from the Muhimbi Blog at 
http://blog.muhimbi.com/2010/08/converting-sharepoint-lists-to-pdf.html
In this example we use a simple Tasks list, so open your SharePoint site and 
create a Tasks lists if one doesn’t already exists.
Next up we need to create a page that displays all items in the list with as little 
of the SharePoint User Interface around it as possible. We could just use the 
list’s default view, but that would convert the Quick Launch menu to PDF as 
well, which doesn’t look very clean. To create a new page without the Quic
Launch menu follow these steps: 
1.  Navigate to the View All Site Content screen and click the Create button.  
2.  In the Web Pages column select Web Part Page.  
3.  Name the page PDFTasks.aspx, choose the Full Page, Vertical template 
and click the Create button.  
4.  On the newly created page click Add a Web Part and add the Tasks list.  
5. 
Click the newly inserted Web  Part’s 
Edit button and select the  Modify 
Shared Web Part option.  
6.  Click Edit the current View and select the columns you want to be included 
in the  PDF  file.  For  example % Complete, Due Data, Start Date and 
Status. Do not close the screen yet.  
7.  Under the Item Limit section set the limit to an appropriately large number. 
We don’t want to page through the data in batches as we want to include 
all items in the PDF file.  
8.  Click OK to save the changes.  
9. 
Save the page’s URL as we need it later. E.g. 
http://moss/sites/Management/FormServerTemplates/PDFTasks.aspx. 
This new page will be used as the underlying layout for the PDF document. 
Feel free to modify it further in SharePoint designer / JQuery and remove 
more parts of the SharePoint user interface. You could also consider creating 
a minimalistic master page and applying that to the new PDFTasks page.  
6
Please note that the default page size, orientation, margin and scale mode can be set in the Muhimbi 
Service’s config file. For details see 
HTML Specific switches in the Administration Guide, subsection 
Tuning the Document Conversion Settings
Documents you may be interested
Documents you may be interested