pdf xchange c# : Java read pdf form fields Library SDK class asp.net wpf web page ajax PDF-Converter---User-Guide-(1)11-part1774

PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 111 of 140 
MinimumEntries: For certain, simple, documents that only have one 
or 2 bookmarks, it may not make sense to add a table of contents. Use 
this property to specify the minimum number of entries before a TOC 
is generated. The default value is ‘0’, which will always create a TOC 
regardless of the number of entries.  
PageMargins: Page margins in the format set out below. It defaults to 
a uniform half inch margin. 
"#{dim}" - for a uniform margin or  
"#{dim},#{dim},#{dim},#{dim}" - for individual margins  
- # is numeric value   
- {dim} is dimension. Either empty (meaning inches) or "mm", "in", 
"in.", "inch" or "inches".  
PageOrientation: The orientation used by the TOC. Portrait
Landscape or Default. The Default option uses the same orientation as 
the page following (or preceding) the TOC depending on the value 
specified in Location.  
PaperSize: A named paper size such as A4 or Letter (See MSDN
) or 
a custom size in "{width}{dim}{sep}{height}{dim}" format where: 
- {width} and {height} are numerical values (please use a colon '.' as 
the decimal separator) .  
- {dim} is the dimension which can be 'mm', 'in.' or 'inches'. (It defaults 
to inches when nothing is specified)  
- {sep} separates the width and the height, either 'by', comma (,) or the  
letter 'x' Example: "8.5 in. by 6 in."  
Properties: Optional properties to pass to the XSL template for 
display or processing purposes. For details see below.  
Template: The XSL template (See 17.3) to use for formatting 
purposes. This can either be a string containing all the XSL, a path - 
local to the server running the conversion service - to the location of 
the XSL file, or a URL to the XSL file on a web (or SharePoint) server.  
NameValuePair: A single value that can be passed into the XSL using 
TOCLocation: Used by TOCSettings.Location to determine where the 
TOC should go.  
BookmarkGenerationOption: As explained in XML Source Data (17.2), 
the TOC system is based on the content and structure of PDF Bookmarks. 
It  is  therefore  essential  that  during  the  conversion  of  the  source 
documents ConversionSettings.GenerateBookmarks is set to Automatic.  
Java read pdf form fields - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
save data in pdf form reader; exporting data from pdf to excel
Java read pdf form fields - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
extract pdf data to excel; extract data from pdf using java
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 112 of 140 
Based on the previously described list of classes and properties, adding a 
TOC may sound complex, but nothing could be further from the truth. The 
easiest way to get started is to take our sample code
, add the following code 
and  then  pass tocSettings  into  either ConversionSettings.TOCSettings  or 
//** Create any custom properties that need to be passed into the TOC. 
NameValuePair[] properties = new NameValuePair[2]; 
properties[0] = new NameValuePair() { Name = "title", Value = "Development Guide" }; 
properties[1] = new NameValuePair() { Name = "status", Value = "Draft" }; 
// ** Specify the various TOCSettings 
TOCSettings tocSettings = new TOCSettings 
MinimumEntries = 0
Bookmark = "Table Of Contents"
Location = TOCLocation.Front, 
Properties = properties, 
Template = @"C:\templates\toc.xsl"
// ** Pass the TOC Settings into the conversion 
conversionSettings.TOCSettings = tocSettings; 
You are not limited to our sample code, but it is a good starting point. It is 
even  possible  to  pass  the tocSettings  to  both ConversionSettings. 
TOCSettings AND  MergeSettings.TOCSettings to generate TOCs for each 
individual document in a merge operation, and then add an overall TOC for 
the entire merged document. 
The big question is what to specify in the Template property. Read on for 
17.2  XML Source Data 
To determine what entries to include in the TOC, the conversion service looks 
at the Bookmarks present in the PDF file. If the source file is not already in 
PDF format, it will be converted to PDF and 
where possible 
generate PDF 
bookmarks based on the  internal structure of the document. For example, 
when  converting  an  MS-Word  file  the  various  headings  determine  the 
structure of the PDF Bookmarks.  
Although  in most  cases it  is  not important for  our customers to have any 
knowledge  about the internals of the Muhimbi Conversion  Service,  in  this 
particular  case  -  and  by  design  -  it  is.  Internally,  an  XML  document  is 
generated that represents the content and structure of the PDF Bookmarks, 
this XML document is then transformed using XSL into HTML. It is this HTML 
the language that underpins every website on the internet 
that determines 
the  formatting  of  the  TOC.  Developers  have  full  control  over  the  XSL, 
providing an enormous amount of flexibility. 
Let’s take our 
Administration Guide as an example. When converted to PDF a 
set of nested  PDF  bookmarks  are  created,  which internally  generates  the 
following XML (truncated as it is several pages long ). 
C# PowerPoint: Read, Decode & Scan Barcode Image from PowerPoint
C# PowerPoint: Decode PDF-417 Barcode Image, C# PowerPoint Able to read and decode Intelligent Mail linear NET Document Imaging SDK and Java Document Imaging
collect data from pdf forms; can reader edit pdf forms
.NET Form Processing SDK | Form Processing & Recognition
forms to match known template and read marks, and for provides royalty-free .NET Imaging Form Processing SDK NET Document Imaging SDK and Java Document Imaging
export pdf data to excel; extract table data from pdf to excel
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 113 of 140 
<?xml version="1.0" encoding="utf-8"?> 
<topic title="Administration Guide - TOC" target="[GUID]" level="0" page="1" /> 
<topic title="1 Introduction" target="[GUID]" level="0" page="8"> 
<topic title="1.1 Prerequisites" target="[GUID]" level="1" page="10" /> 
<topic title="1.2 Solution architecture" target="[GUID]" level="1" page="11" /> 
<topic title="Appendix - Licensing" target="[GUID]" level="0" page="69" /> 
<property name="title">Some Document Title</property> 
The  generated  XML  is  fairly  straight  forward,  a  number  of  nested topic 
elements make up the structure. Each element has a descriptive title  attribute, 
level attribute (which matches the nesting level), a page attribute containing 
the page number, and a target attribute which is used for internal processing 
purposes (this example shows [GUID] as it is not relevant). 
Please note: All page numbers in the TOC reflect the physical page number of 
that page in the generated PDF, including the addition of the TOC page itself. 
If the source document(s) already display page numbers, then these may no 
longer be the same as the page number listed in the TOC or their actual page 
number  in  the  generated  PDF.  If  you  wish  to change  the  page  numbers 
displayed  in  the  footer of  a  document  then  please  use  our  watermarking 
facilities (see chapter 13). 
The list of topic elements is followed by a properties section. This section, and 
its contents, consists  of a number  of optional values  that  may  have been 
passed into the request. This allows, for example, the addition of information 
to the TOC to display the document's status, author, title or any other kind of 
information. In this example we are passing in the title of the document. 
17.3  XSL Transformation 
Although  the  XML  document’s  content  may  differ  between  requests,  the 
structure  is  always  the  same.  As  a  result  we  can  use  the XSL industry 
to  convert  the  XML  into  an  attractive  looking  HTML  document. 
Although  XSL  may  look  daunting  to  the  uninitiated,  the  following  sample 
) is a good starting point and can be amended to suit your particular 
needs (or used as is).  
1 <?xml version="1.0" encoding="utf-8"?> 
2 <xsl:stylesheet version="1.0"  
3                 xmlns:xsl="http://www.w3.org/1999/XSL/Transform"  
4                 xmlns:msxsl="urn:schemas-microsoft-com:xslt"  
5                 exclude-result-prefixes="msxsl"> 
7   <xsl:output method="html" indent="yes"/> 
9   <xsl:template match="/toc"> 
10     <html> 
11       <head> 
12         <style type="text/css"> 
13           ul.toc 
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 114 of 140 
14           { 
15               margin: 0; 
16               padding: 0; 
17               list-style: none; 
18           } 
19           ol.toc 
20           { 
21               margin: 0; 
22               padding: 0; 
23               margin-left: 10px; 
24               list-style: none; 
25           } 
26           ul.toc li 
27           { 
28               clear: both; 
29               overflow: hidden; 
30           } 
31           ol.toc li 
32           { 
33               overflow: hidden; 
34           } 
35           span.title 
36           { 
37               float: left; 
38               padding-right: 4px; 
39           } 
40           span.page 
41           { 
42               float: right; 
43               padding-left: 4px; 
44           } 
45           span.dots 
46           { 
47               font-size: 0px; 
48               width:100%; 
49               border-bottom: 2px dotted black; 
50           } 
51           a.toc 
52           { 
53             text-decoration: none; 
54             color: #000; 
55           } 
56         </style> 
57       </head> 
58       <body> 
59         <h1> 
60           <xsl:value-of select="properties/property[@name='title']"/> 
61         </h1> 
62         <br/> 
63         <br/> 
64         <xsl:apply-templates/> 
65       </body> 
66     </html> 
67   </xsl:template> 
69   <xsl:template match="topics"> 
70     <ul class="toc"> 
71       <xsl:apply-templates/> 
72     </ul> 
73   </xsl:template> 
75   <!-- Empty template so properties are not appearing --> 
76   <xsl:template match="properties"></xsl:template> 
78   <xsl:template match="topic[@level='0']"> 
79     <li> 
80       <xsl:element name="a"> 
81         <xsl:attribute name="href"> 
82           <xsl:value-of select="@target"/> 
83         </xsl:attribute> 
84         <xsl:attribute name="class">toc</xsl:attribute> 
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 115 of 140 
85         <span class="title" style="font-weight: 900;"> 
86           <xsl:value-of select="@title"/> 
87         </span> 
88         <span class="page"> 
89           <xsl:value-of select="@page"/> 
90         </span> 
91         <span class="dots"></span> 
92       </xsl:element> 
93     </li> 
94     <ol class="toc"> 
95       <xsl:apply-templates/> 
96     </ol> 
97   </xsl:template> 
99   <xsl:template match="topic"> 
100     <li> 
101       <xsl:element name="a"> 
102         <xsl:attribute name="href"> 
103           <xsl:value-of select="@target"/> 
104         </xsl:attribute> 
105         <xsl:attribute name="class">toc</xsl:attribute> 
106         <span class="title"> 
107           <xsl:value-of select="@title"/> 
108         </span> 
109         <span class="page"> 
110           <xsl:value-of select="@page"/> 
111         </span> 
112         <span class="dots"></span> 
113       </xsl:element> 
114     </li> 
115     <ol class="toc"> 
116       <xsl:apply-templates/> 
117     </ol> 
118   </xsl:template> 
120 </xsl:stylesheet> 
Although this is a standard XSL file, the following sections are of particular 
Lines 12-56: Standard HTML CSS style sheet which controls the look of 
the generated HTML.  
Line 60: Insert a custom property passed into the conversion request. In 
our example the document’s title. 
Line  76: An empty template for the properties element to prevent this 
information from being displayed as a plain list.  
Lines 78-97: XSL template for generating HTML associated with all Level 
0 topics. If you wish to control the generated HTML for a specific level then 
copy the 
template and change the level number to match 
to appropriate nesting level.  
Lines  99-118: XSL Template for all topic levels that do not have an 
explicit template defined.  
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 116 of 140 
If your experience with XML and XSL is limited then we recommend using the 
XSL sample provided above. As can be seen in the following screenshot, the 
results look very good. 
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 117 of 140 
17.4  Testing & Troubleshooting 
Although it is only a basic application, the PDF Converter comes with a handy 
Diagnostics Tool (including full source code) to test the Table Of Contents 
facility. While  this might be merely  a handy  test tool,  not the official user 
interface  for the TOC facility, it  can  be incredibly helpful  in quickly testing 
various XSL template designs before integrating them into your solution. 
To test the XSL and TOC output, enable the Table of Content as per the 
screenshot above, modify the XSL template if needed, specify any optional 
properties, select a file or folder in the WS Convert tab and choose either the 
Convert or Merge button. 
17.5  Generating a TOC from a SharePoint Workflow 
The previous sections explain the underlying TOC mechanism in detail, but 
the  example  uses  the  Muhimbi  API,  which  is  of  little  use  to  SharePoint 
Workflow developers. For an example about how to apply the same concept, 
but generate the TOC from a SharePoint Workflow, see the relevant example 
in Appendix - Override default conversion settings
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 118 of 140 
18  Troubleshooting & Other common tasks 
Although the PDF Converter is a user friendly, robust and intuitive application, 
some questions may arise during the day to day operation of the software. 
This section provides some pointers to answer common questions. 
If you still have questions after reading this chapter then please check out the 
links in chapter 1 Introduction  as well as our comprehensive Knowledge Base
18.1  The PDF Converter functionality is not available 
When the PDF Conversion functionality is not displayed on a file’s context 
menu, or in the Actions menu of the document library, then this may be due to 
the following: 
1.  The PDF Converter has either not been installed on the server or has not 
been activated. 
Please  ask  your  SharePoint  administrator  to  enable the Muhimbi PDF 
Converter on your Web Application. 
2.  The PDF Converter has been installed, but you are using a non-standard 
Document or Forms Library. 
Please ask your SharePoint administrator to consult section 3.5.7 of the 
PDF Converter Administration Guide. 
18.2  Converting documents takes a very long time 
In general the PDF Converter is a very fast application. However, depending 
on the size and complexity of the documents that are being converted, the 
conversion process may take some time. 
When  converting  multiple  large  documents  in  one  go,  you  may  want  to 
consider converting them in batches as the maximum processing time is 30 
minutes, after which an error will be displayed. 
18.3  The PDF file does not look exactly the same as the 
source file 
Although the PDF Converter  for SharePoint converts  documents with very 
high  fidelity  and  reliability,  there  are  some  situations  that  may  cause  the 
converted documents to look different from the source files. The main reasons 
for this are as follows: 
1.  One  or  more  fonts  used  by  the  document  are  not  installed  on  the 
Document Conversion Server. Ask your Administrator to install the correct 
2.  The spacing of the 
characters in InfoPath documents doesn’t look correct. 
Unfortunately InfoPath does not deal well with certain fonts, even when 
these fonts have been installed on the server. Try using a different font or 
create a separate InfoPath Print View
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 119 of 140 
18.4  How can I see who has converted a document? 
Providing SharePoint Auditing is enabled, specifically the Copy and View audit 
types, an audit entry is written for each converted document. 
The entry  is  written to  the audit  log for the  Site Collection the  source file 
belongs to. The following XML is added to each audit entry: 
{0} and {1} are the version number of the source document,  
{2} is the URL to the converted PDF file 
{3} and {4} are the version number of the destination document. 
To  control  auditing  and  view  the  SharePoint  audit  logs  use  Muhimbi 
SharePoint Audit, available at http://www.muhimbi.com/products.aspx
18.5  An evaluation message is displayed in the UI and 
converted documents 
When  an evaluation message  is  displayed  on  each  screen  and  in  each 
converted document then something may be wrong with your license or your 
license has not been installed. Please contact your SharePoint administrator 
who will be able to find additional information in the Administration Guide for 
this product. 
18.6  InfoPath Forms fail to convert 
When InfoPath documents fail to convert then please contact your SharePoint 
administrator and ask him to consult section 3.5 in the Administration Guide. 
18.7  Converting file formats that are not supported 
The PDF Converter supports a large number of source file formats. Support 
for  additional  formats  can  be  added  by  following  the  instructions  in  the 
Administration Guide under Appendix - Creating Custom Converters
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 120 of 140 
18.8  Nintex Workflow Activities are not working as expected 
after upgrading 
If you encounter any Nintex Workflow related issues after upgrading to a new 
version of the Muhimbi PDF Converter for SharePoint then make sure the 
client side browser cache is cleared. If problems persist then please ask your 
SharePoint Administrator to review section 3.5.13 in the Administration Guide. 
18.9  Files uploaded via Windows Explorer do not trigger 
‘Insert’ watermarks
When using the watermarking facilities to  automatically apply a watermark 
when a new file is uploaded then the appropriate event is not triggered by 
SharePoint 2010 when uploading the file using Windows File Explorer. This is 
related to a bug in SharePoint, the Update event is triggered instead. 
As  a  workaround  either  make  sure  all  files  are  uploaded  using  the  web 
browser  or  apply  watermarks  to  new  files  using  a  SharePoint  Designer 
Workflow, Visual Studio Workflow or Nintex Workflow. 
‘Watermark on Open’ does not show watermarks
If the Watermark on Open facility is used and watermarks do not show up 
when opening a PDF file then please check the following: 
If the PDF File was previously opened by a user before this facility was 
enabled, the browser may cache the previous version of the document. To 
solve this problem clear the browser cache. 
The Web Application scoped Feature 
named ‘
Muhimbi PDF Converter - 
Automatic PDF Processor
’ must be enabled. For details 
please ask your 
SharePoint administrator to enable the appropriate feature as described in 
section 2.2.3 of the Administration Guide. 
18.11 Problems converting SharePoint 2010 pages  
Due  to  excessive  use  of  JavaScript  and  Dynamic  HTML  in  the  standard 
SharePoint 2010 user interface, you may need to make some changes to the 
Muhimbi Service’s config if you expect to convert SharePoint 2010 pages to 
For details see the Administration Guide, section 3.5.17. 
18.12 Changing the default merge bookmark and sort fields  
The PDF Converter ships with a powerful facility that allows multiple files to be 
merged together. It even allows fields to be selected to sort files by and use as 
PDF bookmarks. However, the default options (sort by Modified, use Title as 
PDF bookmark) may not be suitable for your purposes. For details on how to 
change this behaviour see section 3.5.18 in the Administration Guide. 
Documents you may be interested
Documents you may be interested