how to upload only pdf file in asp.net c# : Convert pdf to searchable text application Library cloud windows asp.net html class PDF-Converter---User-Guide-(1)3-part492

PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 31 of 140 
EventDetails.ListItemRelativeURL) are available from the Context Browser 
in K2 Studio, but in K2 Designer we have to manually create them. The 
steps are as follows: 
a.  In K2 Designer select File / Configure Workflow Settings / Data Fields
b.  Click the Add button and specify SiteURL as the name. 
c.  Although we could use a complex regular expression to determine this 
value at run time, let’s keep it simple and specify the URL to the site 
collection as the Default Value. In our case http://portal.denallix.com/
(including the trailing slash!). 
d.  Click OK and add another Data Field named ListItemRelativeURL. 
e.  Accept the default settings, click OK and OK again to close the Data 
Fields dialog. 
f.  Hover  the mouse over the Start  line in the  designer,  a button  will 
appear, click it and confirm the question to add a new step. 
g.  Select the Workflow Steps tab in the ribbon and drag the Set Data 
Fields activity onto the newly created step. 
h.  We already know the SiteURL, but we need to calculate the value of 
the ListItemRelativeURL by taking Document Context.Document URL 
and removing the SiteURL from the beginning. This is not difficult, just 
a bit fiddly. 
i.  In the Context Browser open Inline Functions / Text and drag the 
Mid(Text,Start) on top of ListItemRelativeURL
ii.  In the Editor that is opened drag and drop Document Context / 
Document URL onto the Text field. 
iii.  Drag and drop Inline Functions / Text / Length  onto the Start field. 
iv.  In the Editor that is opened drag and drop Data Fields / Site URL 
onto the Text field. 
v.  Click OK in the various Edit windows and verify that the Set Data 
Fields Wizard looks as per the screenshot below. 
vi.  Click Finish to continue 
Convert pdf to searchable text - search text inside PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn how to search text in PDF document and obtain text content and location information
pdf find and replace text; how to select all text in pdf file
Convert pdf to searchable text - VB.NET PDF Text Search Library: search text inside PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn How to Search Text in PDF Document and Obtain Text Content and Location Information in VB.NET application
select text in pdf; pdf find highlighted text
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 32 of 140 
6.  With the required data fields in place, select the SmartObjects tab and 
drag  the Convert Document  smart  object  onto  the  empty  workflow 
container and fill out the fields: 
a. Source URL: The URL of the document to convert. (See Appendix - 
Specifying  path  and  file  names, please make sure that the web 
application name (http://yourwebapp) IS NOT  included. In this tutorial 
we  use  the  previously  calculated  data  field  by  dragging Context 
Browser / Data Fields / ListItemRelativeURL onto the SourceURL field.  
b. SharePoint Site URL: 
Similar to K2’s oth
er SharePoint SmartObjects 
and Wizards, you will need to specify the URL of the site collection the 
workflow is acting on. The steps are identical to specifying the Source 
Url, just select SiteURL from Data Fields
c. Destination URL:  The  optional  path  and  file  name  of  where  the 
converted file will be written to. When left empty the converted file will 
be saved in the same folder as the source file using the same file 
name, just with the extension of the specified file type. This field uses 
the same format and 
rules as the Source URL field. In this tutorial we’ll 
leave this field empty. For details see Appendix - Specifying path and 
file names 
d.  File Type: The extension of the file type we are converting to. In this 
case assign the PDF value. 
e.  Include Meta-Data: In this example we want to copy all meta-data 
available on the source document to the converted document. Please 
accept the default Yes value 
f. Optional Parameters: The Muhimbi PDF Converter is a very powerful 
product that allows many different settings to be specified. It is not 
feasible  to  make  all  of  these  settings  available  via  individual  field 
mappings, which is why we have developed a special XML syntax to 
populate these parameters. For this tutorial leave this field empty, you 
can  find  more  details  in Appendix - Override default conversion 
settings. Please keep in mind that  K2  Designer does not provide 
support  for  entering  line  breaks  in  SmartObject  mappings  so  we 
recommend creating this XML in a regular code editor (or Notepad) 
and copy it from there into the Optional Parameters field. 
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
PDF document conversion SDK provides reliable and effective .NET solution for Visual C# developers to convert PDF document to editable & searchable text file.
search text in pdf using java; text select tool pdf
VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net
& searchable text formats. Support .NET WinForms, ASP.NET MVC in IIS, ASP.NET Ajax, Azure cloud service, DNN (DotNetNuke), SharePoint. Convert PDF document page
find and replace text in pdf; how to select text in pdf
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 33 of 140 
Click Next  followed  by Finish,  this  tutorial  does  not  use  the  return 
properties. 
7.  From the File option in the ribbon select the Deploy option. Click Next 
(twice) followed by Finish
5.3.3  Testing the Workflow 
Verify the workflow  is  working correctly  by  uploading an  MS-Word  file (or 
Excel, MSG, TIFF, PowerPoint or any of the many other formats we support) 
into the Tutorial2 Document Library and manually starting the workflow on the 
file. To manually start a workflow, in SharePoint open the context menu for the 
relevant file and select the Workflows option. 
If all has been configured well, and the workflow has been created correctly 
then - within a few seconds - a PDF copy of the source file should appear in 
the Tutorial2 library. 
5.3.4  Troubleshooting 
If the workflow does not work correctly then either use the Process Overview 
report in K2 Workspace to drill down into the workflow, or - and this is what we 
like to do - insert a Send E-mail step between the Set Data Fields and Convert 
Document steps, and populate the email with the content of the various data 
fields.  By  sending  the  email  to Context Browser / Workflow Context / 
Originator E-mail it is easy to verify that the workflow is actually running and 
get  an  overview  of  what  is  going  on  without  having  to  dive  into  the K2 
Workspace Reports. 
Online Convert PDF to Text file. Best free online PDF txt
PDF document conversion SDK provides reliable and effective .NET solution for Visual C# developers to convert PDF document to editable & searchable text file.
searching pdf files for text; pdf text searchable
VB.NET Image: Robust OCR Recognition SDK for VB.NET, .NET Image
more companies are trying to convert printed business on artificial intelligence to extract text from documents will be outputted as searchable PDF, PDF/A,TXT
find text in pdf files; pdf find text
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 34 of 140 
Converting Documents / web pages using  hyperlinks 
In addition to generating PDF files manually, via workflows and web service 
calls, as of version 4.0 it is also possible to convert documents and web pages 
by simply invoking a URL. This functionality is particularly helpful if you want 
to place a link to a PDF copy of a file anywhere in a web page or in a Data 
View Web Part
The  latest  version  of  this  tutorial  is  available  from  the  Muhimbi  Blog  at 
http://blog.muhimbi.com/2010/09/converting-any-file-to-pdf-using-simple.html
The URL is made up of the following elements: 
_layouts/Muhimbi.PDFConverter/Convert.aspx?Action=ConvertAndDownload
&ListId=your_list_id&ItemId=your_item_id&ConversionURL=url_to_convert 
Action: The action  to carry  out.  Currently the only  supported value  is 
ConvertAndDownload
ListId: The ID (GUID) of the list that contains the item to convert. 
ItemId: The ID of the item to convert. 
ConversionURL: A fully qualified URL of the web page to convert. 
Please specify a combination of ListId / ItemId or the ConversionURL. Mixing 
these parameters is not allowed. 
The best way to illustrate how this can be used is by example. In this example 
we want to make sure that users cannot see the original source files as we 
don’t want them to have access to these documents. Inste
ad they can access 
each file via a special hyperlink that downloads the document in PDF format. 
This  can  be  achieved  in  many  ways,  but  in  this  demonstration  we  use 
SharePoint’s 
Data  View  Web  Part to automatically generate a list of 
documents  and  link  each  document  to  the ConvertAndDownload  facility. 
Some familiarity with SharePoint Designer and the DVWP is assumed. For 
more information see the following resources: 
Your First Data View Web Part
Series on Extending the Data View Web Part
To implement the solution carry out the steps below: 
1.  Make  sure  you  have  access to  a Site Collection,  a Document  Library 
named Shared Documents and a web part page to insert the DVWP on 
(We use the home page named default.aspx). 
2.  Start SharePoint Designer and open the Site Collection to work in. 
3.  Open the web page to add the DVWP to, in our case default.aspx
4.  Select a Web Part Zone to add the DVWP to and choose Insert Data View 
from the Data View menu. 
C# Create PDF Library SDK to convert PDF from other file formats
The PDF document file created by RasterEdge C# PDF document creator library is searchable and can be fully populated with editable text and graphics
how to make pdf text searchable; can't select text in pdf file
VB.NET PDF Convert to HTML SDK: Convert PDF to html files in vb.
Why do we need to convert PDF document to HTML webpage One is that compared with HTML file, PDF file (a not be easily edited), is less searchable for search
how to select all text in pdf; pdf make text searchable
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 35 of 140 
5.  From the newly opened Data Source Library click the Shared Documents 
Library and select Show Data
6.  In the newly opened Data Source Details tab select Name (and any other 
fields you may be interested in) and choose Multiple Items View from the 
Insert Selected Fields as
… dropdown menu.
7.  Any available documents are automatically listed. Click the name of one of 
the  documents  followed  by  the  ‘>’  menu.  Change 
Format  as  Text to 
Format as Hyperlink. 
8.  The previous action opens the Edit Hyperlink screen. Enter the following 
information in exactly this sequence: 
a. Address: 
_layouts/Muhimbi.PDFConverter/Convert.aspx?Action=ConvertAn
dDownload&ListId={$ListID}&ItemId={@ID} 
b. Text to display: {@FileLeafRef} 
9.  After closing the Edit Hyperlink screen you will most likely see an error 
about the ListID variable not being recognised. Choose Parameters from 
the Data View  menu to  automatically  create this ListID parameter and 
immediately close the Data View Parameters screen using the OK button. 
That is all. Click Save in SharePoint Designer and open / refresh the page in 
your web browser. Click on a document’
s link to convert it to PDF format and 
open it in your browser. 
C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
library also makes PDF document visible and searchable on the Internet by converting PDF document file to Use C#.NET Demo Code to Convert PDF Document to
search pdf files for text; search pdf documents for text
C# PDF: C# Code to Draw Text and Graphics on PDF Document
Draw and write searchable text on PDF file by C# code in both Web and Windows applications. C#.NET PDF Document Drawing Application.
make pdf text searchable; pdf editor with search and replace text
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 36 of 140 
 Processing documents using Web Services 
The Muhimbi PDF Converter for SharePoint ships with a powerful, yet friendly, 
web services interface for integration in your own applications. This same web 
service is leveraged  by  all  of Muhimbi’s  SharePoint front end 
facilities  so 
literally all functionality is exposed this way. 
Full  code  samples  for  converting,  watermarking,  securing  and  OCRing 
documents are out of the scope of this document. However, full details are 
available at the following resources: 
1.  Document: Developer Guide
2.  Blog Post: Converting Documents using a web service call
(.NET) 
3.  Blog Post: Converting Documents using a web service call
(
Java WSimport
4.  Blog Post: Converting Documents using a web service call
(Java Axis2) 
5.  Blog Post: Converting Documents using a web service call
(VS2005) 
6.  Blog Post: Converting Documents using a web service call
(PHP) 
7.  Blog Post: Converting Documents using a web service call
(Ruby) 
8.  Blog Post: Watermarking sample
(.NET) 
9.  Blog Post: Watermarking sample
(Java) 
10. Blog Post: PDF Merging sample
(.NET) 
11. Blog Post: PDF Merging sample
(Java) 
12. Blog Post: Split PDF sample
(.NET) 
13. Blog Post: OCR Images / scanned files to PDF
(.NET) 
14. Blog Post: OCR Images / scanned files to PDF
(Java) 
15. Blog Post: Convert PDF to PDF/A using a web service call
16. Blog Post: Specifying PDF Viewer Preferences
17. Blog Post: Set PDF Version, enable Fast Web Views, embed / strip fonts
18. Blog Post: Adding a Table Of Contents
More information and samples can be found in the Muhimbi Knowledge base
VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
Convert PDF to Word in both .NET WinForms and ASP.NET webpage. Create high quality Word documents from both scanned PDF and searchable PDF files without losing
cannot select text in pdf file; pdf select text
C# HTML5 Viewer: Load, View, Convert, Annotate and Edit Word
C# users can convert Convert Microsoft Office Word to searchable PDF online, create multi to add annotations to Word, such as add text annotations to
how to select text on pdf; pdf text search
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 37 of 140 
 Controling which InfoPath views to Export to PDF 
Being  able  to  select  which  views  to  export  is  very  useful  as  quite  often 
different views are used for exporting a form to PDF. Sometimes using the 
Print View is good enough, but other times you need to export a different view 
or multiple views to PDF format. There are even occasions where different 
views are exported depending on the state of the data entered in the form. 
As always, the best way to illustrate this is by example.  
The latest version of this tutorial is available on the Muhimbi Blog
. For details 
about how to specify the view using a workflow see this blog post
8.1  Use a special view for exporting to PDF 
In this scenario we have an Employee Review form with the following 3 views: 
1. Data entry view: A view used for populating data using the InfoPath client 
or Forms Services. This is the default view. 
2. Print View: A special view that is optimised for printing to a network laser 
printer. This is specified as View 1’s Print View.
3. PDF Export view: A separate view that is used to export the InfoPath 
form to PDF format as it contains some information that should only show 
up in exported PDF files. 
As View 1 is the default view and View 2 is the Print View for View 1, under 
normal circumstance the 2nd view is used for exporting to PDF. However, we 
want to use View 3 for this purpose. We can achieve this by starting the name 
of View 3 with “_MuhimbiView”. The Muhimbi PDF Converter will automatically 
detect all views that start with this name, export them all and merge them 
together into a single PDF file. Naturally these views can be hidden from the 
end user by marking them as such. 
This  is  a  great  solution  if  you  know  beforehand  that  you  will  always  be 
exporting the same view(s) to PDF format. 
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 38 of 140 
8.2  Determine at runtime which views to export 
The  previous  solution,  using  view  names  that  start  with  “_MuhimbiView”, 
works  great.  However,  sometimes  you  need  to  export  a  different  view 
depending on the state of the data. 
For example, our Expense Claim form consists of the following Views: 
1. Data Entry View 1: Used by the employee to report expenses. 
2. Data Entry View 2: Used by the manager to add comments and additional 
information. 
3. PDF Export View 1: The view that is used to export the form to PDF 
format before the manager has reviewed the form. 
4. PDF Export View 2: The view that is used to export the form to PDF 
format after the manager has reviewed the form. 
We can implement this by adding a (hidden) text box named “_MuhimbiViews” 
(case sensitive 
and using the default ‘my’ namespace
) to any of the views 
and  populating  it  with  the  name  of  one  or  more  comma  separated  view 
names. The Muhimbi PDF Converter will automatically pick up these names 
and export them to PDF format. If multiple views are specified then they are 
automatically concatenated together. 
In  addition  to  adding  the  “_MuhimbiViews”  text  field  to  the  form,  all  the 
developer of the form needs to do is add a little bit of logic to the Submit event 
to specify in the “_MuhimbiViews” field which view name
(s) to export. 
8.3  View prioritisation rules 
To determine which view or views to export, the Muhimbi PDF Converter uses 
the following prioritisation rules: 
1.  When using the web services interface, any ConversionViews specified in 
the ConverterSpecificSettings property will be converted. If this property is 
not set then the following rules will be used to determine which views to 
convert to PDF. 
2. 
If a field named “_MuhimbiViews” is found anywhere in the InfoPath form 
then the content of this field is used to determine which views to export. 
3.  If the previous field does not exist, is empty or the specified view name 
does not exist then the converter looks at all view names that start with 
“_MuhimbiView”.
4.  If none of the previous options apply then the view marked as the Default 
View is exported. 
Regardless of how a view or views are selected for export, if the selected view 
has a Print View specified than that view is given priority. 
Do not use Muhimbi’s View selection features in combination with InfoPath's 
'Print multiple views' facility. The latter  is given priority when  converting to 
PDF. 
When the final PDF file is assembled then all selected views are included first, 
followed by any converted attachments
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 39 of 140 
 Cross-Converting between document types 
Although the product name refers to PDF Conversion, as of version 6.0 it is 
also possible to cross convert between document types, e.g. doc to docx, xlsx 
to xls and even xls to doc
So, how is this useful? Well, let’s say that you have a large amount of legacy 
Office 97-2003 files, but your company now requires all files to be saved in the 
more modern, and open, Office 2007-2013 formats. By using the  Muhimbi 
PDF Converter you can convert between these formats automatically using a 
SharePoint  workflow,  Nintex  Workflow  or  a  simple  web  service  call 
using Java or .NET. 
Conversion in the other direction is possible as well. For example many users 
in an organisation may still be on Office 2000 or 2003, but those fancy guys in 
IT are saving documents in Office 2013 format, which no-one else can open. 
A simple SharePoint workflow will automatically take care of this and convert 
all files to the desired format. 
Naturally  some thought  needs to be given  to  what  file formats  to  convert 
between. Converting  between  AutoCAD  and  Excel makes little  sense,  but 
from Excel to Word and Word to Excel could be useful. The table listed below 
shows which file formats can be converted between. 
Some points of interest: 
1.  It is now possible to convert InfoPath files to MS-Word, Excel and HTML 
For details see section 9.4. 
2.  Although not displayed in this chart, it is also possible to convert PDF (and 
any other file type) to PDF/A. For details see Appendix - Post processing 
PDF output to PDF/A in the Administration Guide. 
3. 
It  is  even  possible  to  ‘convert’  to  the  same  form
at  as  the  source, 
e.g. docx to docx, but specify additional settings such as a password on 
the document. 
PDF Converter for SharePoint - User Guide
PDF Converter for SharePoint - User Guide - Version  8.0 - 15/10/15 
© Copyright 2015, Muhimbi Ltd 
Page 40 of 140 
9.1  Cross-Converting file types using SharePoint Designer 
Converting a document using SharePoint Designer workflows works similar 
to converting to PDF. The main difference is that for conversion to non-PDF 
formats  the Convert Document Workflow  Activity  is  used  rather  than 
the Convert to PDF one. 
After adding the new activity to a workflow the following Workflow Sentence is 
displayed.  
The workflow sentence is consistent with 
Muhimbi’s 
other Workflow Activities 
and is largely self-describing. 
This  document: The document to convert. For most workflows 
selecting Current Item will suffice, but some custom scenarios (List or Site 
workflows) may require the look up of a different item.  
This  File: An optional filename (and path) to write the converted 
document to. When not specified, the same name as the document that 
triggered the workflow will be used, just with a different extension. Please 
make sure that 
the path does not include the host name, e.g. µhttp://your 
site/…¶.
For more details see Appendix - Specifying path and file names.  
Select file type: Select the type to convert to from the drop down menu. 
Include / exclude meta data: In case of sensitive documents you may 
want to strip any custom SharePoint columns from the file. For example, if 
your document library contains a column named ‘Yearly sales forecast’ 
then you may want to select ‘Exclude’.
Optional  parameters: See Appendix - Override default conversion 
settings. 
Parameter ‘List ID’
: The ID of the list the converted file was written to. 
This can later in the workflow be used to perform additional tasks on the 
file such as performing a check-in or out. 
Parameter  ‘List  Item  IDs’
 At  the  moment  this  workflow  activity  will 
always  generate  a  single output  file.  However,  in  the  future  it  will  be 
possible to generate multiple output files in one go, in which case this 
p
arameter will return a string with ‘;’ separated values of the generated 
item IDs. This list can then be used by other (custom) activities, e.g. the 
ones  created  by 
Muhimbi’s
Workflow Power Pack
 to  process  the 
individual files further. 
A basic sample workflow is included below, by attaching this workflow to a 
Forms Library any InfoPath form saved in it will automatically be converted to 
an MS-Word 2007 file.   
Documents you may be interested
Documents you may be interested