how to upload pdf file in c# windows application : Search pdf files for text programmatically software application project winforms html asp.net UWP pdfjunction2011-part572

 U
SING 
PDF
JUNCTION FROM THE COMMAND LINE
3.1  Command Line Syntax 
All operations supported by PDF Junction can be accessed via the command line as shown below. 
Usage:  
cscript pdfjunction.wsf [/jobid:value] /operation:value [/sourcetype:value] [/target:value] 
[/joboptions:value] [/metadata:value] [/security:value] [/docoptions:value] sourcefiles1 
[sourcefiles2...] [/version[+|-]] [/verbose[+|-]] [/debug[+|-]] [/onerrorcontinue[+|-]] [/silent[+|-]]  
Parameter 
Notes 
/jobid:value 
If used, specifies the full path of an XML Job Ticket file saved from the GUI 
or generated by some other means.  Job files in the PDF Junction jobs 
directory may be referred to by a shorthand method of jobname where the Job 
Ticket file is jobname.xml. 
/operation:value 
Must be split, merge, set or get 
/sourcetype:value 
Source type (file, folder, tree).  The default value is file. 
/target:value 
Target directory for result files.  If not specified, the source directory will be 
used as the target. 
/joboptions:value 
Set of options for the specified operation.  Described in detail in section 5.3. 
/metadata:value 
Metadata settings for result PDF files.  By default metadata fields are left 
blank. Described in detail in section 5.4. 
/security:value 
Security settings for result PDF files.  By default files are not secured.  
Described in detail in section 5.5. 
/docoptions:value 
Document option settings for result PDF files. Described in detail in section 
5.6. 
Sourcefiles 
Source PDF file, folder or tree. May be multiple files for merge operations.  
/version 
Provide version and license information 
/verbose 
Verbose progress messages 
/debug 
Debug progress messages 
/silent 
No progress messages 
/onerrorcontinue 
Allow job to continue after errors 
Notes 
1. cscript.exe is required to run the command.  This is usually included in a standard PATH, but if not 
would need to be specified explicitly  
Eg C:\WINDOWS\SYSTEM32\cscript.exe …. 
2. Options that contain spaces will need to quoted.  For example “/target:c:\output files” 
10 
Search pdf files for text programmatically - search text inside PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn how to search text in PDF document and obtain text content and location information
find text in pdf image; search pdf files for text programmatically
Search pdf files for text programmatically - VB.NET PDF Text Search Library: search text inside PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn How to Search Text in PDF Document and Obtain Text Content and Location Information in VB.NET application
search text in multiple pdf; select text pdf file
3.2  Example Commands 
3.2.1  Example jobid Commands 
Run the job specified in the job file C:\jobs\job001.xml : 
cscript pdfjunction.wsf /jobid:C:\Jobs\job001.xml 
Run the job specified in the job file C:\Program Files\PDF Junction\jobs\job001.xml : 
cscript pdfjunction.wsf /jobid:job001 
3.2.2  Example Split Commands 
Split a PDF file, c:\demo\in\demo.pdf  into single page PDF files placed in the directory c:\demo\out 
cscript pdfjunction.wsf /operation:split /joboptions:-s 
/target:c:\demo\out c:\demo\in\demo.pdf 
Split a PDF file, c:\demo\in\\demo.pdf  into single pages, each named demo_split999.pdf where demo 
is the page number.  The files will be placed in the directory c:\demo\out 
cscript pdfjunction.wsf /operation:split “/joboptions:-s –f 
%F%_split%U3%” /target:c:\demo\out c:\demo\in\demo.pdf 
Split a PDF file, c:\demo\in\demo.pdf  by bookmarks.  The files will be placed in the directory 
c:\demo\out and named according to the bookmark. 
cscript pdfjunction.wsf /operation:split “/joboptions:-k –b –f %B%” 
/target:c:\demo\out c:\demo\in\demo.pdf 
Split all PDF files in c:\demo\in  into single page PDF files placed in the directory c:\demo\out\name 
where name is the name of the original pdf file, creating the directories where they don’t exist. 
cscript pdfjunction.wsf  /operation:split /sourcetype:folder  
“/joboptions:-c -s –f %F%/%U%” /target:c:\demo\out c:\demo\in 
Split all PDF files in c:\demo\in and each subdirectory  into single page PDF files placed in the 
directory c:\demo\out\sub\name where sub is the subdirectory name, and name is the name of the 
original pdf file, creating the directories where they don’t exist. 
cscript pdfjunction.wsf  /operation:split /sourcetype:tree  
“/joboptions:-c -s –f %F%/%U%” /target:c:\demo\out c:\demo\in 
11 
C# PDF File Compress Library: Compress reduce PDF size in C#.net
TIFF files compression and decompression method and Image files compression and images size reducing can help to reduce PDF file size Embedded search index.
cannot select text in pdf; searching pdf files for text
C# Create PDF Library SDK to convert PDF from other file formats
a PDF document in C#.NET using this PDF document creating toolkit, if you need to add some text and draw Create PDF Document from Existing Files Using C#.
how to search text in pdf document; pdf find text
3.2.3  Example Merge Commands 
Merge PDF files  demo1.pdf, demo2.pdf, demo3.pdf in c:\demo\in\  into a single PDF file named 
demomerge.pdf in the directory c:\demo\out 
cscript pdfjunction.wsf /operation:merge /target:c:\demo\out 
“/joboptions:-f demomerge c:\demo\in\demo1.pdf c:\demo\in\demo2.pdf 
c:\demo\in\demo3.pdf 
Merge all the PDF files in c:\demo\in\  into a single PDF file named demomerge.pdf in the directory 
c:\demo\out, overwriting the file if it already exists. 
cscript pdfjunction.wsf /operation:merge /sourcetype:folder 
/target:c:\demo\out “/joboptions:-o -f demomerge” c:\demo\in 
Merge all the PDF files in c:\demo\in\ and each subdirectory  into a single PDF file per source 
directory.  The result file will be named dir.pdf where dir is the source directory name, and placed in 
the corresponding directory in c:\demo\out\ 
cscript pdfjunction.wsf /operation:merge /sourcetype:tree 
/target:c:\demo\out “/joboptions:-c -o -f %D%” c:\demo\in 
3.2.4  Example Set Commands 
Note that the set parameters (/metadata /..) can be used with the split and merge commands to set 
characteristics of the result files.  
Creates a copy of c:\demo\in\demo3.pdf with the metadata settings shown, in the directory c:\demo\out 
cscript pdfjunction.wsf /operation:set /target:c:\demo\out 
c:\demo\in\demo3.pdf "/metadata:Author=Tony Bush;Title=A Special 
Document" 
Creates a copy of each PDF file in c:\demo\in\ with a user password of “secret” , with printing  and 
modification of annotations allowed.  The result PDF files are placed in in the directory c:\demo\out. 
cscript pdfjunction.wsf /operation:set /sourcetype:folder /joboptions:-o 
/target:c:\demo\out c:\demo\in "/security:userpassword=Secret; 
permissions=allowprinting,allowmodifyannotations" 
Creates a copy of each PDF file in c:\demo\in\ with viewer preferences set to hide toolbar and to open 
the document showing bookmarks.  The result PDF files are placed in in the directory c:\demo\out. 
cscript pdfjunction.wsf /operation:set /sourcetype:folder /joboptions:-o 
/target:c:\demo\out c:\demo\in "/docoptions:hidetoolbar,pagemodeuseoutlines" 
3.2.5  Example Get Command 
Generates  an XML file with metadata from c:\demo\in\demo3.pdf with the metadata settings shown, in 
the directory c:\demo\out 
cscript pdfjunction.wsf /operation:get /target:c:\demo\out 
c:\demo\in\demo3.pdf “/joboptions:-f %F%_metadata” 
12 
.NET PDF Document Viewing, Annotation, Conversion & Processing
Merge, split PDF files. Insert, delete PDF pages. Read PDF metadata. Search text content inside PDF. Edit, remove images from PDF. Add, edit, delete links.
search pdf for text; cannot select text in pdf file
VB.NET PDF - Convert CSV to PDF
C#.NET rotate PDF pages, C#.NET search text in PDF to batch convert multiple RTF files to adobe PDF files. are able to convert RTF to PDF programmatically with VB
find and replace text in pdf file; pdf text select tool
3.3  /joboption specifications 
3.3.1  Job Options for Split Operations 
Parameter 
Notes 
-b 
Include bookmarks 
-p 
Password for opening document  
-m  
Retain metadata 
-c 
Create result directories if required 
-o 
Overwrite result files if they already exist 
-r range{,range} 
Set of page ranges separated by commas that defines which pages from the 
original should be extracted.  The following types of page ranges are allowed : 
Specifies a single page 
1-3 
Specifies a range of pages 
10-20even 
Specifies even pages within the range 
10-20odd 
Specifies odd pages within the range 
20-lastpage 
Note that lastpage can be used to represent the last 
page in the document. 
-g grouppages 
Apply the page range to each set of grouppages pages within the document.  
For example if –r 2-4 and –e 5 is specified, then the range is re-applied every 4 
pages.  Hence the file is split such that the first output file contains pages 2-4 
from the original document, the second contains pages 6-8 and so on. 
-k  
Split by top-level bookmark  
-s 
Split by single pages (The Default) 
-f string 
Output file name specifier. If –f is not specifed, the default parmeter setting is 
%FILENAME%UNIQUE6% which would give (for example) filename.pdf 
split into filename000001.pdf filename000002.pdf etc. 
%BOOKMARK 
Bookmark title 
%PAGEn 
The first page number from source file, zero padded to 
n digits.  If n is not supplied or is zero, then zero 
padding is not used 
%FILENAME 
Ssource file name without .pdf 
%UNIQUEn 
Unique number starting at 1. If n is supplied, then zero 
padding to n digits is used. If n is not supplied or is 
zero, then zero padding is not used 
%DIRNAME 
Source directory name of the directory currently being 
processed. 
String 
(Any string) 
The .pdf extension is automatically added if not specified. 
13 
C# PowerPoint - PowerPoint Creating in C#.NET
to Create New PowerPoint File and Load PowerPoint from Other Files. searchable and can be fully populated with editable text and graphics programmatically.
search a pdf file for text; convert pdf to searchable text
C# Word - Word Creating in C#.NET
Users How to Create New Word File and Load Word from Other Files. is searchable and can be fully populated with editable text and graphics programmatically.
find text in pdf files; text searchable pdf
3.3.2  Job Options for Merge Operations 
Parameter 
Notes 
-b 
Include bookmarks 
-p 
Password for document reading  
-m  
Retain metadata (taken from the first file in the merge list). 
-c 
Create result directories if required 
-o 
Overwrite result files if they already exist 
-f string 
Output file name specifier. If –f is not specifed, the merged file will be called 
mergeoutput.pdf. 
%DIRNAME 
Source directory name of the directory currently being 
processed. 
String 
(Any string) 
The .pdf extension is automatically added if not specified. 
3.3.3  Job Options for Set Operations 
Parameter 
Notes 
-c 
Create result directories if required 
-o 
Overwrite result files if they already exist 
-f string 
Output file name specifier.  
%FILENAME 
Ssource file name without .pdf 
%DIRNAME 
Source directory name of the directory currently being 
processed. 
String 
(Any string) 
The .pdf extension is automatically added if not specified. 
-p 
Password for document reading  
14 
C# Word - Word Create or Build in C#.NET
C#.NET using this Word document creating toolkit, if you need to add some text and draw Create Word Document from Existing Files Using C#. Create Word From PDF.
convert pdf to word searchable text; convert pdf to searchable text online
VB.NET Create PDF Library SDK to convert PDF from other file
Create writable PDF file from text (.txt) file in VB.NET project. Load PDF from stream programmatically in VB.NET.
how to make a pdf document text searchable; pdf search and replace text
3.3.4  Job Options for Get Operations 
Parameter 
Notes 
-c 
Create result directories if required 
-o 
Overwrite result files if they already exist 
-f string 
Output file name specifier.  
%BOOKMARK 
Bookmark title 
%PAGEn 
The first page number from source file, zero padded to 
n digits.  If n is not supplied or is zero, then zero 
padding is not used. 
%FILENAME 
Ssource file name without .pdf 
%UNIQUEn 
Unique number starting at 1. If n is supplied, then zero 
padding to n digits is used. If n is not supplied or is 
zero, then zero padding is not used 
%DIRNAME 
Source directory name of the directory currently being 
processed. 
String 
(Any string) 
The .xml extension is automatically added 
-p 
Password for document reading  
3.4  /metadata specification 
This may be used to specify metadata properties as in the following example : 
cscript pdfjunction.wsf /operation:set /target:c:\demo\out 
c:\demo\in\demo3.pdf "/metadata:Author=Tony Bush;Title=A Special 
Document" 
The attributes that may be set are : 
Author 
Title 
Subject 
Keywords 
Creator 
3.5  /security specification 
This may be used to specify security properties as in the following example : 
cscript pdfjunction.wsf /operation:set /sourcetype:folder /joboptions:-o 
/target:c:\demo\out c:\demo\in "/security:userpassword=Secret 
;permissions=allowprinting,allowmodifyannotations" 
15 
Parameter 
Description 
Userpassword 
A password that will be required to open the document. 
Ownerpassword 
A password that will be required to change the document permissions. 
Permissions 
A comma separated list of document permissions 
Permission 
Description 
allowprinting 
Allow high-quality printing 
allowmodifycontents 
Allow assembly (see below) and other 
document medications 
allowcopy 
Allow text and graphic copying and extraction 
allowmodifyannotations 
Allow modification of annotations 
allowfillin 
Allow filling of form fields 
allowscreenreaders 
Allow extraction of text and graphics in 
support of accessibility. 
allowassembly 
Allow rotation, insertion or deletion of pages. 
allowdegradedprinting 
Allow low-quality printing 
allowall 
Allow all the permissions 
strength 
Unless this is set to some other value (such as 40), the default of 128 is used. 
3.6  /docoptions specification 
This may be used to specify document viewing preferences as in the following example : 
cscript pdfjunction.wsf /operation:set /sourcetype:folder /joboptions:-o 
/target:c:\demo\out c:\demo\in "/docoptions:hidetoolbar,pagemodeuseoutlines" 
Propery 
Description 
pagelayoutsinglepage 
Single Page (SinglePage) 
pagelayoutonecolumn 
Continuous(OneColumn) 
pagelayouttwocolumnleft   
ContinuousFacing [odd pages left] (TwoColumnLeft) 
pagelayouttwocolumnright
ContinuousFacing [odd pages right] (TwoColumnRight) 
pagemodeusenone 
No Thumbnails or Bookmarks Visible (UseNone) 
pagemodeuseoutlines 
Bookmarks Visible (Use Outlines) 
pagemodeusethumbs 
Thumbnails Visible (UseThumbs) 
pagemodefullscreen 
Full Screen Mode (FullScreen) 
hidetoolbar 
The viewer’s tool bar will be hidden 
hidemenubar 
The viewer’s menu bar will be hidden 
hidewindowui   
The viewer’s UI elements (scrollbars etc) will be hidden 
fitwindow 
The viewer will resize the document’s window to fit the size of 
the first displayed page. 
centerwindow   
The document window will be positioned in the center of the 
screen. 
nonfullscreenpagemodeusenone 
On exiting full screen mode, neither outline or thumbnail 
images are shown. 
nonfullscreenpagemodeusenoutline  On exiting full screen mode outlines are visible. 
nonfullscreenpagemodeusethumbs
On exiting full screen mode thumbnails are visible. 
16 
 C
ONVERSION TO 
PDF
GUI
AND 
C
OMMAND 
L
INES 
I
NTERFACES 
(P
ROFESSIONAL 
E
DITION 
The Professional Edition of PDF Junction includes facilities to convert Microsoft Office and other 
document types to PDF via GUI and command line interfaces. 
4.1  GUI Interface 
The standard PDF Junction interface is used, and one of the following Tasks selected 
Convert a File to PDF 
Convert a Folder of Files to PDF 
Convert a Folder Tree of Files to PDF 
The conversion process can be tailored according to the PDF Conversion Settings selected.  This 
screen can be accessed via the “More Options” tab. 
17 
The conversion settings available are as follows : 
Option 
Command Line  
/ Config File Name 
Description 
Conversion Timeout 
FileConversionTimeout 
Limits the amount of time in seconds that can 
be spent on a conversion. A value of zero 
means wait indefinitely. 
Continue on Error 
ContinueOnError 
For multiple file processing, continue if an 
error occurs with one file. 
Conversion Error Folder 
ErrorFolder 
Define the folder where documents are placed 
if their conversion raised an error. 
Convert Bookmarks 
Convertbookmarks 
For MS Word, convert bookmarks 
Depth 
BookmarkDepth 
This property will take effect only when the 
ConvertBookmarks
property is set to True. 
Numbers defining bookmark levels must be 
equal to or larger than one. Word style names 
must not repeat in the string. The string must 
not start or end with the delimiter. When this 
property is empty, the default style mapping 
(Heading one through nine will be mapped to 
level one through nine) will be used. Therefore, 
empty string is functionally eqivalent to: 
Heading 1|1|Heading 2|2|Heading 3|3|Heading 
4|4|Heading 5|5|Heading 6|6|Heading 
7|7|Heading 8|8|Heading 9|9 
Note: If you use non-English version of 
Microsoft Word, then you may need to replace 
the word "Heading" with its localized version. 
Convert Hyperlinks 
ConvertHyperlinks 
Sets the flag to indicate whether to convert 
Word hyperlinks to PDF hyperlinks. 
Print All Sheets 
PrintAllSheets 
The flag that indicates whether to print all 
Excel worksheets or not. 
Print BG Color 
PrintBGColor 
For files printed via IE Sets the flag that 
indicates whether to print background color or 
not when printing. 
Print Scale 
PrintScale 
For Visio files, sets the print scale  
Header 
Header 
This property modifies Internet Explorer's 
header setting. 
Footer 
Footer 
This property modifies Internet Explorer's 
footer setting. 
Image Compression 
ImageCompression 
If you want a lossless image compression, use 
PRN_IMAGE_COMPRESS_ZIP (ZIP 
compression). 
Image Downsizing 
ImageDownsizing 
If the this property is set to True, then 
the resolution of images are reduced to the DPI 
value specified in the 
ImageDownsizeResolution
property. 
Image JPEG Quality 
ImageJPEGQuality 
The allowed value range is from 5 to 100 with 
100 being the highest quality. 
Downsize Resolution 
ImageDownsizeResolutio
If the ImageDownsizing
property is set to True, 
then the resolution of images are reduced to the 
DPI value specified in this property. 
18 
Option 
Command Line  
/ Config File Name 
Description 
Font Embedding 
FontEmbedding 
The option PRN_FONT_EMBED_FULLSET 
(embedding fullset of font) will cause 
significant increase in PDF file size, especially 
for CJK font, and therefore not recommended.  
If you need to embed font, 
PRN_FONT_EMBED_SUBSET (embed subset 
of font) will be a better choice. 
Font Substitution 
FontSubstitution 
For the PRN_FONT_SUBST_TABLE (use 
font substitution table) option, you need to 
configure the substitution table. The table is 
stored under the "Device Setting" section of the 
printer driver properties (can be accessed from 
Control Panel). 
Embed Fonts as Type 0 
FontEmbedAsType0 
This option is recommended if you have non-
standard fonts like barcode font. 
Top Margin 
MarginTop 
Sets top margin. 
Bottom 
MarginBottom 
Sets bottom margin. 
Left 
MarginLeft 
Sets left margin. 
Right 
MarginRight 
Sets right margin. 
Width 
PageWidth 
Sets a cusom page width. 
Height 
PageHeight 
Sets a custom page height. 
Paper Orientation 
PaperOrientation 
Sets paper orientation. Eg 
PRN_PAPER_ORIENT_LANDSCAPE 
19 
Documents you may be interested
Documents you may be interested