how to use abcpdf in c# : Edit multiple pdf metadata application software utility azure html wpf visual studio tiffjunction322-part250

20 
3.6  Directory Processing from the Command Line 
Processing of directories requires use of the TIFF Junction WSH (Windows Script Host) file, 
tiffjunction.wsh.  This can be used in conjunction with XML Job Ticket files (See section 4 below) – 
these can most conveniently be generated by setting the required parameters in the TIFF Junction GUI 
and using File | Save to save the job ticket file. 
Example : 
cscript "C:\Program Files\TIFF Junction\bin\tiffjunction.wsf" /verbose 
"/jobid:C:\dev\tj2\jobdefinition.xml" 
Parameter 
Notes 
/jobid:value 
If used, specifies the full path of an XML Job Ticket file saved from the GUI 
or generated by some other means.  Job files in the TIFF Junction jobs 
directory may be referred to by a shorthand method of jobname where the Job 
Ticket file is jobname.xml. 
/verbose 
Verbose progress messages 
/debug 
Debug progress messages 
/silent 
No progress messages 
/onerrorcontinue 
Allow job to continue after errors 
Notes 
1. cscript.exe is required to run the command.  This is usually included in a standard PATH, but if not 
would need to be specified explicitly  
Eg C:\WINDOWS\SYSTEM32\cscript.exe …. 
2. Options that contain spaces will need to quoted.  For example “c:\output files” 
Edit multiple pdf metadata - add, remove, update PDF metadata in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata
adding metadata to pdf files; google search pdf metadata
Edit multiple pdf metadata - VB.NET PDF metadata library: add, remove, update PDF metadata in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Enable VB.NET Users to Read, Write, Edit, Delete and Update PDF Document Metadata
add metadata to pdf file; pdf metadata viewer online
21 
3.7  Converting PDF to TIFF From the Command Line 
The command line usage is shown below 
pdf2tiff.exe  /source=value /target=value /output=value /tiffresolution=value /tiffcompression=value 
Parameter 
Notes 
/source 
The source PDF file. 
/target  
The target folder for the output TIFF file 
/output 
Specifies the output file name.  %FILENAME may be used as part of the string 
and will be replaced by the filename without the file extension.   If this is not 
specified, a value of %FILENAME.tif will be used. 
/tiffresolution 
The resolution in DPI of the output TIFF file.  The default is 200. 
/tiffcompression 
The image compression scheme to be used in the TIFF file.  Either GROUP4 
(for bitonal images) or LZW. 
VB.NET PDF Library SDK to view, edit, convert, process PDF file
NET empowers VB.NET developers to implement fast and high quality PDF conversions to or from multiple supported images and PDF Hyperlink Edit. PDF Metadata Edit.
acrobat pdf additional metadata; remove metadata from pdf acrobat
VB.NET PDF File Split Library: Split, seperate PDF into multiple
Divide PDF file into multiple files by outputting PDF file size. Split Split PDF Document into Multiple PDF Files Demo Code in VB.NET. You
preview edit pdf metadata; delete metadata from pdf
22 
 XML
J
OB 
T
ICKET 
F
ILES
TIFF Junction uses XML Job Ticket files to store details of a particular job specification before this is 
run using the product either from the GUI or using the /jobid option from the command line – see 3.6. 
Note that some functionality, in particular custom scripts and logfiles can only be used in conjunction 
with XML Job Ticket files.  Other functionality can also be used via the equivalent command line 
flags.  
Developers may wish to create or generate XML job files using the information below.  A sample job 
file is shown here : 
<pdfjunction_job> 
<operation>split</operation> 
<sourcetype>folder</sourcetype> 
<sourcefiles>C:\qatest\pj\in\set001</sourcefiles> 
<target>c:\qatest\pj\out\qa001</target> 
<joboptions>-o -c -f %F%\%U%</joboptions> 
<metadata></metadata>  
<security></security> 
<docoptions></docoptions> 
<advancedflags></ advancedflags> 
<custom_script>custom.wsf</custom_script> 
<custom_script_pre_job>true</custom_script_pre_job> 
<custom_script_post_job></custom_script_post_job> 
<custom_script_pre_folder></custom_script_pre_folder> 
<custom_script_post_folder></custom_script_post_folder> 
<custom_script_pre_file>true</custom_script_pre_file> 
<custom_script_post_file></custom_script_post_file> 
<custom_script_on_error></custom_script_on_error> 
<logfile>qa001.txt</logfile> 
</pdfjunction_job> 
Attribute 
Description 
operation 
Must be split, merge, set or get 
sourcetype 
Source type (file, folder, tree).  The default value is file. 
target 
Target directory for result files.  If not specified, the source directory will 
be used as the target. 
Joboptions 
Set of options for the specified operation.  Described in detail in section 
5.3. 
Metadata 
Metadata settings for result PDF files.  By default metadata fields are left 
blank. Described in detail in section 5.4. 
Security 
Security settings for result PDF files.  By default files are not secured.  
Described in detail in section 5.5. 
docoptions 
Document option settings for result PDF files. Described in detail in section 
5.6. 
Advancedflags 
Advanced command line flags 
Sourcefiles 
Source TIFF file, folder or tree. May be multiple files for merge operations. 
custom_script 
If not left blank, specifies the name of a custom windows script file in 
PDFJUNCTIONDIR\custom that will be called in accordance with the 
custom_script_* settings below. 
custom_script_pre_job 
If =Y, the custom script will be called at the start of the job 
custom_script_post_job 
If =Y, the custom script will be called at the end of the job 
custom_script_pre_folder 
If =Y, the custom script will be called at the start of processing each folder 
custom_script_post_folder 
If =Y, the custom script will be called at the end of processing each folder 
custom_script_pre_file 
If =Y, the custom script will be called at the start of processing each file 
custom_script_post_file 
If =Y, the custom script will be called at the end of processing each file 
custom_script_on_error 
If =Y, the custom script will be called when a processing error occurs. 
logfile 
If specified, output will be logged to afile with this name in 
TIFFJUNCTIONDIR\logs 
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
Free online C#.NET source code for combining multiple PDF pages together in .NET framework. C# Demo Code: Combine and Merge Multiple PDF Files into One in .NET.
pdf metadata online; pdf metadata extract
C# HTML5 PDF Viewer SDK to view, annotate, create and convert PDF
RaterEdge HTML5 PDF Editor empower C#.NET users to edit PDF pages with multiple manipulation functionalities in ASP.NET application.
view pdf metadata; edit multiple pdf metadata
23 
 C
REATING 
S
EARCHABLE 
PDF
S AND 
T
EXT 
F
ILES 
(P
ROFESSIONAL 
E
DITION 
O
NLY
By using the Searchable PDF option, TIFFs or Image-Only PDFs are run through an OCR (Optical 
Character Recognition) process to extract the text from them.  The resulting PDF files contain both the 
images from the original file, togther with a searchable layer of hidden text that may be searched using 
the standard Adobe Reader search facility as shown below : 
5.1  What is a Searchable PDF? 
A searchable PDF file is a PDF file that includes text that can be searched upon using the standard 
Adobe Reader “search” functionality.  In addition, the text can be selected and copied from the PDF.  
Generally, PDF files created from Microsoft Office Word and other documents are by their nature 
searchable as the source document contains text which is replicated in the PDF, but when creating a 
PDF from a scanned document and OCR process needs to be applied to recognize the characters within 
the image. 
5.2  Inside a Searchable PDF 
In the context of Document Imaging, a searchable PDF will typically contain both the original scanned 
image plus a separate text layer produced from an OCR process.  The text layer is defined in the PDF 
file as invisible, but can still be selected and seached upon.  PDF files are able to store images using 
most of the native compression schemes used in TIFF files, so for example Group 4 TIFF files do not 
usually require any format conversion. 
5.3  OCR Accuracy 
A number of factors affect the accuracy of the text produced by the OCR process – 100% accuracy is 
certain possible under good conditions but each of the following issues, and OCR processing options 
will have an impact.   
5.3.1  Original Image Quality 
Although some pre-processing options such as despeckle and deskew can help in some cases, the visual 
quality of the original scan is of paramount importance. 
5.3.2  Image DPI and Format 
The image resolution should be at least 150 DPI for OCR processing, and preferably 300 DPI for 
optimal results, although for good quality scans 200 DPI is often sufficient.  Non-lossy formats (TIFF 
Group 4, LZW etc) are preferred over lossy formats such as JPEG compression. 
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
Able to add and insert one or multiple pages to existing adobe PDF document in VB.NET. Add and Insert Multiple PDF Pages to PDF Document Using VB.
add metadata to pdf; embed metadata in pdf
C# Create PDF from images Library to convert Jpeg, png images to
Component for combining multiple image formats into one or multiple PDF file in C#.NET. Any piece of area is able to be cropped and pasted to PDF page.
remove pdf metadata; search pdf metadata
24 
5.3.3  Despeckle 
This pre-processing option removes isolated “dots” within the image which can cause recognition 
problems, and makes the result image “cleaner”. 
5.3.4  Deskew 
This option can improve OCR results by straightening crooked pages. 
5.3.5  Auto-Rotate 
OCR processing usually recognizes text written top-to-bottom, left-to-right, so pages that are orientated 
any other way (usually landscape pages) need to be re-oriented to enable recognition. 
5.3.6  Speed versus Quality 
There are two options that can be used to control how the OCR engine processes parts of the document 
image that appear to be graphics areas.   
By default, if an area of the document is indentified as a graphic area then no OCR processing is run on 
that area.  However, certain documents may include areas or boxes that are identified as “graphic” or 
“picture” areas but that actually do contain useful text.   
To ensure that the OCR engine can be forced to process such areas there are two options : 
“Treat all Graphics Areas as Text”.  This option will ensure the entire document is processed as text.   
“Remove Box Lines in OCR Processing”.  This option is ideal for forms where sometimes boxes 
around text can cause an area to be identified as graphics.  This option removes boxes from the 
temporary copy of the imaged used by the OCR engine.  It does not remove boxes from the final 
image.  Technically, this option removes connected elements with a minimum area (by default 100 
pixels).   
5.3.7  Language Settings 
The language setting determines the set of characters that will be recognized, and the dictionary that 
will be used as a guide. 
5.4  The Conversion Process 
5.4.1  Conversion with TIFF Junction 
TIFF Junction is able to convert large volumes of TIFF and Image PDF files to searchable PDF with a 
high degree of accuracy.   When converting from a TIFF file, the process is fairly straightforward; each 
page image is run through the OCR process according to the options set, and the text layer and image 
are used to construct the PDF file. 
When converting from Image PDF Files, an additional stage is required which creates a TIFF file from 
the PDF document.  By default this is done by  rasterizing each  PDF page  to a bitmap  and then 
converting to TIFF.  This ensures a complete representation of each page is made, and is suitable for 
documents that actually have more than just a single image on each page (for example a Bates number 
as text) but can be slower than the “image extraction” method which directly extracts the images from 
each page. 
5.4.2  Managing and Scheduling Jobs 
Many  conversion  jobs  can  benefit  from  functionality  such  as  Watched  Folders,  Scheduled  Jobs,  
Windows Service and .Net API.  To add these capabilities to TIFF Junction, Autobahn DX
is available 
which includes TIFF Junction as one of it’s components. 
VB.NET PDF File Merge Library: Merge, append PDF files in vb.net
Combine multiple specified PDF pages in into single one file. using RasterEdge.XDoc. PDF; VB.NET Demo code to Combine and Merge Multiple PDF Files into One.
batch pdf metadata editor; pdf metadata editor
C# PDF Library SDK to view, edit, convert, process PDF file for C#
XDoc.PDF SDK for .NET empowers C# developers to implement fast and high quality PDF conversions to or from multiple supported images C#.NET: Edit PDF Metadata.
pdf metadata viewer; c# read pdf metadata
25 
5.5  Hardware and Performance 
5.5.1  CPU Power 
The OCR process is highly CPU intensive and will benefit from being given as much CPU power as 
possible.  As a guide about 1,000 pages per hour can be processed on a 2.5GHz processor, although this 
will vary according to the source document and OCR options chosen. 
5.5.2  Exploiting Multiple CPUs 
To take advantage  of  multiple  the  multi-threading  support  and  the  Job  Management facilities  of 
Aquaforest’s Autobahn DX product should be used.  This includes the same OCR engine as TIFF 
Junction, but is designed for higher volume, server-based conversions. 
5.5.3  Memory 
Memory can be a limiting factor when creating the final PDF, in the case of very large documents.  A 
rule of thumb would be to have 1GB – 1.5 GB of memory per processor. 
 
C# PDF File Split Library: Split, seperate PDF into multiple files
The following C# codes explain how to split a PDF file into multiple ones by PDF bookmarks or outlines. Split PDF Document into Multiple PDF Files in C#.
pdf remove metadata; read pdf metadata online
VB.NET PDF Converter Library SDK to convert PDF to other file
mechanisms, it can be used for multiple PDF to image PDF barcode reading, PDF barcode generation, PDF content extraction and metadata editing if
adding metadata to pdf; pdf metadata editor online
26 
 C
REATING 
PDF/A
C
OMPLIANT 
F
ILES
6.1  Background 
The PDF/A standard (ISO 19005) defines a file format based on PDF which provides a mechanism for 
representing electronic documents in a manner that preserves their visual appearance over time, 
independent of the tools and systems used for creating, storing or tendering the files.    
There are two levels of conformance possible for PDF/A : Level A and Level B.   Documents derived 
from scanned images are suitable for Level B compliance as they do not include the logical structure, 
chapters, sections etc required for Level A conformance that may be obtained by (for example) a 
Microsoft Word document converted to PDF. 
6.2  PDF/A Level B Support 
TIFF Junction allows generated PDF Files to be generated in a manner that is PDF/A-1b compliant and 
can be verified as such by using the PDF/A compliance preflight tool in Adobe Acrobat Professional 
7.0.7 and later. 
6.3  Note : Trial Version  
No
te that the trial version  of TIFF Junction places stamps in the PDF files when generating image-
only PDF files, and the these stamps do not use embedded fonts and as such will not be PDF/A 
compliant.  When searchable PDF files are generated, the trial stamp is emebedded as part of the image 
so the resultant files can still be PDF/A compliant if this option is chosen.   
6.4  Document Options 
The only PDF document settings (from “More Options”) supported in conjunction with creation of 
PDF/A compliant files are metadata settings for Title, Author, Subject and Keywords.  Security options 
and Document Options are not supported. 
6.5  Futher Information 
More information relating to ISO 19005-1:2005 and PDF/A can be found on the AIIM website at 
http://www.aiim.org/standards.asp?ID=25013
27 
 U
SING 
S
TAMPS
TIFF Junction allows dynamic and static textual stamps to be placed onto the PDF documents 
generated by the product by means of a stamps configuration file (stamps.txt in the stamps directory) 
together with appropriate parameters.   
Note : Files generated using Stamps can not be PDF/A compliant in the current release of TIFF 
Junction. 
Note : Stamps are not supported when generating a searchable PDF file.  To generate a searchable PDF 
file with stamps from a TIFF file, first convert to PDF (with the stamp settings) and then use “OCR an 
Image-Only PDF”. 
7.1  Stamp Placement 
The image above indicates the possible placement for stamps.  These are determined according to the 
parameters in the stamps.txt configuration file. The product comes with a sample set of stamps. 
7.2  Stamp Specifications 
For example, the stamp that reads “Ctr Ctr Up Diagonal” would be  produced by the following lines in 
the file : 
BEGINSTAMP 
afsName=STAMP 
afsText=Ctr Ctr Up Diagonal 
afsFontSize=63 
afsFont=HELVETICA 
afsTextMode=1 
afsVpos=CENTER 
afsHpos=CENTER 
28 
afsDiag=UP 
ENDSTAMP 
Here is a description of each of the parameters which are case sensitive : 
Parameter 
Description 
BEGINSTAMP 
Required to mark the beginning of a stamp specification. 
ENDSTAMP 
Required to mark the end of a stamp specification. 
afsName 
Stamp name.  If the stamp name is “STAMP” then the stamp will always be applied. 
Any other name is used as an identifier and the stamp will only be applied when the –n  
parameters match the name.   
afsText 
Stamp text.  This may be a fixed piece of text, or may include %p (which will be 
replaced by the page number) or %s which will be replaced by the value of  the -x 
parameter. 
afsFontSize 
Point size for the stamp text.  
afsFont 
Font to be used.  The following are supported : 
TIMES-ROMAN   HELVETICA   COURIER 
afsTextMode 
1=Outlined Text  
2=Sold Text 
afsVpos 
Vertical Position of the stamp, which may be one of the following : 
TOP   CENTER   BOTTOM 
afsHpos 
Horizontal Position of the stamp, which may be one of the following : 
LEFT   CENTER   RIGHT 
afsDiag 
Diagonal orientation of the stamp, which may be one of the following : 
NONE   UP   DOWN 
afsWeight 
Font Weight :  0 (default) – 5 (most bold) 
afsStartPage 
First page of the document to which stamps should be applied (default 1) 
afsEndPage 
Last page of the document to which stamps should be applied (default 0 which means 
there is not a limit) 
afsPageIncrement 
Determines whether stamps should only be applied every nth page where n is 
afsPageIncrement.  Default is 0 which means stamps will be applied to all pages 
(subject to start/end page specifications). 
7.3  Example of Using Stamps 
Convert 709245.tif to a PDF file called 709245.pdf in the current directory using stamp PRODCODE 
with a value of  “XR19 Rev1” : 
tiffjunction.exe -p –n PRODCODE –x “XR19 Rev1” 709245.tif 
29 
 C
USTOM 
S
CRIPTS
The functionality of TIFF Junction can be extended by using custom scripts which may be called at 
various points during the processing of a particular job.  The custom scripts are Windows Script Files 
which allow scripting in either VBScript or Jscript.   
Custom scripts reside in TIFFJUNCTIONDIR\custom.  In order to implement custom scripts, a 
developer should take a copy of the script template (custom.wsf , shown below) and implement the 
script according to their requirements.  The custom script name should be specified and required exists 
should be flagged as being called, either using the GUI or directly in the Job Ticket File (See section 
4). 
Parameters are passed as follows : 
Parameter 
Description 
jobid 
The current job id 
currentfolder 
The path of the folder currently being processed, or “null” for non-
applicable exits (eg job_start) 
currentfile 
The path of the file currently being processed, or “null” for non-
applicable exits (eg job_start) 
exitpoint 
One of the following string values, according to the exit point that was 
called. 
pre_job 
post_job 
pre_folder 
post_folder 
pre_file 
post_file 
on_error 
<job> 
<runtime> 
<named name="jobid" helpstring="Job ID" type="string" required="false"/> 
<named  name="currentfolder" helpstring="Current Folder" type="string" required="false" /> 
<named  name="currentfile" helpstring="Current File" type="string" required="false" /> 
<named  name="exitpoint" helpstring="Script Exit Point" type="string" required="false" /> 
</runtime> 
<script language="VBScript"> 
' Use this section for VBSript 
'jobID=WScript.Arguments.Named("jobid") 
'currentFolder=WScript.Arguments.Named("currentfolder") 
'currentFile=WScript.Arguments.Named("currentfile") 
'exitPoint=WScript.Arguments.Named("exitpoint") 
'WScript.StdOut.WriteLine("Parameter Values - "+jobID+":"+currentFolder+":"+currentFile+":"+exitPoint) 
</script> 
<script language="JScript"> 
// 
// Use this section for JScript 
// 
var jobID=WScript.Arguments.Named("jobid"); 
var currentFolder=WScript.Arguments.Named("currentfolder"); 
var currentFile=WScript.Arguments.Named("currentfile"); 
var exitPoint=WScript.Arguments.Named("exitpoint"); 
WScript.StdOut.WriteLine("Parameter Values - "+jobID+":"+currentFolder+":"+currentFile+":"+exitPoint); 
</script> 
</job> 
Documents you may be interested
Documents you may be interested