how to open pdf file using itextsharp in c# : Select text pdf file application control tool html azure .net online UserGuide12-part1634

117
Document Conversion Service 3.0
Converting Files with Document Conversion Service
The Watch Folder Service Sample
Key
Value
(and folders if IncludeSubfolders is true)
to convert.
NormalizeFilenames
When true , file names passed in will be
checked for normalization and normalized
when necessary. This means that the new
output file name, if not specified, will be the
normalized file name, which while it may
look identical to the original name, is
actually not the same.
This should be left as false unless you
have problems converting files with foreign
file name where some international
characters are represented using diacritics.
A diacritic is a glyph added to a letter; they
are used to change the sound of the letter
to which they are added. Some examples
of a diacritic are the accent grave (‘) and
acute (’) in the French language.
OutputFolder
The converted files are copied into this
folder from the WorkingFolder when the
conversion is done. This is done to prevent
accidental pickup of partially created files.
PollingInterval
Specifies how often to check the input
folder for files. This interval is in
milliseconds (15000 would poll the folder
every 15 seconds).
Polling.MaxFilesToProcessAtATime
Allows the setting of a limit on the number
of files that will be picked up from the 
InputFolder during any polling interval.
When set to 0, no limit is imposed.
This option is useful when the InputFolder
is targeting an existing folder with a very
large number of files. It allows the files to
be processed in batches or groups instead
of copying the entire folder structure to the 
WorkingFolder. This reduces the required
amount of disk space used when
processing files.
When the number of files picked up is
limited, the option DeleteInputSubFolders
is automatically set to false
Polling.SynchronousFilePickup
When set to true, the Watch folder will not
pick up any files from the InputFolder until
the current batch, or group, of files has
completed processing. 
Used in conjunction with 
Select text pdf file - search text inside PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn how to search text in PDF document and obtain text content and location information
pdf text search tool; how to select text on pdf
Select text pdf file - VB.NET PDF Text Search Library: search text inside PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Learn How to Search Text in PDF Document and Obtain Text Content and Location Information in VB.NET application
search text in pdf using java; how to make a pdf document text searchable
Document Conversion Service 3.0
118
Converting Files with Document Conversion Service
The Watch Folder Service Sample
Key
Value
Polling.MaxFilesToProcessAtATime to
control the flow of files so that a very large
group of files can be processed as many
smaller batches without overloading the
physical disk space of the computer.
SearchFilter
A file extension based filter for file
matching. By default it is set to *.* to match
all files. A filter of *.pdf would only search
for PDF documents.
StagingFolder
This folder is a holding location for the files
during conversion. When the input folder is
polled, each group of files is copied into a
uniquely named sub-folder (based on date
and time) under this folder. If 
IncludeSubfolders is true folders are also
copied.
TestMode
This flag should be false or removed
completely on a production system. 
Used for development purposes, this flag
can be used to simulate load testing by
copying the converted files back into the
input folder.
UseTimeDateSubFoldersInCompletedFolder
When set to true, each set of completed
files are stored in a subfolder under the 
CompletedFolder. This subfolder is
named using the date and time the files
were picked up from the InputFolder.  
When set to false the files are copied
directly into the CompletedFolder. If a file
of the same name already exist in the
folder it will be overwritten.
This option is not used when the 
CompletedFolder is set to an empty string
("") or is not included is the settings.
UseTimeDateSubFoldersInFailedFolder
When set to true, any files that fail to
convert are stored in a subfolder under the 
FailedFolder. This subfolder is named
using the date and time the files were
picked up from the InputFolder. 
When set to false the files are copied
directly into the FailedFolder. If a file of the
same name already exist in the folder it will
be overwritten.
WorkingFolder
The output files are first created in this
folder before being copied to the 
OutputFolder. If the files were created
directly in the OutputFolder and another
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Extract various types of image from PDF file, like XObject Image, XObject Form, Inline Image, etc. C#: Select An Image from PDF Page by Position.
text searchable pdf file; select text in pdf reader
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
RsterEdge XDoc PDF SDK for .NET, VB.NET users are able to extract image from PDF page or file and specified VB.NET : Select An Image from PDF Page by
how to select all text in pdf file; search pdf files for text
119
Document Conversion Service 3.0
Converting Files with Document Conversion Service
The Watch Folder Service Sample
Key
Value
program was monitoring that folder the files
could be picked up before the file was
created. This two-stage process eliminates
that problem.
VB.NET PDF Text Redact Library: select, redact text content from
Convert PDF to SVG. Convert PDF to Text. Convert PDF to JPEG. Convert PDF to Png, Gif, Bitmap Images. File & Page Process. File: Merge, Append PDF Files. File
pdf searchable text; how to search a pdf document for text
C# PDF Text Redact Library: select, redact text content from PDF
Enable users abilities to adjust color and transparency while scraping text from PDF file. Able to redact selected text in PDF document.
how to select text in pdf image; pdf text search
Document Conversion Service 3.0
120
Converting Files with Document Conversion Service
The Watch Folder Service Sample
The Output File Settings
The 
<WatchFolder>
section is also responsible for the type of output that is created. Common settings
that would appear here would be:
· what type of file to create (multipaged or serialized TIFF, PDF files, JPEG images)
· the resolution (DPI) of any images created
· create color or black and white files
· create fax mode TIFF images.
The settings are provided as a set of name-value pairs based on the settings outlined in Conversion
Settings
. In this sample application the conversion setting strings are stored in the configuration file for
the application. These settings are read from the configuration file and then passed to the
PNDocConvQueueServiceLib object through its COM interface. Having the conversion settings
external to the program allows the settings to be changed without having to recompile.
The 
<WatchFolder>
sample below creates multipaged, color-optimized TIFF files at 300 DPI with
Group4 compression. See the sample WatchFolder sections provided in the configuration file for more
examples of configurations of common output formats.
C# HTML5 PDF Viewer SDK to view PDF document online in C#.NET
is loaded as sample file for viewing on the viewer. See screeshot as below. Tools Tab. Item. Name. Description. 1. Select tool. Select text and image on PDF document
pdf search and replace text; how to search pdf files for text
VB.NET PDF- View PDF Online with VB.NET HTML5 PDF Viewer
is loaded as sample file for viewing on the viewer. See screeshot as below. Tools Tab. Item. Name. Description. 1. Select tool. Select text and image on PDF document
can't select text in pdf file; convert pdf to searchable text online
121
Document Conversion Service 3.0
Converting Files with Document Conversion Service
The Watch Folder Service Sample
Code Sample - Output File Settings 
<WatchFolders>
<!-- This watch folder creates 300 DPI Optimized TIFF Images -->
<WatchFolder Name="ConvertToTIFF Watch Folder">
<Settings>
....
<!-- Output file options -->
<add Name="Devmode settings;Resolution" Value="300"/>
<add Name="Save;Output File Format" Value="TIFF Multipaged"/>
<!-- Replace the above with this to create serialized images. -->
<!-- <add Name="Save;Output File Format" Value="TIFF Serialized"/> -->
<add Name="Save;Append" Value="0"/>
<add Name="Save;Color reduction" Value="Optimal"/>
<add Name="Save;Dithering method" Value="Halftone"/>
<!-- This creates file.ext.tif, change to 1 to create file.tif-->
<add Name="Save;Remove filename extension" Value="0" />
<add Name="TIFF File Format;BW compression" Value="Group4"/>
<add Name="TIFF File Format;Color compression" Value="LZW RGB"/>
<add Name="TIFF File Format;Indexed compression" Value="LZW"/>
<add Name="TIFF File Format;Greyscale compression" Value="LZW"/>
<add Name="JPEG File Format;Color compression" Value="Medium Quality"/>
<add Name="JPEG File Format;Greyscale compression" Value="High Quality"/
>
</Settings>
</WatchFolder>
</WatchFolders>
C# HTML5 Viewer: Load, View, Convert, Annotate and Edit OpenOffice
pptx) on webpage, Convert CSV to PDF file online, convert CSV to save signatures to OpenOffice and CSV file. Viewer particular text tool can select text on all
cannot select text in pdf; find and replace text in pdf
VB.NET PDF - View PDF with WPF PDF Viewer for VB.NET
PDF to text, C#.NET convert PDF to images, C#.NET PDF file & pages Pan around the PDF document. Select text and image to copy and paste using Ctrl+C and Ctrl+V
how to select all text in pdf; search multiple pdf files for text
Document Conversion Service 3.0
122
Converting Files with Document Conversion Service
The Watch Folder Service Sample
Changing the File Extension to Converter Mapping
The file extension of each file is used to determine what converter is used to convert that file. File
extensions can be added, removed and changed as needed. When the converter requires a native
application to be installed to do the conversion, that application must also be installed.
The mapping consists of the extension (the suffix of the file name past the last dot or period in file's
name) and a semi-colon separated list of converter names. See What Files Can I Convert?
for a list of
converter names. 
In some cases the file extension may only have one converter that can process that type of file, and in
others, such as PDF which can be converted using either Adobe Reader, Ghostscript or Outside-In
AX, you may specify more than one. The code sample below shows a small snippet of the file
mapping in the configuration file.
If you want to by-pass certain file types, say for instance you are creating TIFF images and you want
to skip converting any TIFF images that are dropped into the input folder, you can change the file
extension mapping to have files with the .tif extension sent to the PEERNET Passthrough converter.
See Skipping Files with the Passthrough Converter
for more details.
Code Sample - File Extension to Converter Mapping
<WatchFoldersSection>
<WatchFolders>
...
<!-- This Watch folder watches a folder on your local machine -->
<WatchFolder Name="Folder Watch Local Drive">
<Settings>
<!-- Folder options -->
<add Name="InputFolder" Value="C:\PEERNET\Test\Input"/>
...
</Settings>
</WatchFolder>
</WatchFolders>
<Settings>
<!-- File Extension to Converter Mapping -->
<!-- These can be added to the Settings section for each WatchFolder -->
<!-- to tailor each WatchFolder to use different converters for its -->
<!-- documents. The individual settings take precedence over the -->
<!-- global WatchFolderSection settings section -->
<add Name=".doc" Value="Microsoft Word;Outside-In AX" />
<add Name=".docx" Value="Microsoft Word;Outside-In AX" />
<add Name=".xlsx" Value="Microsoft Excel;Outside-In AX" />
<add Name=".xls" Value="Microsoft Excel;Outside-In AX" />
<add Name=".pptx" Value="Microsoft PowerPoint;Outside-In AX" />
<add Name=".ppt" Value="Microsoft PowerPoint;Outside-In AX" />
...
<add Name=".tif" Value="PEERNET Image Converter;Outside-In AX" />
<add Name=".tiff" Value="PEERNET Image Converter;Outside-In AX" />
<add Name=".bmp" Value="PEERNET Image Converter;Outside-In AX" />
<add Name=".jpg" Value="PEERNET Image Converter;Outside-In AX" />
<add Name=".jpeg" Value="PEERNET Image Converter;Outside-In AX" />
</Settings>
</WatchFoldersSection>
C# WPF PDF Viewer SDK to view PDF document in C#.NET
PDF to text, C#.NET convert PDF to images, C#.NET PDF file & pages Pan around the PDF document. Select text and image to copy and paste using Ctrl+C and Ctrl+V
how to select text in pdf; search pdf documents for text
C# WPF PDF Viewer SDK to annotate PDF document in C#.NET
Default create. Click to select drawing annotation with default properties. Other Tab. 17. Text box. Click to add a text box to specific location on PDF page.
find text in pdf image; search text in pdf image
123
Document Conversion Service 3.0
Converting Files with Document Conversion Service
The Watch Folder Service Sample
Large Volume Batch Conversion with Watch Folder Service
If you have an existing folder containing a very large number of files that you need to convert, you can use
the sample watch folder, LargeBatchTIFF,  included with the Watch Folder Service.
The Watch Folder Service basic design was for use with hot folders or drop folders where files to be
converted are dropped periodically into a folder. It was meant to handle small groups of files being
dropped occasionally into the input folder. When files are detected in the input folder, the Watch Folder
Service will try and copy the entire contents of the folder to its staging location for processing. When
dealing with a folder containing a large volume of files this can cause large time delays as the files are
copied, and other issues such as not having enough disk space to copy the files.
The settings Polling.MaxFilesToProcessAtATime and Polling.SynchronousFilePickup are used to
control how many files are picked up at every polling interval, and if the first batch of files needs to
complete before the next group is picked up.
In this scenario, you would also typically set UseTimeDateSubFoldersInCompletedFolder and
UseTimeDateSubFoldersInFailedFolder to false so that the date-timestamp folders for each mini-batch
of files are not created under the output and failed folders. 
You may also want to add the setting 
<add Name ="Save;Remove filename extension" Value ="1"/>
to
make sure that the file extension from the original source file is not used to name the output file. This
means that the output file from a file named Manual.docx would become Manual.tif. If this settings is not
included, or is set to "0", the output file name would be Manual.docx.pdf.
Document Conversion Service 3.0
124
Converting Files with Document Conversion Service
The Watch Folder Service Sample
Code Sample
<WatchFolders>
<!-- This watch folder is set to allow for dropping a large number of files -->
<!-- at once. The files are picked up in small batches of up to 10 files until -->
<!-- all files have been completed. -->
<WatchFolder Name="LargeBatchTIFF Watch Folder" >
<Settings>
<!-- Folder options -->
<add Name="InputFolder" 
Value="C:\PEERNET\WatchFolders\LargeBatchTIFF\Input\"/>
<add Name="SearchFilter" Value="*.*"/>
<add Name="IncludeSubFolders" Value="True"/>
<add Name="DeleteInputSubFolders" Value="True"/>
<add Name="StagingFolder" 
Value="C:\PEERNET\WatchFolders\LargeBatchTIFF\Staging"/>
<add Name="WorkingFolder" 
Value="C:\PEERNET\WatchFolders\LargeBatchTIFF\Working"/>
<add Name="FailedFolder" 
Value="C:\PEERNET\WatchFolders\LargeBatchTIFF\Failed"/>
<add Name="CompletedFolder"
Value="C:\PEERNET\WatchFolders\LargeBatchTIFF\Completed"/>
<add Name="OutputFolder" 
Value=":\PEERNET\WatchFolders\LargeBatchTIFF\Output"/>
<add Name="PollingInterval" Value="15000"/>
<add Name="DCOMComputerName" Value=""/>
<add Name="TestMode" Value="false" />
<!-- These settings control the how many files in the batch -->
<!-- are picked up each time, 0 means no limit. -->
<add Name="Polling.MaxFilesToProcessAtATime" Value="10" />
<add Name="Polling.SynchronousFilePickup" Value="true" />
<add Name="UseTimeDateSubFoldersInCompletedFolder" Value="false" />
<add Name="UseTimeDateSubFoldersInFailedFolder" Value="false" />
....
<add Name="Devmode settings;Resolution" Value="300"/>
<add Name="Save;Output File Format" Value="TIFF Multipaged" />
<!-- Replace the above with this to create serialized images. -->
<!-- <add Name="Save;Output File Format" Value="TIFF Serialized" /> -->
<add Name="Save;Remove filename extension" Value="1" />
<add Name="Save;Append" Value="0"/>
<add Name="Save;Color reduction" Value="Optimal"/>
<add Name="Save;Dithering method" Value="Halftone"/>
<!-- This creates file.ext.tif, change to 1 to create file.tif -->  
<add Name="Save;Remove filename extension" Value="0"/>
<add Name="TIFF File Format;BW compression" Value="Group4"/>
<add Name="TIFF File Format;Color compression" Value="LZW RGB0"/>
<add Name="TIFF File Format;Indexed compression" Value="LZW"/>
<add Name="TIFF File Format;Greyscale compression" Value="LZW"/>
<add Name="JPEG File Format;Color compression" Value="Medium Quality"/>
<add Name="JPEG File Format;Greyscale compression" Value="High Quality"/>
</Settings>
</WatchFolder>
</WatchFolders>
125
Document Conversion Service 3.0
Converting Files with Document Conversion Service
Skipping Files with the Passthrough Converter
Skipping Files with the Passthrough Converter
The PEERNET Passthrough converter is a by-pass mechanism that allows files to be sent through the
Document Conversion Service without actually being converted. This type of behavior is useful when
dealing with a group of files where some of the input files sent may already be in the desired output format,
but you still need them moved to your final destination for further processing.
The PEERNET Passthrough converter will work with any file type as it uses the file's extension to
recognize which file types to skip.
For example, if you have the Watch Folder Service configured to convert any files dropped into a specific
folder into TIFF files, you can configure the Watch Folder Service to send any files with the ".tif" or ".tiff"
extension to the PEERNET Passthrough converter where they are moved directly to the final destination
without being converted.
Using the Passthrough Converter with the Watch Folder Service
The steps below show how to take an existing Watch Folder Service folder definition that creates TIFF
images and modify it so that the Passthrough converter is used to skip converting any TIFF images.
Any TIFF images are moved to the output folder without being converted. This same technique can be
used on any file extension.
1. Open the configuration file in Notepad by going to Start - All Programs - PEERNET
Document Conversion Service 3.0 - Watch Folder - Configure Watch Folder
Settings.
2. In the configuration file, look for the desired the 
<WatchFolder>
section; there can be more than
one.  To have only this 
<WatchFolder>
section use the Passthrough converter for TIFF images,
add the PEERNET Passthrough converter to the beginning of the list of converters to use for TIFF
images.
Code Sample - Skip TIFF images on a single watch folder
<WatchFolders>
<WatchFolder Name="Folder Watch Create TIFF Images">
<Settings>
<!-- Folder options -->
<add Name="InputFolder" Value="C:\PEERNET\Test\Input"/>
<add Name="SearchFilter" Value="*.*"/>
...
<add Name ="Devmode settings;Resolution" Value="200"/>
<add Name ="Save;Output File Format" Value="TIFF Multipaged" />
<add Name ="Save;Append" Value ="0"/>
...
<!-- Skip tiff images in this folder, move them to output. -->
<add Name=".tif"
Value="PEERNET Passthrough;PEERNET Image Converter;Outside-In AX" />
<add Name=".tiff"
Value="PEERNET Passthrough;PEERNET Image Converter;Outside-In AX" />
...
</Settings>
</WatchFolder>
</WatchFolders>
3. To have all 
<WatchFolders>
use the Passthrough converter for TIFF images, the change needs to
be done in the 
<Settings>
section at the bottom of the configuration file.
Document Conversion Service 3.0
126
Converting Files with Document Conversion Service
Skipping Files with the Passthrough Converter
Code Sample - Skip TIFF images on all WatchFolders
<WatchFoldersSection>
<WatchFolders>
...
<!-- This Watch folder watches a folder on your local machine -->
<WatchFolder Name="Folder Watch Local Drive">
<Settings>
<!-- Folder options -->
<add Name="InputFolder" Value="C:\PEERNET\Test\Input"/>
...
</Settings>
</WatchFolder>
</WatchFolders>
<Settings>
<!-- File Extension to Converter Mapping -->
<!-- These can be added to the Settings section for each WatchFolder -->
<!-- to tailor each WatchFolder to use different converters for its -->
<!-- documents. The individual settings take precedence over the -->
<!-- global WatchFolderSection settings section -->
<add Name=".doc" Value="Microsoft Word;Outside-In AX" />
<add Name=".docx" Value="Microsoft Word;Outside-In AX" />
...
<!-- Skip tiff images in this folder, move them to output. -->
<add Name=".tif"
Value="PEERNET Passthrough;PEERNET Image Converter;Outside-In AX" />
<add Name=".tiff"
Value="PEERNET Passthrough;PEERNET Image Converter;Outside-In AX" />
<add Name=".bmp" Value="PEERNET Image Converter;Outside-In AX" />
<add Name=".jpg" Value="PEERNET Image Converter;Outside-In AX" />
<add Name=".jpeg" Value="PEERNET Image Converter;Outside-In AX" />
</Settings>
</WatchFoldersSection>
4. Save the configuration file and restart the Watch Folder Service to have your new changes
applied.
Documents you may be interested
Documents you may be interested