c# itextsharp pdf page to image : Create password protected pdf from word software control cloud windows web page .net class fileconvert-manual2-part1321

Custom Job – OCR  
Use the OCR Options section to set up the OCR behavior for your custom conversion job
OCR Options 
These relate to how OCR will be performed. 
Process Separators 
FileConvert's separators are cover-sheets used to indicate where a new file should start and, 
optionally, where to save the file. Separators are recognized by special codes at the top of the 
page. If you select the Process Separators option, FileConvert will look for separators as it runs 
OCR. 
NOTE: If you don't select an Embed OCR Text option, FileConvert will do a very rapid separator-
only OCR that just looks at the top part of each page. This is much faster than standard OCR. 
You would want to do this if you only care about separating/routing your files and don't need 
searchable PDFs. 
Auto-Rotate Pages   (Advanced Engine Only) 
Rotated pages will be flipped so that the text is upright. The most common case is landscape 
pages. Landscape pages usually haveto be scanned as portrait, making the text sideways.Auto-
to-
Rotate Pages will detect that the text is running vertical and flip the page back to landscape so 
it's readable. 
Embed OCR Text 
If you are converting to PDF or running OCR on existing PDF files, the OCR text can be 
embedded in the PDF to make it indexable and searchable. The PDF file will still have the original
scanned image, but it will also have text invisibly embedded on the pages. Use these options to 
determine if and how your OCR text will be embedded in the PDF: 
Do Not Embed  
The OCR text will not be embedded in the PDF file. The PDF will not be indexable or 
searchable. In other words, it will be an "image-only PDF".  
Embed Word-Aligned  
The OCR text will be embedded behind the scanned image. The words will be aligned 
behind their representation in the scan. With this option, you can actually "select" the 
words in the scan to copy them.  
Embed at Top of Page  
The OCR text will be clumped at the top of the page in one continuous, hidden paragraph. 
This is a good option if you don't care about selecting and copying text in the PDF. It 
results in slightly smaller PDF files.  
OCR Engine 
Create password protected pdf from word - C# PDF Password Library: add, remove, edit PDF file password in C#.net, ASP.NET, MVC, WinForms, WPF
Help to Improve the Security of Your PDF Document by Setting Password
copy protected pdf to word converter online; create password protected pdf reader
Create password protected pdf from word - VB.NET PDF Password Library: add, remove, edit PDF file password in vb.net, ASP.NET, MVC, WinForms, WPF
Help to Improve the Security of Your PDF Document by Setting Password
adding a password to a pdf using reader; adding a password to a pdf
FileConvert can use a number of different OCR engines. Each engine has its own strengths and 
weaknesses: 
Standard  
This is a basic engine. Its biggest advantage is speed – the engine is very fast. Its 
accuracy is typically above 90%, high enough to make your documents searchable. It 
handles poor images gracefully, but its accuracy degrades as the image quality goes down.
This engine only recognizes English characters. Also, it does not recognize rotated pages, 
meaning that all scanned images must have upright text.  
Advanced  
The advanced engine is somewhat slower than the standard engine, but its accuracy is 
much better – usually above 97%. This engine supports and automatically detects Danish, 
Dutch, English, French, German, Italian, Norwegian, Portuguese, Spanish, and Swedish. It 
handles light, dark, and dirty backgrounds quite well. It can recognize rotated pages.  
Microsoft Office (MODI)  
Microsoft Office 2003 and newer include Microsoft Office Document Imaging, or MODI
MODI includes a fast, capable OCR engine. The MODI engine is actually licensed from 
ScanSoft, the maker of OmniPage and PaperPort, so its performance is comparable to 
those engines. It does not recognize rotated pages.  
IMPORTANT: These engines will only be available as options if they are detected on your system.
FileConvert does not bundle or install any engine except for the Standard and Advanced engines.
Page Timeout 
Some pages can cause the OCR engine to hang. To let the OCR engine move on past pages like 
these, you can specify a page timeout. If the engine hasn't been able to successfully OCR a page
before the timeout lapses, it will give up and move on to the next page. Failed pages will be 
reported in the log. 
Line Break Options 
Use these options to tell FileConvert where to insert line breaks (hard returns) in the OCR text. 
NOTE: These options are only relevant if you choose Text as the output file format. When you 
convert to PDF and embed hidden text, the OCR text will always be character-aligned behind the
image. 
By Paragraph  
FileConvert will try to figure out where paragraphs end based on punctuation. For 
example, if a "." falls at the end of a line, it's probably the last sentence in the paragraph. 
FileConvert will insert two returns wherever it thinks a paragraph ends. If you choose this 
option, you should proofread your OCR text to make sure all of the line breaks were 
handled correctly.  
By Line  
FileConvert will preserve the original lines from the document. This means that wherever a
line wraps in the document, FileConvert will insert a line break. FileConvert will not try to 
figure out paragraph endings.  
None  
VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
Create editable Word file online without email. Supports transfer from password protected PDF. VB.NET class source code for .NET framework.
copy text from protected pdf; pdf password reset
C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
and .docx. Create editable Word file online without email. Password protected PDF file can be printed to Word for mail merge. C# source
convert password protected pdf to excel online; pdf password remover online
FileConvert will not insert any line breaks. The OCR text will come out as one, continuous 
line of text.  
Page Size when Converting from TIFF 
When you're converting from TIFF to PDF, FileConvert needs to know what size to make the PDF 
pages. You have two options: force one page size, or base the page size on the dimensions and 
resolution of the original TIFF image. 
NOTE: If you choose to base the PDF size on the dimensions of the original image, run some 
tests to make sure the results are what you want. Some scanners do not stamp the resolution 
correctly when they create TIFF files. 
C# PDF Convert to Jpeg SDK: Convert PDF to JPEG images in C#.net
Support for customizing image size. Password protected PDF document can be converted and changed. Open source codes can be added to C# class.
adding password to pdf; a pdf password online
VB.NET PDF Convert to Jpeg SDK: Convert PDF to JPEG images in vb.
Reading, C#.NET Annotate PDF in WPF, C#.NET PDF Create, C#.NET VB.NET How-to, VB.NET PDF, VB.NET Word, VB.NET Able to convert password protected PDF document.
convert password protected pdf to normal pdf; add password to pdf document
Conversion Job – Schedule  
You have a lot of flexibility in scheduling custom conversion jobs
. You can have the job run every
few minutes, once a day, or once a week. Each time the scheduled interval comes around, 
FileConvert will search for new files to convert. You can also set the schedule to Manual. Manual 
jobs never run automatically. They will only run when you start them yourself. 
You will notice that daily and weekly jobs have a start time and an end time. The job will begin 
at the start time and continue to search for new files until the end time. For weekly jobs, the end
time can be on a different day. This lets a job run all weekend, for example. 
If your start time is later than your end time, the job will begin at the start time, continue 
running past midnight, and end at the end time. For example, if your start time is 6:00 PM and 
your end time is 6:00 AM, the job will run through the night and end at 6:00 AM. This is useful 
when you want to have a job run after-hours, but not run during the day. 
When the end time arrives, FileConvert will pause processing files for that job until it becomes 
active again (but it will continue processing files for other active jobs). 
Scheduling Large Jobs 
If your job has thousands of files in it, the biggest thing to be concerned about is how long it 
takes FileConvert to crawl through the source folder looking for files. This is potentially the most 
resource-intensive part of the conversion process and it can bog a computer down. 
For large jobs, you should schedule FileConvert to search for files less frequently. For example, if
you have FileConvert look for new files every minute, it's going to be continuously crawling your 
folders. It would be smarter to have it check for files just once or twice a day, and set the 
Source File Limit per Run at a reasonable level for what can be converted in that time frame (see
General
Settings
for more information). 
Another option to consider for large jobs is using Batch Files to populate the queue instead of 
having FileConvert look for files to convert. See Custom Job
Source
for more information. 
C# PDF: C#.NET PDF Document Merging & Splitting Control SDK
easily merge two or more independent PDF files to create a larger PDF document merging & splitting toolkit SDK to split password-protected PDF document using
password on pdf file; crystal report to pdf with password
.NET PDF SDK - Description of All PDF Processing Control Feastures
Able to Open password protected PDF; Allow users to add Easy to change PDF original password; Options for Create signatures in existing PDF signature fields;
change password on pdf document; pdf password online
How to Run a Job  
If you've set up a schedule for your job, FileConvert will run the job automatically according to 
the schedule, scanning for new files and converting them without any action on your part. 
FileConvert doesn't have to be open for this to work. 
You can also run a job manually anytime you want. Here's how that works: 
1. Select the job  
2. Click Run Job  
3. If you want to redo any files, do it from the Source Log tab (see Redo Files; Source
Log
)  
4. If you want to scan for new files, click Scan for Source Files  
FileConvert will display a list of files that are ready to be converted. If you want to remove a file 
from the list, select it and click Remove from Run. The file will be skipped until the next time the
job runs. 
When you're ready to begin converting the files, click Add to Queue. 
Once you've added the files to the queue, you can close FileConvert. FileConvert will continue 
converting the files in the background. 
Online Remove password from protected PDF file
Online Remove Password from Protected PDF file. Download Free Trial. Remove password from protected PDF file. Find your password-protected PDF and upload it.
break pdf password online; convert password protected pdf to word
C# Word: How to Create Word Online Viewer in C# Application
viewer creating, you can go to PDF Web Viewer into your document's body to create Word document viewing string mode; public string fid; protected void Page_Load
annotate protected pdf; convert password protected pdf to word online
Redo Files; Source Log  
FileConvert keeps track of files it has already converted in the Source Log. This keeps 
FileConvert from redoing files that have already been converted. You can view the source log: 
1. Select the job  
2. Click the Source Log link in the Source summary on the right  
3. A list of files and their status will pop up  
You can also see this list when you run a job manually: 
1. Select the job  
2. Click Run Job  
3. Select the Source Log tab  
You can use this list to see the status of files that have already been found, and redo files that 
FileConvert has already tried to convert. 
Redoing Files 
From the source log screen, you can select individual files to re-convert, or you can redo every 
file in the job. 
Redo Specific Files 
You redo individual files by changing their status to New. This tells FileConvert to convert the file
again as if it had never seen the file before: 
1. Select the file(s) in the list  
2. To select a range of files, click the first file, hold down the Shift key, and select the last 
file; to select random files, hold down the Ctrl key as you click  
3. Click Process Again  
This will clear the status and treat the files like they're new. 
Redo All Files 
You can redo every file in the job. This is like starting over from the beginning. To do this, click 
the Clear Log File button. This will purge the job's history; every file that was previously 
converted will be converted again (provided it's still in the source folder). 
Proceed with the Conversion 
If you came into this list from the Run Job button, you can now switch back to the Files to Queue
tab. If the files aren't showing up in the list, click Scan for Source Files. To proceed with the 
conversion, click Add to Queue. 
Otherwise, just close the dialog and FileConvert will try to convert the files the next time it 
processes the job. 
View Source Log 
You can view the actual source log. On the source log screen, look for the Log File link in the 
lower right-hand corner. If you click this link, it will open the log file in a text editor. 
IMPORTANT: Don't change the source log unless you know what you're doing. 
Optical Character Recognition  
When you scan a document, you create an image file. Even though the image seems to have 
text, to the computer it is just a picture. 
Optical character recognition (OCR) is a process which extracts text from a scanned image. It 
does this by looking for recognizable letters and words. A good OCR engine can pull the text out 
of a scanned image with excellent accuracy
Why Bother with OCR? 
If your only concern is archiving paper documents as electronic files, OCR may not matter to 
you. But if you want to copy and paste text from a scan, or do a text search of the scan's 
contents, you will need OCR. 
Where Does the OCR Text End Up? 
If you convert your files to PDF format, FileConvert embeds the OCR text in the PDF file: 
z
The original scanned image of the document is on top  
z
The OCR text of the document is embedded invisibly behind  
z
Each word of OCR text is aligned behind the image of the word  
FileConvert can also create a plain text file, which is just the unformatted OCR text without the 
original document image. 
How Do I Turn On OCR? 
When you set up your job, you'll be asked whether you want to include OCR as part of the 
process. 
Can I Re-Run OCR? 
You can redo OCR by re-converting the file. You'll need to set up a custom conversion job
. Under
the Source option, set the input file type to PDF and select the Redo PDFs That Are Already 
Searchable option. PDF files which have OCR text will be re-converted. FileConvert will discard 
the old OCR text, re-run OCR, and embed the new text in the file. 
What OCR engine is FileConvert using? 
If you set up a custom conversion
job
, you can choose among several OCR engines. See OCR 
Options
for more information. 
OCR Accuracy  
OCR accuracy can be very good. Follow these guidelines to keep accuracy as high as possible. 
Page Orientation 
OCR requires that the page be upright. If your scanner always produces rotated pages, an 
advanced conversion job
can turn them upright. 
NOTE: Some OCR engines can handle rotated pages, but it degrades OCR speed. 
Document Quality 
One of the most important factors in OCR accuracy is the quality of the original document. Small
fonts and rough, blurred characters will degrade OCR accuracy, as will stray marks and 
excessive "noise" or background patterns. The best accuracy will be achieved with a clean 
document which uses a 10-14 point font size. The common font faces – Times, Arial, and Courier
– will have the highest recognition rates. 
Image Resolution 
For best accuracy, we recommend that you scan in black and white at 300 dpi. Higher resolution
will not greatly improve accuracy but it will increase the file size dramatically. It is not necessary
to scan in color or gray scale, which both produce very large file sizes. 
Black/White Threshold; Darkness 
A very common cause of bad OCR accuracy is an image that is too light. When an image is too 
light, there can be gaps and holes in the characters. These gaps and holes make it very difficult 
for the OCR engine to figure out what the characters are. Increase the black/white threshold or 
darkness setting of your scanner until it produces an image with solid characters. 
Conversely, an image that is too dark has very bold characters which bleed together, making it 
hard for the OCR engine to distinguish one character from the next. Decrease the black/white 
threshold or darkness setting of your scanner until it produces an image with solid but distinct 
characters. 
OCR Engine 
Your choice of OCR engine can make a difference both in OCR accuracy and speed. See OCR
Options
for more information. 
Separators  
The most efficient way to scan is to run whole stacks of documents through the scanner. But this
puts all of the documents into one file, leaving the problem of how to separate the documents 
afterwards. 
FileConvert solves this problem with separators. Separators are special pages that go between 
your documents when you scan. A separator shows FileConvert where a new document begins 
so that FileConvert can put the document in its own file. 
Document separation is just the beginning. The real power of FileConvert's separators is in 
autosaving or routing files. Each separator can specify routing and filename information. Not 
only will FileConvert split the document into its own file, it will save the file wherever you want it
to go. Using separators, it is possible to convert a large batch of files from the scanner and 
automatically save every file to a different location. 
Office Mail Example 
For example, an office has created a unique separator for each employee. They use these 
separators to automatically route the daily mail. This works well since they already had the goal 
of digitizing all inbound mail. When the daily mail comes in, the secretary sorts it with employee 
separators and then scans the entire stack in one batch. 
FileConvert is watching the output of the network scanner. When the new scan appears, 
FileConvert pulls out each piece of mail into a separate file and forwards it to the network folder 
for the right employee. Once the secretary presses the start button on the scanner, the whole 
process plays out automatically. 
How Do I Create Separators? 
Separators are easy to create and print right inside of FileConvert. Learn how 
»
Are There Separators That Only Separate? 
There are two kinds of separators: 
Generic Separators  
Generic separators only have one purpose: separating documents. They do not have any 
auto-saving or routing rules. Learn more 
»
Standard Separators  
Standard separators have a number of features and options, like fixed-length page 
separation, filename rules, selectable conversion formats, etc. Learn more 
»
When Does Separation Happen? 
FileConvert will process a file's separators when it converts the file. It works through the file 
page-by-page and splits off new files as it runs across separators. 
Documents you may be interested
Documents you may be interested