c# .net pdf reader : Add page numbers to pdf files application software tool html windows azure online RI_15_UserGuide_US6-part1160

Section 8: Saving Documents 
• 
Spreadsheet ML (xml) 
SpreadsheetML is an XML dialect developed by Microsoft Inc. It is the standard spreadsheet 
format in Microsoft Excel 2003. This format is useful when processing documents with lots 
of tables and figures. 
Specific layouting options are available for SpreadsheetML. See the section SpreadsheetML 
Options for more information. 
• 
XLSX 
XLSX is the standard spreadsheet file format used since Microsoft Excel 2007. XLSX files are 
created using the Open XML standard. Each cell in an XLSX file can have a different 
formatting. 
See the section Selecting the Formatting Options for more information about the available 
layout options. 
• 
CSV 
CSV stands for "Comma Separated Value". It is a text format for storing tabular data. In a 
CSV file commas are used to separate values. This format is usually associated with 
Microsoft Excel on Windows computers. 
• 
TXT 
A TXT file is a standard text document that contains unformatted text. TXT files can be 
opened in any text editing or word processing application. 
No Layout options are available for TXT files. 
• 
HTML 
HTML stands for "Hypertext Markup Language". It is the predominant markup language for 
web pages. It provides a means to describe the structure and formatting of text-based 
information in a document. This file format can be opened in Microsoft Excel, in Web 
browsers such as Internet Explorer, and in Web page editors such as Adobe Dreamweaver.   
See the section Selecting the Formatting Options for more information about the layout 
options. 
• 
TIF 
Tif stands for "Tagged Image File". It is a high-quality graphics format that is often used for 
storing images with many colors. 
Select this format if you want Readiris to convert your documents into image files. No text 
recognition will be done on your documents. 
• 
EPUB 
EPUB is a free and open e-book standard by the International Digital Publishing Forum 
(IDPF). EPUB is designed for reflowable content, meaning that the presentation of the 
content automatically adapts itself to the device on which it is opened. EPUB also supports 
fixed-layout content.  
61 
Add page numbers to pdf files - insert pages into PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Guide C# Users to Insert (Empty) PDF Page or Pages from a Supported File Format
add page numbers pdf files; add a page to a pdf in reader
Add page numbers to pdf files - VB.NET PDF Page Insert Library: insert pages into PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Easy to Use VB.NET APIs to Add a New Blank Page to PDF Document
add page number to pdf; add page numbers to pdf in preview
Readiris 15 - User Guide 
Note that Readiris only creates body text in EPUB files. Images are not included. 
• 
WAV 
WAV stands for Waveform Audio File Format. It is a Microsoft and IBM audio file format.  
When you save the recognition results in this format you can have them read out to you 
thanks to the Windows Text to Speech engine. 
Note: a number of older file formats are supported as well. 
Note: RTF files created by Readiris can also be opened in the web-based office applications. When 
using such applications make sure to select the layout option Retain Word and Paragraph 
Formatting
Adding Properties to Documents 
The documents you process can be complemented by properties. This means you can apply key 
"tags" to your documents, such as the author, the document type, the scanning date, etc. This way, 
you can retrieve them more easily once they have been stored. 
To add properties to documents: 
• 
Scan or open your documents into Readiris. 
• 
Select the desired output format, and make sure the option Save as file is activated. 
• 
Click Start to save your documents. 
• 
In the Save As window that opens, click Properties to add properties to your documents. 
• 
Fill in the properties, then click OK to save them. 
62 
C# Create PDF Library SDK to convert PDF from other file formats
them the ability to count the page numbers of generated metadata adding control, you can add some additional Create PDF Document from Existing Files Using C#.
adding page numbers to pdf documents; add a page to a pdf
C# Word - Word Create or Build in C#.NET
also offer them the ability to count the page numbers of generated using this Word document adding control, you can add some additional Create Word From PDF.
add a page to a pdf online; adding pages to a pdf document in preview
Section 8: Saving Documents 
Saving Scanned Documents as Image Files 
The documents you scan do not necessarily need to be converted into text output files. You can also 
choose to save them as optimized image files. 
To do so: 
• 
Scan or open your documents in Readiris. 
• 
Then click the Page tab: 
Click Save Pictures to save only the picture zones to an image file. 
Click Save Full Page as Image to save the current page as an image file, or; 
Click Save All Pages as Image to save all the pages in Readiris as image file(s). 
Note: with this third option, you can choose to save all pages to a multipage image 
files, or save each page separately in separate image files. 
• 
Name your document and select as which type of image you want to save it. 
• 
Depending on the image format you select, a JPEG quality slider may be available. With this 
slider you can determine the quality of your image files.
63 
C# PowerPoint - PowerPoint Creating in C#.NET
New PowerPoint File and Load PowerPoint from Other Files. them the ability to count the page numbers of generated creating toolkit, if you need to add some text
add page number to pdf online; add a page to pdf file
C# Word - Word Creating in C#.NET
to Create New Word File and Load Word from Other Files. them the ability to count the page numbers of generated creating toolkit, if you need to add some text
add page number to pdf document; add page numbers to pdf reader
Selecting the Formatting Options 
Depending on the output format you select in the Output window, different formatting options are 
available. 
Below you'll find a short description of each Options group. See the corresponding sections below 
for more detailed information.  
Layout Options 
The Layout Options play an important role when generating Word processor documents, 
Spreadsheet documents and Web page documents. They determine for a large part what your final 
documents will look like. 
General Options 
The General Options are available for each output format on which Readiris does text recognition. 
When you select an image output format, such as PDF Image, or TIF, for instance, the General 
Options are not available. 
The General Options complement the Layout Options and determine, amongst others, if the colors 
and graphics are maintained in the output documents. 
SpreadsheetML Options 
When generating SpreadsheetML documents for Microsoft Excel (2007 and 2010), dedicated 
SpreadsheetML Options are available, besides the Layout and General Options. 
The SpreadsheetML Options determine how the worksheets will be formatted in your Excel 
document. 
PDF Options 
When generating PDF documents, only the specific PDF Options are available. These include 
bookmarking, iHQC-compression, password protection and digital signing. 
XPS Options 
When generating XPS documents, only the specific XPS Options are available. These include 
bookmarking and iHQC compression.
64 
C# Excel - Excel Creating in C#.NET
to Create New Excel File and Load Excel from Other Files. them the ability to count the page numbers of generated creating toolkit, if you need to add some text
adding page numbers pdf file; adding page numbers to pdf in preview
VB.NET TIFF: VB.NET Sample Codes to Sort TIFF File with .NET
to sort a multi-page TIFF file with page numbers using VB define the orders for the TIFF file page sorting by pageCount - 1 To 0 Step -1 newOrders.Add(i) Next
add pdf pages together; add multi page pdf to word document
Paper Size 
The Paper Size options allow you to define in which paper size (e.g. A4, Letter, Legal) your output 
documents will be generated. 
These options are available for most RTF output formats. 
Pictures 
The Pictures Options determine how the pictures will be presented in the output documents, e.g. in 
black-and-white or in color. They also define their resolution. 
Note: when you select an output format or application that does not support images, then the 
Pictures Options will be unavailable in Readiris. 
WAV Audio voice 
In the WAV Audio voice options you can select the voice and language in which the recognition 
results will be read. 
Layout Options 
The Layout Options play an important role when generating Word processor documents (.doc, 
.docx, .rtf, .odt), Spreadsheet documents (.xml, .xlsx) and Web page documents (.htm). They 
determine for a large part what your final documents will look like. 
Below you find a description of what each Layout option does and examples of real documents. Also 
notice the thumbnail on the right side of the window. It gives you a general idea of the document 
layout based on the Layout option you select. 
Note: the Layout Options tab is of course unavailable when you select PDF, XPS or TIF as 
output format. PDF and XPS are fixed-layout formats and by default re-create the original 
layout of the document. And TIF is an image format, on which no recognition is done. 
Note: if any Layout option is unavailable for the output format you selected, this means the 
option in question is not supported. 
65 
C#: Use XImage.OCR to Recognize MICR E-13B, OCR-A, OCR-B Fonts
may need to scan and get check characters like numbers and codes. page.RecSettings. LanguagesEnabled.Add(Language.Other); page.RecSettings.OtherLanguage
adding page numbers to pdf in reader; add document to pdf pages
VB.NET Excel: VB Methods to Set and Customize Excel Rendering
treat every single Excel spreadsheet as a page in our An image consists of large numbers of dots, and the Our Excel converting add-on for VB.NET still supports
add a page to a pdf document; adding page numbers to a pdf document
• 
The option Create body text generates a continuous, running line of text. The result is a 
document without any formatting. The formatting is to be done manually, by the user. 
Example of body text 
• 
The option Retain word and paragraph formatting keeps the general format structure of 
your scanned document. 
The font type, size and type style are maintained across the recognition process. 
The tabs and the alignment of each block are recreated. 
The text blocks and columns aren't recreated; the paragraphs just follow each other. 
Tables are recaptured correctly. 
Pictures are not captured. 
Example of word and paragraph formatting 
• 
The option Recreate source document tries to stay as close to the original layout as possible. 
The text blocks, tables and pictures are re-created in the same place as the original. 
The word and paragraph formatting are maintained. 
Hyperlinks are re-created too. 
Example of a re-created source document 
The option Use columns instead of frames creates columns instead of text frames to 
position the information on the page. 
66 
C# Excel: Create and Draw Linear and 2D Barcodes on Excel Page
barcode image to the first page page.AddImage(barcodeImage C#.NET Excel Barcode Creating Add-on imaging controls, PDF document, image to pdf files and components
add page to a pdf; add page number to pdf file
VB.NET Image: Guide to Convert Images to Stream with DocImage SDK
Follow this guiding page to learn how to easily convert a single image or numbers of it an image processing component which can enable developers to add a wide
add page numbers to pdf in reader; add blank page to pdf
Section 8: Saving Documents 
Columnized texts are easier to edit than documents containing multiple frames: 
the text flows naturally from one column to the next. 
Note: should Readiris be unable to detect columns in the source document, then 
frames are still used as substitute solution. 
Tip: use this option when generating Word documents. 
The option Insert column breaks inserts a hard column break at the end of each 
column, which maintains the format of the text. Any text you edit, add or remove 
remains inside its column; no text flows automatically across a column break. 
Tip: disable this option (Insert column breaks when you have body text that 
contains columns. You'll ensure the natural flow of the text from one column to 
the next. 
The option Add image as page background places the scanned image as page 
background beneath the recognized text. 
Note: this option increases the file size of the output files substantially. 
The format PDF Text-Image modifies PDF files in the same manner. 
To avoid the file increase discussed above, select the option Retain colors of 
background on the Options tab. This provides a similar but less drastic, more 
compact alternative. 
General Options 
The General Options are available for each output format on which Readiris does text recognition. 
When you select an image output format, such as PDF Image, or TIF, for instance, the General 
Options are not available. The General Options complement other options such as the Layout and 
SpreadsheetML Options. Note, however, that some general options are unavailable depending on 
the other Formatting options you select. 
Below you find a description of what each option does and examples of real documents. 
• 
The option Merge lines into paragraphs enables automatic paragraph detection. 
Readiris wordwraps the recognized text until a new paragraph starts, and reglues 
hyphenated words at the end of a line. 
• 
The option Include pictures does exactly what it says; it includes images in your output 
documents. 
Clear this option in case you only need lay-outed text. 
• 
The option Maintain colors of text keeps the original color of the text in your source 
documents. 
• 
The option Maintain colors of background recreates the background color of each 
document. 
67 
Readiris 15 - User Guide 
Note: in a spreadsheet application, this option recreates the background color of each cell. 
SpreadsheetML Options 
When you select Microsoft Excel 2007, 2010 (SpreadsheetML) as output format, specific 
SpreadsheetML options are available. 
Below you find a description of what each option does and examples of real documents. 
• 
The option Ignore all text outside the tables saves the tables and ignores all other 
recognition results. 
All data inside the tables is recaptured; any data outside the tables is not. 
Example image   
• 
The option Convert figures into numbers encodes recognized figures as numbers. 
As a result, you can execute arithmetical operations on those cells. The text cells (in 
any table) remain text. 
Note that only figures inside tables are encoded as numbers. 
• 
The option Create one worksheet per page sees to it that one worksheet is created per 
scanned page. 
If a page contains tables and text, all is placed inside the same worksheet. 
• 
The option Create one worksheet per table places each table in a separate worksheet and 
includes the recognized text (outside the tables) in another worksheet. 
If the document being processed contains more than one page, each page will be 
processed in the same manner. 
68 
Section 8: Saving Documents 
This option is useful when processing tables of different sizes and different headings. 
Paper Size 
The Paper Size options allow you to define in which paper size (e.g. A4, Letter, Legal) your output 
documents will be generated. These options are available for most rich text output formats. 
• 
Click the Paper size tab and use the arrow buttons to apply and exclude paper sizes. 
• 
Readiris will go through the active paper sizes in the user-set order and will use the first 
paper size that is sufficiently large to hold the scanned document. 
Note: the default paper sizes vary depending on your operating system. 
Pictures 
The Pictures Options determine how the images will be presented in the output documents, e.g. in 
black-and-white or in color. They also define their resolution. 
Note: when you select an output format or application that does not support images, then 
the Pictures options will be unavailable in Readiris. 
Below you find a description of what each option does. 
• 
Black-and-white images 
Readiris by default saves images in color. Select this option to generate black-and-
white images. The colors of the text inside your documents can still be maintained.
69 
• 
Maintain scan resolution 
This option is activated by default. Readiris generates the output documents in the 
same resolution as your scanned documents. To verify in which resolution your 
documents have been scanned, check the Scanner Settings. Or point to a page 
thumbnail to view its properties. 
• 
Reduce resolution to
If you don't want to maintain the original scan resolution, then select the option 
Reduce resolution to, and indicate to which resolution you want to reduce the images. 
Note: it is recommended to use a resolution of at least 72dpi. 
• 
JPEG quality 
Images stored inside PDF, XPS, Word and RTF documents are saved in the JPEG format. 
Use the slider to adjust the JPEG quality. 
• 
JPEG 2000 compression 
When saving files in the PDF or XPS format, Readiris can apply JPEG 2000 compression 
to the color-grayscale images stored inside those files. 
Selecting the PDF Options 
The documents you process with Readiris can be saved as PDF documents. 
About PDF documents 
PDF stands for "Portable Document Format". It is a format developed by Adobe Systems Inc. to 
facilitate document exchange. PDF files are device-independent and resolution-independent, and 
can be opened on any Operating System (Windows, Mac OS, Linux, iOS, Android, etc.) PDF files are 
mostly used for storage purposes. Note that the content of PDF files cannot be edited (easily). 
To save documents as PDF documents: 
• 
Select PDF in the Output group, and then click the down arrow beneath it to configure the 
settings. 
Or if PDF is not displayed in the Output group, click Other
70 
Documents you may be interested
Documents you may be interested