how to open pdf file in mvc : Convert pdf to text for Library application class windows winforms ajax ddxRef8-part2132

Working with File Attachments
PDF documents can contain file attachments consisting of any type of data. The data in these attachments 
(also called embedded files) is separate from the page content and other document information. Any 
external file can be attached to a PDF document. Once attached, it can be extracted to an external file.
PDF supports two types of file attachments:
Document-level attachments are associated with the document as a whole and are identified by name.
Page-level attachments are associated with a particular page in a document and do not have names. 
These are also called file attachment annotations.
See the PDF Reference for more information.
You use the FileAttachments and NoFileAttachments elements to specify information about the 
file attachments in a document.
Preserving and deleting file attachments
By default, attachments from all source documents are preserved in the resultant document. File 
attachments are included from a source document only once, even if the source document is specified 
several times. That is, if the base document contains three file attachments, then the result PDF document 
contains three file attachments. 
Note:Document-level file attachments are assembled from a non-base document when the entire PDF 
document is part of the assembly. If only some pages from a non-base document are assembled, 
then the document-level file attachments for that PDF are not included.
To exclude attachments, use the NoFileAttachments element. (See “NoFileAttachments” on page208
Example:Excluding attachments from a source document
<PDF result="doc3.pdf">
<PDF source="doc1.pdf">
<PDF source="doc2.pdf"/>
The example above excludes attachments from doc1.pdf and includes attachments from doc2.pdf. The 
following example excludes all file attachments by making the NoFileAttachments element a child of 
the result element. 
Convert pdf to text for - Convert PDF to txt files in, ASP.NET MVC, WinForms, WPF application
C# PDF to Text (TXT) Converting Library to Convert PDF to Text
convert scanned pdf to text online; change pdf to text for editing
Convert pdf to text for - VB.NET PDF Convert to Text SDK: Convert PDF to txt files in, ASP.NET MVC, WinForms, WPF application
VB.NET Guide and Sample Codes to Convert PDF to Text in .NET Project
convert pdf into text file; converting pdf to editable text for
Working with File Attachments
Assembler Service and DDX Reference
Attaching files to a PDF document     82
Example:Excluding all file attachments
<PDF result="doc3.pdf">
<PDF source="doc1.pdf"/>
<PDF source="doc2.pdf"/>
Note:The NoFileAttachments element and the FileAttachments element cannot be siblings.
Attaching files to a PDF document
You can attach files to a resultant document using the FileAttachments source element. As mentioned 
earlier, there are two types of FileAttachments source elements: page-level and document-level.
Document-level file attachments
To attach a file at the document level, you use a FileAttachments source element and specify the 
following information:
The source attribute specifies the document to e attach.
The nameKey attribute suggests a unique identifier for the document. Beginning with 9.0, the 
nameKey is deprecated and can be omitted. 
If you provide the nameKey, set its value to the filename of the attachment. The nameKey must be 
unique. If duplicate filenames are specified, then the filename and nameKey are made unique by 
appending a number to the root of the filename. For example, the second data.pdf added is 
identified as data_0001.pdf
The File subelement specifies the filename for the attachment and optionally the MIME type, creation 
date, and modification date. The filename must be unique.
The FilenameEncoding subelement specifies the encoding for the filename.
The Description subelement provides descriptive text.
This example attaches the file data.pdf to the resultant document.
Example:Attaching a file to the document
<PDF result="doc2.pdf">
<FileAttachments source="faData.pdf" >
<File filename="data.pdf" mimetype="application/pdf"/>
<FilenameEncoding encoding="UTF-8"/>
<Description>What this file does</Description>
<PDF source="doc1.pdf"/>
In this example above, the FileAttachments source element is a sibling of the PDF source element. 
Therefore, all file attachments in the original document doc1.pdf are preserved. In the following example, 
data.pdf would be attached to the source (and hence the result), but all other attachments in doc1.pdf 
would be deleted.
Online Convert PDF to Text file. Best free online PDF txt
Download Free Trial. Convert a PDF to Text. Easy converting! We try to make it as easy as possible to convert your PDF files to Text.
convert pdf document to text; convert pdf to text file online
VB.NET PDF Text Extract Library: extract text content from PDF
PDF ›› VB.NET PDF: Extract PDF Text. Advanced Visual Studio .NET PDF text extraction control, built in .NET framework 2.0 and compatible with Windows system.
convert pdf to text online; converting .pdf to text
Working with File Attachments
Assembler Service and DDX Reference
Page-level file attachments     83
Example:Replacing file attachments
<PDF result="doc2.pdf">
<PDF source="doc1.pdf">
<FileAttachments source="data.pdf" ... additional attributes />
Page-level file attachments
You can attach a file to any page of a PDF document as a file attachment annotation. To attach a page-level 
file attachment, specify a FileAttachments element as a child of a PDF element. (See “FileAttachments” 
on page183
The syntax is similar to the syntax for document-level file attachments, with these exceptions:
Page-level file attachments do not use the nameKey attribute.
Page-level file attachments must have an additional subelement, AttachmentAppearance, that 
specifies the appearance of the annotation icon on the page that represents the file attachment. 
Beginning with version 9.0, the presence of this element is what distinguishes a page-level attachment 
from a document-level attachment.
The file is attached to the first page represented by the parent element. Therefore, to attach a file to any 
page other than the first page, use multiple PDF source elements, as in the following example.
Example:Attaching a file to a page
<PDF result="doc3.pdf">
<PDF source="doc1.pdf"/>
<PDF source="doc2.pdf" pages="1-2"/>
<PDF source="doc2.pdf" pages="3-last">
<FileAttachments source="meetingnotes.txt">
<File filename="meetingnotes.txt" mimetype="text/plain"/>
<FilenameEncoding encoding="ISO-8859-1"/>
<Description>comments from meeting</Description>
<AttachmentAppearance icon="Paperclip" color="red" opacity="75" 
x="36.0" y="360.0" />
This example creates a resultant document by assembling doc1.pdf and doc2.pdf. The goal is to attach the 
file meetingnotes.txt to page 3 of the second source document, doc2.pdf. (Assuming doc1.pdf has three 
pages, this file attachment appears on page 6 of the resulting doc3.pdf.) The doc2.pdf document is broken 
into two parts by using two appearances of the PDF source element. Each appearance uses the pages 
attribute to specify the pages in the part. The first part specifies pages 1-2, and the second part specifies 
pagES4-last. The FileAttachments element causes the file to be attached to the first page of the range 
3-last; that is, page 3.
Extracting file attachments
You can use the FileAttachments result element to return one or more file attachments from source 
documents. Each file attachment is returned as a separate data stream, and the Assembler service maps 
each stream to a unique name in the outputs map. 
C# PDF Text Extract Library: extract text content from PDF file in
Text: Extract Text from PDF. |. Home ›› XDoc.PDF ›› C# PDF: Extract PDF Text. Enable extracting PDF text to another PDF file, TXT and SVG formats.
convert pdf file to text document; converting pdf to editable text
VB.NET PDF Convert to Jpeg SDK: Convert PDF to JPEG images in vb.
Convert PDF to HTML. Convert PDF to SVG. Convert PDF to Text. Convert PDF to JPEG. Convert PDF to Png, Gif, Bitmap Images. File &
c# pdf to txt; convert pdf to word to edit text online
Working with File Attachments
Assembler Service and DDX Reference
Extracting file attachments     84
Information about the mapping between names and streams is returned in an XML document that also 
contains information about each returned file attachment. 
This example returns all file attachments associated with the document doc3.pdf.
Example:Extracting all file attachments
<FileAttachments result="attachmentInfo.xml" nameKeys="*" extract="true">
<PDF source="doc3.pdf"/>
<FilenameEncoding encoding="ISO-8859-1"/>
Note the following points about this example:
The result attribute specifies the destination for the resultant XML document. This XML file contains 
information about the file attachments. This document conforms to the FileAttachments schema. (See 
“FileAttachments” on page183
All page-level file attachments in the PDF pages specified for the source document are returned; you 
cannot specify individual page-level file attachments to return. If you specify the pages attribute on 
the PDF source element, only file attachments on that range of pages would be returned. In the 
example, all page-level file attachments are returned.
The nameKeys attribute is a string specifying a list of document-level file attachments that are 
returned. It can be a single name or a comma-separated list such as "doc1, doc2, doc3". The value 
"*", as in the example above, requests that all document-level file attachments be returned. If you do 
not specify this attribute, no document-level file attachments are returned.
The extract attribute has a default value of true, so it is shown in the example only for convenience. 
If you specify a value of false, the file attachments are not returned to you as streams. Only the XML 
document is returned.
The FilenameEncoding element specifies an encoding to use to decode the filenames of the file 
attachments. You can specify more than one of these elements in case one of them is unknown to the 
client. (See “FilenameEncoding” on page187
The following example extracts a single document-level file attachment. It provides several encodings that 
can be used to decode the stored filename. The result XML document is encoded with UTF-8. 
Example:Extracting a single file attachment
<FileAttachments result="attachmentInfo.xml" nameKeys="data1" >
<PDF source="doc3.pdf"/>
<FilenameEncoding encoding="ISO-10646-UCS-2"/>
<FilenameEncoding encoding="UTF-8"/>
<FilenameEncoding encoding="ISO-8859-1"/>
This example extracts multiple files attached to the PDF document.
Example:Extracting multiple file attachments
<FileAttachments result="attachmentInfo.xml" nameKeys="doc1,doc2,doc3" >
<PDF source="doc3.pdf"/>
<FilenameEncoding encoding="ISO-8859-1"/>
In this example, page-level file attachments are extracted from pages 2-3 only. Default filename encoding 
is used to decode the stored filename.
C# PDF Convert to Jpeg SDK: Convert PDF to JPEG images in
C# PDF - Convert PDF to JPEG in C#.NET. C#.NET PDF to JPEG Converting & Conversion Control. Convert PDF to JPEG Using C#.NET. Add necessary references:
convert pdf image to text online; convert pdf to ascii text
VB.NET PDF Convert to HTML SDK: Convert PDF to html files in vb.
Convert PDF to HTML. |. Home ›› XDoc.PDF ›› VB.NET PDF: PDF to HTML. Convert PDF to HTML in VB.NET Demo Code. Add necessary references:
convert pdf to editable text online; convert scanned pdf to text
Working with File Attachments
Assembler Service and DDX Reference
Understanding filename encoding     85
Example:Extracting file attachments from specific pages
<FileAttachments result="attachmentInfo.xml">
<PDF source="doc3.pdf" pages="2-3"/>
<FilenameEncoding encoding="ISO-8859-1"/>
Understanding filename encoding
The FilenameEncoding element specifies character encodings to use for encoding and decoding the 
names of files being attached or extracted. In LiveCycleES 8.0 and later, the FilenameEncoding element 
is optional. However, that element can be useful for processing documents that conform to PDF 1.6 or 
earlier. With such documents, the filenames are not stored as Unicode strings. In such cases the package 
files are document-level file attachments before the PDF to which they were attached became a PDF 
package). If the original host encoding is unknown, and if more than one encoding is provided, the first 
encoding that successfully decodes the bytes in the filename is used. However, there is no guarantee that 
the result is the expected result. (See “FilenameEncoding” on page187
C# PDF Convert to HTML SDK: Convert PDF to html files in
easy for C# developers to convert and transform style that are included in target PDF document file original formatting and interrelation of text and graphical
convert pdf table to text; batch convert pdf to text
VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
VB.NET PDF - Convert PDF to MS Office Word in VB.NET. VB.NET Tutorial for How to Convert PDF to Word (.docx) Document in VB.NET. Best
conversion of pdf image to text; text from pdf
Adding Table of Contents or Blank Pages to an 
Most of the pages in assembled documents originate from source documents. You can also add pages to 
your documents in the form of a table of contents (TOC) or blank pages.
Adding a table of contents
To create a table of contents, use a TableOfContents element. Only one TableOfContents element 
can exist in a resultant document. 
The placement of the TableOfContents element relative to the PDF source documents determines 
where it is located in the resultant document. The TableOfContents element can be a child of a PDF 
result or a PDFGroup element. It can also appear as a child of a StyleProfile element. 
The table of contents consists of entries that are derived from bookmarks in the resultant document. Each 
entry contains the bookmark title and the page that the bookmark links to. You can specify the number of 
levels of bookmarks to include in the table of contents.
Note:Only bookmarks that link to pages in the resultant document are included in the table of contents. 
Some bookmarks in a document can instead trigger actions such as running a script. (See “Working 
with Bookmarks and Thumbnails” on page64
Also, a mixture of Simplified-Chinese, Traditional-Chinese, Japanese, or Korean text in PDF 
bookmarks within a given table of contents can result in illegible characters. To avoid problems with 
such a mixture, specify the font to use for a particular Asian text. Because you cannot indicate the 
preferred font or language within a given bookmark, mixed Asian languages within the same table 
of contents are not supported.
In the following example, the table of contents is inserted after Intro and before Chap1. By default, the 
table of contents includes the entries for all source elements after the TableOfContents element. It 
omits entries from source elements before the TableOfContents element. Therefore, the table of 
contents in this example does not include entries that represent the bookmarks in Intro.
Adding Table of Contents or Blank Pages to an Assembly
Assembler Service and DDX Reference
Adding a table of contents     87
Example:Creating a table of contents
<PDF result="doc5">
<PDF source="Intro"/>
<PDF source="Chap1"/>
<PDF source="Chap2"/>
<PDF source="Summary"/>
The following example overrides the default behavior by setting the includeInTOC attribute explicitly. 
In this case, entries from Intro, Chap1, and Chap2 are included in the table of contents, and entries from 
Summary are not included.
Example:Including extra sources in a table of contents
<PDF result="doc5">
<PDF source="Intro" includeInTOC="true"/>
<PDF source="Chap1"/>
<PDF source="Chap2"/>
<PDF source="Summary" includeInTOC="false"/>
By default, the table of contents includes only bookmarks at the top level of the outline hierarchy. You can 
include additional bookmarks by setting the maxBookmarkLevel attribute to one of the following 
A positive integer, which specifies the level of bookmarks to include. The default value is 1, which 
means that only the level 1 bookmarks are included.
infinite, which means that all bookmarks are included in the table of contents.
The following example specifies that three levels of bookmarks appear in the table of contents.
Example:Specifying table of contents levels
<PDF result="doc5">
<TableOfContents maxBookmarkLevel="3" createLiveLinks="false"
bookmarkTitle="Table of Contents" includeInTOC="true"/>
<PDF source="Chap1"/>
<PDF source="Chap2"/>
<PDF source="Chap3"/>
This example also uses the following attributes:
createLiveLinks specifies whether entries in the table of contents have PDF links associated with 
them. The default is true but can be set to false, such as if the resulting document is intended solely 
for print.
bookmarkTitle specifies that a bookmark are created for the table of contents with the given title.
includeInTOC specifies that the string specified for bookmarkTitle is used to generate a table of 
contents entry for the table of contents itself. Its default value is true; however, the entry in the table 
of contents is not generated unless bookmarkTitle is specified.
Adding Table of Contents or Blank Pages to an Assembly
Assembler Service and DDX Reference
Formatting a table of contents     88
TableOfContents element can also appear as a child of a StyleProfile element. (See “Using style 
profiles” on page116
.) The StyleProfile element lets you define a table of contents that multiple 
result elements reference via the styleReference attribute. 
Example:Using a style profile to create a table of contents
<PDF result="finalDoc">
<TableOfContents styleReference="myTOCStyle"/>
<PDF source="Chap1"/>
<PDF source="Chap2"/>
<PDF source="Chap3"/>
<StyleProfile name="myTOCStyle"/>
<TableOfContents maxBookmarkLevel="3" createLiveLinks="false"/>
<!--Elements describing the table of contents-->
Formatting a table of contents
You can format a table of contents in the following ways:
Add content and properties. Specify elements such as PageMarginsHeaderWatermark, and 
PageLabels as children of the TableOfContents element. The table of contents also inherits these 
elements if they are specified in a parent element.
Specify different properties and content for different pages. For example, you can specify one set 
of properties for the first page of the table of contents and all other pages. To specify such properties, 
add one or two TableOfContentsPagePattern elements as children of the TableOfContents 
element. The TableOfContentsPagePattern element has a pages attribute that can be set to 1 or 
2-last. Any child elements that you specify for the TableOfContentsPagePattern element 
apply only to the pages specified.
Specify style information for line levels. For example, you can specify the style to use depending on 
the bookmark level they apply to. Use the TableOfContentsEntryPattern element.
Applying page properties and content to particular pages
By default, page properties and content applied to the TableOfContents element (or its parents) apply 
to all pages of the table of contents. You can override this behavior by using the 
TableOfContentsPagePattern element. This element lets you specify the pages in the table of 
content that have the page properties or content.
In the following example, a header and footer are defined for the table of contents as a whole. However, 
the first page overrides the header and the remaining pages override the footer.
Example:Formatting a table of contents
<TableOfContents maxBookmarkLevel="3">
<Header styleReference="alpha"/>
<Footer styleReference="beta"/>
<TableOfContentsPagePattern pages="1">
<Header styleReference="gamma"/>
<TableOfContentsPagePattern pages="2-last">
Adding Table of Contents or Blank Pages to an Assembly
Assembler Service and DDX Reference
Applying entry styles to specific line levels     89
<Footer styleReference="delta"/>
Applying entry styles to specific line levels
By default, entry styles defined in the TableOfContentsEntryPattern element apply to the entry 
style for each level in the table of contents. You can override this behavior by using the 
applicableLevel attribute. Set this attribute to “1” for a style applied to the first level of entries. Set it to 
“2” for a style applied to the second level of entries. 
Specify an entry style by adding a StyledText element as a child of the 
TableOfContentsEntryPattern element. This element can specify any of the styled text attributes of 
the Assembler service (see “Specifying styled text” on page112
The following example shows a table of contents that uses two levels of bookmarks.
Example:Formatting table of contents entries
<TableOfContents maxBookmarkLevel="2">
<TableOfContentsEntryPattern applicableLevel="1" >
<p font-family="MyriadPro" font-size="12pt">
<_BookmarkTitle/><leader leader-pattern="dotted"/>
<TableOfContentsEntryPattern applicableLevel="2" >
<p font-family="MyriadPro" font-size="10pt" >
Section <_BookmarkTitle/><leader leader-pattern="space"/>
If you do not specify an entry pattern for a specific bookmark level, the pattern specified for the next 
higher level is used. In the example above, level 3 bookmarks use the same style as bookmarks that are 
specified for level 2. If you do not specify any TableOfContentsEntryPattern elements, a default 
style is used, which corresponds to the following example.
Example:Default style for table of contents entries
<StyledText> <p>
<leader leader-pattern="dotted"/>
This style causes each entry to look like the following example: 
Chapter 1............................................................3
Chapter 2...........................................................25
Adding Table of Contents or Blank Pages to an Assembly
Assembler Service and DDX Reference
Adding blank pages     90
Adding blank pages
You can use the BlankPage element to add pages to your document. Such pages are blank in the sense 
that they begin with no text or graphics. However, as with all pages in an assembled document, you can 
add page content such as headers and watermarks. You can also set the page properties and page labels. 
A typical use for adding a blank page is to make the number of pages in a chapter, section, or document 
even. As a result, the first page of the next section starts on an odd-numbered page. To force the next 
chapter, section, or document to start on an odd-numbered page, specify true for the value of the 
forceEven attribute. A blank page is added only if the number of pages up to that point in the resultant 
document is odd. 
In the following example, each chapter is forced to contain an even number of pages before the next 
chapter is assembled into the resultant document.
Example:Adding blank pages
<PDF result="doc.pdf">
<PDF source="Chap1.pdf"/>
<BlankPage forceEven="true"/>
<PDF source="Chap2.pdf"/>
<BlankPage forceEven="true"/>
<PDF source="Chap3.pdf"/>
<BlankPage forceEven="true"/>
Note:The ordinal page number of a page in the resultant document determines whether that page is odd 
or even. Whether a page is odd or even is independent of the page’s ordinal page number in a PDF 
source or PDFGroup element. It is also independent of the PageLabel element that applies to the 
In the next example, a blank page is added only at the end of the resultant document, if necessary, to make 
the pages even. The page, if it exists, has a watermark specified by the Watermark element that is a child 
of the BlankPage element.
Example:Adding a blank page with a watermark
<PDF result="doc3.pdf">
<PDF source="doc1.pdf"/>
<PDF source="doc2.pdf"/>
<BlankPage forceEven="true">
<StyledText font-family="Helvetica" font-size="14">
<p>This page intentionally left blank</p>
As with other pages, pages that the BlankPage element adds inherit page properties and content that 
the parent elements specify. Page properties can also be specified through the BlankPage element. If a 
value for either PageSize or PageRotation is not specified within the scope of the BlankPage 
element, then the value is taken from other sources (in order of consideration):
1. Resultant PDF document page just before the blank page
Documents you may be interested
Documents you may be interested