AdobeLiveCycleES4
Document Text Language
Assembler Service and DDX Reference
DocText reference     341
DocText reference
This reference provides the syntax and grammar for the DocText language.
DocText 
Root element of a DocText document.
<DocText>
<WithQuads
> or <ParagraphsPerPage
or <TextPerPage
[1]
</DocText>
Page 
Lists the words that appear on a particular page. 
<Page pageNumber="n">
<Word
/> [0..n, present only if a child of the WithQuads element]
word1 word2 word3 [present only if a child of the TextPerPage element]
</Page>
Can be contained in the elements WithQuads
or TextPerPage
.
If the Page element is a child of the TextPerPage
element, it contains a space-separated list of the words 
that appear on the page. The words are not sorted alphabetically, but they are roughly in reading order on 
the page. 
The words are encoded using the encoding specified in the first line of the DocText file, usually UTF-8.
Attributes
Paragraph
Sentences contained in a paragraph on the page.
<Paragraph>
<Sentence> [0..n]
xs:string
</Sentence>
</Paragraph>
A sentence contains a string of words terminated by punctuation. 
Can be contained in the Page
element.
ParagraphsPerPage
Outer element containing paragraphs and sentence strings.
<ParagraphsPerPage>
Name
Description
pageNumber
Ordinal page number of a page in the document.
Convert pdf to txt format online - Convert PDF to txt files in C#.net, ASP.NET MVC, WinForms, WPF application
C# PDF to Text (TXT) Converting Library to Convert PDF to Text
convert pdf into text; convert pdf to openoffice text document
Convert pdf to txt format online - VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net, ASP.NET MVC, WinForms, WPF application
VB.NET Guide and Sample Codes to Convert PDF to Text in .NET Project
convert pdf to txt file online; converting pdf to editable text for
AdobeLiveCycleES4
Document Text Language
Assembler Service and DDX Reference
P1     342
<Page pageNumber="xs:decimal"> [0..n]
<Paragraph
[0..n] 
</ParagraphsPerPage>
Can be contained in the DocText
element.
P1
Specifies one corner of a word’s bounding box.
<P1
x
="X-coordinate"
y
="Y-coordinate"
</P1>
Can be contained in the Quad
element.
Attributes
P2
See the P1
element.
P3
See the P1
element.
P4
See the P1
element.
Quad
Specifies the four corners that describe an area on the page where the word appears.
<Quad>
<P1
[1]
<P2
[1]
<P3
[1]
<P4
[1]
</Quad>
Can be contained in the Page
element.
Name
Description
x
X-coordinate of one corner of a bounding box.
y
Y-coordinate of one corner of a bounding box.
C# Create PDF from Text to convert txt files to PDF in C#.net, ASP
Now you can convert text file to PDF document using Sample code for text to PDF converting in C# DocumentConverter.ToDocument(@"C:\input.txt", @"C:\output.pdf
convert pdf file to text online; convert pdf image to text online
C# PDF Converter Library SDK to convert PDF to other file formats
integrated into your C# program and convert PDF to .txt file with If you want to transform and convert PDF document to Jpeg image file format, this article
convert pdf file to txt; c# read text from pdf
AdobeLiveCycleES4
Document Text Language
Assembler Service and DDX Reference
TextPerPage     343
TextPerPage
Specifies the words used on an individual page, without specifying the location of those words.
<TextPerPage>
<Page
[0..n]
</TextPerPage>
Can be contained in the DocText
element.
WithQuads
Provides the page number and placement on the page of each word in the document.
<WithQuads>
<Page
/> [0..n]
</WithQuads>
Can be contained in the DocText
element.
Word
Describes the location of an individual word on the page.
<Word>
word
<Quad
/>
</Word>
Can be contained in the Page
element.
The contents of this element is a single word that appears on the page. Text encoding used for this work is 
specified in the first line of the DocText file, usually UTF-8.
VB.NET PDF - Convert PDF with VB.NET WPF PDF Viewer
Description. 1. To Word. Convert PDF to Word DOCX document. 2. To TIFF. Export PDF to TIFF file format. 3. To TXT. Export and convert PDF to TXT file. 4. To Image
convert pdf to editable text; batch convert pdf to txt
How to C#: File Format Support
PDF. Write pdf. DPX. Read 48-bit DPX. PGM. TIFF(TrueType Font File). Read all truetype convert to image. TXT(A text format). Convert ANSI-Encoding text format to
convert pdf to text without losing formatting; convert pdf to plain text
344
25
File Attachments Language 
The File Attachments language is an XML language that describes file attachments in a set of PDF 
documents. The file attachments can be returned as named data streams. An Attachments document does 
not contain file attachments. 
About the Attachments XML language
The namespace of the Attachments language is http://ns.adobe.com/DDX/Attachments/1.0/
, and the root 
element is Attachments
. The schema is installed in the product Documentation folder. 
The Assembler service returns an Attachments document in response to the appearance of the 
FileAttachments
result element in a DDX document. The FileAttachments result element specifies 
the source documents for which file attachment information is desired. It can also specify keys that identify 
which file attachments to consider and whether those attachments are returned to the client as separate 
data streams.
An Attachments document contains a description for each file attachment specified in the 
FileAttachments
result element. The description includes the file attachment’s unique identifier, 
filename, description, and MIME-type. The Assembler service assigns a unique identifier to each file 
attachment, regardless of whether the attachments are returned to the client.
File attachments are identified using unique identifiers rather than filenames because the original 
filename cannot always be decoded. 
C# WPF PDF Viewer SDK to convert and export PDF document to other
Description. 1. To Word. Convert PDF to Word DOCX document. 2. To TIFF. Export PDF to TIFF file format. 3. To TXT. Export and convert PDF to TXT file. 4. To Image
convert pdf to searchable text online; convert scanned pdf to word text
VB.NET TIFF: TIFF Text Extractor SDK; Extract Text Content from
In this online tutorial, we will offer you information on new rectangle(0, 0, 300, 300), @"C:/extract.txt"). extracted text content to other format files, like
convert pdf to plain text online; convert pdf to word editable text
AdobeLiveCycleES4
File Attachments Language
Assembler Service and DDX Reference
Attachments reference     345
Attachments reference
Attachment
Describes a single file attachment.
<Attachment
attachmentKey
="xs:string"
name
="xs:string"
>
<File
[1]
<Description
[0..1]
<Page
[0..1]
</Attachment>
Can be contained in the Attachments
element.
Attributes
Attachments
Describes some or all of the file attachments in a PDF document. This element is empty if no file 
attachments are extracted.
<Attachments>
<Attachment
[1..n]
</Attachments>
This element is the root element for the Attachments XML.
Description
Provides the description for the file attachment.
<Description>
xs:string
</Description>
Can be contained in the Attachment
element.
The value provided is taken from the source PDF document Attachment Description property. A user can 
set this property by selecting the attachment and then selecting the properties menu. If the source 
document omits a value for the Attachment Description, this element is omitted.
Name
Description
attachmentKey
The contrived name associated with the output stream. 
name
Name under which the file was attached to the PDF document, if attached at the 
document level. If the file was attached at the page level, there is no name. This 
attribute corresponds to the nameKeys attribute in the DDX language 
FileAttachments
element.
C# PDF - Extract Text from Scanned PDF Using OCR SDK
NET convert PDF to text, C#.NET convert PDF to images C:\input.pdf"); BasePage page = pdf.GetPage(0 ocrPage.Recognize(); ocrPage.SaveTo(MIMEType.TXT, @"C:\output
conversion of pdf image to text; convert pdf to text on
C# TIFF: Use C#.NET Code to Extract Text from TIFF File
Moreover, text content, style, and format of original Tiff image can be retained txt"; // Save ocr result as other documet formats, like txt, pdf, and svg.
convert pdf file to text file; converting .pdf to text
AdobeLiveCycleES4
File Attachments Language
Assembler Service and DDX Reference
File     346
File
<File
mimeType
="xs:string"
size
="xs:integer"
creationDate
="xs:dateTime"
modificationDate
="xs:dateTime"
>
<FileName
[1..n]
</File>
Can be contained in the Attachment
element.
Attributes
FileName 
Filename and the success of decoding that name from the source PDF document.
<FileName
unmappableCharacters
="true"
fromEncoding
="algorithm name"
success
="true" or "false"
decoded file name
</FileName>
Can be contained in the File
element. 
Occasionally, the filename encoding algorithm in the original PDF document is unknown. In such cases, 
the decoding process is a trial and error process that involves trying multiple algorithms supplied by the 
DDX FilenameEncoding
element. 
The name is encoded using UTF-8, as specified in the XML encoding attribute.
Name
Description
mimeType
Optional. MIME type of the file. If this information is unknown, the attribute is 
absent.
size
Optional. Size of the file, in bytes. If this information is unknown, the attribute is 
absent.
creationDate
Optional. Creation date of the file. If this value is unknown, the attribute is absent.
modificationD
ate
Optional. Date the file was last modified. If this value is unknown, the attribute is 
absent.
C# PDF Text Extract Library: extract text content from PDF file in
PDF text to another PDF file, TXT and SVG or partial text content from target PDF document file text content, and export extracted text with customized format.
best pdf to text converter; convert pdf to rich text format online
AdobeLiveCycleES4
File Attachments Language
Assembler Service and DDX Reference
Location     347
Attributes
Location 
Specifies a position on a page as coordinates.
<Location
x
="length"
y
="length"
/> 
Can be contained in the Page
element.
Attributes
Name
Description
unmappableCharact
ers
Flag indicating whether, after applying the encoding specified by the 
fromEncoding attribute, unmappable characters were found in the 
filename. 
If unmappable characters are found, this attribute appears in the XML with a 
value of true. In addition, the following changes occur:
Unmappable characters are replaced with the Unicode substitution 
character (\uFFFD).
success attribute is set to false.
Modified filename text is displayed. 
If unmappable characters are not found, this attribute is absent.
fromEncoding
Encoding applied to produce the string content of the FileName
element. 
success
Flag indicating the success of the attempt to decode the filename. This 
attribute can have the following values:
false - Decoding was unsuccessful. If the unmappableCharacters
attribute is present, some characters in the filename could not be 
decoded. If that attribute is absent, the decoding attempt failed.
true - Decoding was successful.
Name
Description
x
Specifies the horizontal location on the page where the icon is placed. The value provides 
the horizontal distance from the lower left corner of the page to the upper right corner of 
the icon.
y
Specifies the vertical location on the page where the icon is placed. The value provides the 
vertical distance from the lower left corner of the page to the upper right corner of the icon.
AdobeLiveCycleES4
File Attachments Language
Assembler Service and DDX Reference
Page     348
Page 
Specifies the page on which a page-level file attachment occurs and the position on that page where the 
annotation is placed.
<Page
pageNumber
="xs:integer"
>
<Location
[0..1]
</Page>
Can be contained in the Attachment
element. 
Attributes
Name
Description
pageNumber
The number of the page in the PDF document to which the file was 
attached.
349
26
PackageFiles Language 
The PackageFiles language is an XML grammar that provides information about package files in a PDF 
document. 
The PackageFiles language is important for obtaining the nameKey that identifies package files. The 
nameKey for a package file is a contrived name for these reasons:
Original filename may be known from the original encoding for the given filename. 
Multiple files with the same filename may be present.
Package file may be contained in a Folder.
Thus, a PackageFiles document helps with identification by providing a mapping of the contrived name to 
information about the file. The PackageFiles
result element returns a PackageFiles document.
About the PackageFiles language
The namespace of the PackageFiles language is http://ns.adobe.com/DDX/PackageFiles/1.0/
, and the root 
element is PackageFiles
.The schema is installed in the product Documentation folder. 
The Assembler service returns a PackageFiles document in response to the appearance of the 
PackageFiles
result element in a DDX document.
Example:Resultant PackageFiles
<?xml version="1.0" encoding="UTF-8"?>
<PackageFiles xmlns="http://ns.adobe.com/DDX/PackageFiles/1.0/" 
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
xsi:schemaLocation="http://ns.adobe.com/DDX/PackageFiles/1.0/ 
F:\lc\assembler\kendall\schemas\pdfm\packagefiles.xsd">
<Package/>
<Folders>
<Description>A few test files</Description>
<Folder name="Chapters">
<Description>Folder for Chapters</Description>
<Folder name="Chapter 1">
<Description>Folder Chapter 1</Description>
</Folder>
<Folder name="Chapter 2">
</Folder>
</Folder>
<Folder name="Biodynamics">
<Description>Folder for Biodynamics</Description>
</Folder>
</Folders>
<PackageFile 
attachmentKey="SimpleFolders.pdf_attach.0000.0001"
nameKey="/Chapters/Chapter 1/chap1.pdf">
<File creationDate="2009-08-03T14:05:10-07:00"
mimeType="application/pdf"
AdobeLiveCycleES4
PackageFiles Language
Assembler Service and DDX Reference
PackageFiles reference     350
modificationDate="2009-07-16T10:44:20-08:00" 
size="6508">
<Filename>chap1.pdf</Filename>
</File>
</PackageFile>
<PackageFile attachmentKey="SimpleFolders.pdf_attach.0000.0002"
nameKey="/Chapters/Chapter 2/chap2.pdf">
<File creationDate="2009-08-03T14:05:18-07:00"
mimeType="application/pdf"
modificationDate="2009-07-16T10:44:20-08:00" size="12942">
<Filename>chap2.pdf</Filename>
</File>
<Description>File chap2.pdf</Description>
</PackageFile>
<PackageFile attachmentKey="SimpleFolders.pdf_attach.0000.0003"
nameKey="/Biodynamics/biodynamic.pdf">
<File creationDate="2009-08-03T14:06:00-07:00"
mimeType="application/pdf"
modificationDate="2009-07-16T10:44:26-08:00" size="9339">
<Filename>biodynamic.pdf</Filename>
</File>
</PackageFile>
</PackageFiles>
PackageFiles reference
The PackageFiles schema provided below represents the XML contained in a PackageFiles
result 
element. The PackageFiles
element is the root element.
Description
The description associated with this package file or folder.
<Description> "xs:string" </Description>
DisplayOrder
The DisplayOrder element contains FieldData
elements that identify the specified order of the fields 
when displayed in a viewer.
<DisplayOrder>
<FieldData
name
="xs:string"/> [0..n] 
</DisplayOrder>
Attributes
Name
Description
name
Required. The normalized name of a FieldData
as defined in the Schema
. The 
non-normalized name appears as the content in the Schema
element.
Documents you may be interested
Documents you may be interested