Adding and Manipulating Page Content
Assembler Service and DDX Reference
Understanding blending color spaces     111
The following page content elements add page content under the existing page content:
PageContent with the appears attribute set to Behind (the default value)
For PageContentPageOverlay, and Watermark elements in the same result block, the Assembler 
service overlays page content in the following order:
1. Watermark 
2. PageContent 
3. PageOverlay 
The PageOverlay appears over the PageContent, which appears over the Watermark. The order in 
which these elements appear in the result block have no bearing on their overlay order. 
Similarly, for PageContentPageUnderlay and Background in the same result block, the Assembler 
service underlays page content in the following order:
1. Background 
2. PageContent 
3. PageUnderlay 
The PageUnderlay appears behind or underneath the PageContent, which appears behind the 
Adding a Watermark over a PageOverlay or a Background under a PageUnderlay requires two 
result blocks. To add a Watermark over a PageOverlay, perform these steps:
1. Create a transient result block that applies the PageOverlay. (A result block is transient if its return 
attribute is false.)
2. In another result block, add a source element that specifies the transient result block. Within that result 
block, apply the Watermark or Background.
Understanding blending color spaces
Adding a page content element to a PDF document can change the appearance of other page content 
under certain conditions. The page content elements include the elements PageContent, Watermark
BackgroundPageOverlay, and PageUnderlay.
If the assembled page content elements or the target page in the document has the following 
characteristics, it changes the appearance of other page content:
Has opacity of less than 100%
Contains RGB content
Added to a page in a document that does not have a blending color space specified on each PDF page
Source documents or page content that use RGB colors in the added content are distorted in the resultant 
document. The distortion occurs because RGB colors are converted to CMYK, which is the default blending 
Change pdf to text file - Convert PDF to txt files in, ASP.NET MVC, WinForms, WPF application
C# PDF to Text (TXT) Converting Library to Convert PDF to Text
convert pdf to text document; convert pdf photo to text
Change pdf to text file - VB.NET PDF Convert to Text SDK: Convert PDF to txt files in, ASP.NET MVC, WinForms, WPF application
VB.NET Guide and Sample Codes to Convert PDF to Text in .NET Project
converting pdf to editable text; convert pdf file to txt file
Adding and Manipulating Page Content
Assembler Service and DDX Reference
Specifying styled text     112
color space. Colors within added content are always in the RGB color space, even if all requested colors are 
black or gray. A color shift also occurs if an explicit CMYK or ICC blending color space is specified. DDX 
processors assume that such a conversion and subsequent color shift is intended and no warning is issued.
To prevent color distortion from occurring, add one of the following elements to the DDX:
Add an RGB or RGB-compatible ICC blending color space to the original PDF document. (Use Acrobat to 
add such color spaces to the PDF document. The Assembler service cannot add blending color spaces 
to a resultant document.)
Set the opacity in the DDX to 100% (1.0). 
Note: To change blending profiles in Acrobat, select Advanced > Print Production > Convert Colors > 
Page-Level Transparency Blending Space.
For example, the following DDX file adds a watermark with opacity of 25% to the file test.pdf. The text 
in the resulting file, result.pdf, is darker in appearance than in the original. This darkening occurs 
because the /ExtGState is applied to the entire page instead of the watermark itself. Removing the 
watermark removes the /ExtGState and the text returns to its original lighter color:
Example:Adding a watermark with opacity less than 100%
<?xml version="1.0" encoding="UTF-8"?>
<DDX xmlns="">
<PDF result="result.pdf">
<PDF source="test.pdf"/>
<Watermark rotation="45" opacity="25%">
<StyledText><p font-size="72pt">Draft</p></StyledText>
Specifying styled text
When you add page content elements or TableOfContentsEntryPattern elements to a PDF 
document, you can specify style information for the stylized text. The page content elements include the 
HeaderFooterWatermarkBackgroundPageContentPageOverlay, and PageUnderlay 
elements. To specify style information add the StyledText element, 
which can be the child of a HeaderFooterWatermarkBackground,PageContent, or 
TableOfContentsEntryPattern element.
The following example adds a watermark with the text "Draft", in bold, to all the pages in the resultant 
Example:Adding a watermark using styled text
<PDF result="doc2">
VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
list below is mainly to optimize PDF file with multiple Program.RootPath + "\\" 3_optimized.pdf"; 'create optimizing 150.0F 'to change image compression
convert pdf to plain text; convert pdf to text
C# PDF Text Extract Library: extract text content from PDF file in
Able to extract and get all and partial text content from PDF file. How to C#: Extract Text Content from PDF File. Add necessary references:
convert pdf into text file; change pdf to txt file
Adding and Manipulating Page Content
Assembler Service and DDX Reference
Style attributes     113
<PDF source="doc1"/>
StyledText element contains as children one or more p (paragraph) elements. The p element can 
contain any (zero or more) of the following items:
A text string
A built-in key (see “Built-in keys” on page115
) that generates a text string depending on the value of a 
system or document property.
The b (bold) element, as shown in the previous example.
The i (italic) element.
The Space element, which specifies a space between two styled text elements. 
The span element, which contains inline text, to which formatting can be applied. 
The leader element, which is used for table of contents entries and specifies a pattern used to fill a 
Each of the rich text elements (StyledTextpbispan, and leader) can have attributes that specify 
further information, as described in the next section.
Note:Remove any unnecessary white space, including line feed and tab characters, from DDX elements 
that contain text. Unnecessary white space can result in unexpected line feeds or spaces. The p, b, i
span, and DatePattern elements are used to display styled text. If only white space is required 
between two child elements, use one of the following:
Nonbreaking space entity number &#160;
Space element for the DatePattern element and rich text elements. 
The &nbsp; entity reference is undefined.
Style attributes
You can use the following attributes to specify attributes for the rich text elements which are based on rich 
text elements found in CSS. Most the attributes specify font information, which includes the name of the 
font, its size, style, and weight. 
If you do not specify font information, the Assembler service uses default font characteristics, which 
correspond to these settings:
font-family="Minion Pro" 
The following style attributes are also supported:
VB.NET PDF Text Extract Library: extract text content from PDF
this advanced PDF Add-On, developers are able to extract target text content from source PDF document and save extracted text to other file formats through VB
pdf to text; convert pdf to text on
C# PDF File Compress Library: Compress reduce PDF size in
list below is mainly to optimize PDF file with multiple Program.RootPath + "\\" 3_optimized.pdf"; // create optimizing 150F; // to change image compression
convert pdf to txt; best pdf to text
Adding and Manipulating Page Content
Assembler Service and DDX Reference
Applying identifying labels     114
Text decoration (for example, strikethrough)
Text margins, alignment, and indentation
You can specify any of these attributes on any rich text element even if the attribute has no meaning for 
that element. All of the child elements inherit the attribute, even though the attribute applies only to 
certain elements. 
Applying identifying labels
Bates numbering is a method of applying identifying labels to a batch of related documents. Consider, for 
example, legal documents associated with a court case. Each page in the document (or set of documents) 
is assigned a Bates number that uniquely identifies the page. The assigned Bates number also establishes 
each document’s relationship to other Bates numbered documents. A Bates number contains a 
sequentially incremented numeric value plus an optional prefix and suffix. The prefix + numeric + suffix is 
called a Bates pattern.
All result blocks within the <DDX> root element define the set of documents. The start attribute (if 
available) provides the first number in the sequence. If the start attribute is omitted, the DDX processor’s 
default value (1) provides the first number in the sequence. Any other patterns that are started without 
specifying a start value begin with a default value of 1. The start value for a given pattern is set once. 
Any further settings of the start value in subsequent BatesNumber elements in the DDX are ignored for 
that pattern.
The default and minimum number of digits for the numeric portion, numberOfDigits attribute, is 6. 
Therefore, the number 1 would appear as 000001.
The BatesNumber element can appear anywhere inside a <Header>, <Footer>, <Watermark>, 
<Background>, and <TableOfContentsEntryPattern>. The numeric portion of the number is 
incremented only once per page. If there are multiple uses per page, the numeric value on that page 
would remain unchanged. 
Note:It is not recommended to place a BatesNumber within a PageContent element.
The HeaderFooterWatermark, or Background elements can be used to apply Bates numbers to the 
files in a PDF package or portfolio. If these elements specify identical Bates number patterns to sequential 
files in the package or portfolio, then the start value is ignored. The numeric portion increments 
sequentially from file to file. 
Note:Bates numbers added by using the HeaderFooterWatermark, or Background elements 
cannot be removed with the NoHeaderNoFooterNoWatermark, or NoBackground elements.
The following example applies an identifying label to pages within a document. 
Example:Applying an identifying label to pages within a set of documents
<?xml version="1.0"?>
<DDX xmlns="">
<PDF result="result1.pdf">
<PDF source="input1.pdf"/>
<Watermark verticalOffset="4.5in">
<p><BatesNumber prefix="Ref ID = " start="1"/>.</p>
Online Convert PDF to Text file. Best free online PDF txt
from other C# .NET PDF to text conversion controls, RasterEdge C# PDF to text converter control toolkit can convert PDF document to text file with good
c# convert pdf to text file; convert pdf to word searchable text
VB.NET PDF File Merge Library: Merge, append PDF files in
Professional VB.NET PDF file merging SDK support Visual Studio .NET. Merge PDF without size limitation. Append one PDF file to the end of another one in VB.NET.
c# extract text from pdf; convert pdf to text format
Adding and Manipulating Page Content
Assembler Service and DDX Reference
Built-in keys     115
<PDF result="result2.pdf">
<PDF source="input2.pdf"/>
<Watermark verticalOffset="4.5in">
<p><BatesNumber prefix="Ref ID = " start="1"/>.</p>
Notice there is one Bates pattern for the two result blocks so that the number sequence is carried through 
both results. That is, if the first document as 6 pages, the last Bates number is 6, and the stamp appears as 
Ref ID = 000006. The first page of the second document is numbered 7, and the stamp appears as Ref 
ID = 000007.
Built-in keys
You can use the Assembler service built-in keys to insert variable information into headers, footers, 
watermarks, backgrounds, and TOC entries. DDX processors replace these keys with appropriate strings as. 
You can use built-in keys in two ways:
As element names within the styled text elements pspani, and b to represent variable text. For 
example, the _Title element in this example becomes the title of the resultant document.
As strings representing attribute values (or parts of values). The bookmarkTitle attribute of the 
TableOfContents or PDF source elements and the prefix attribute of the PageLabel element 
can use the following metadata keys:
The start attribute of the PageLabel element can use the _PageNumber key only. For example, the 
following snippet generates a bookmark in the resultant document. The bookmark contains the name of 
the author of the source document. 
<PDF source="doc1" bookmarkTitle="By _SourceAuthor"/>
If the author is "AdobeSystemsIncorporated", the resulting bookmark is "By AdobeSystemsIncorporated". 
The following example uses two built-in keys as elements within a StyledText element to specify 
information in a header. The header shows the page number (which is different for each page) and the 
total number of pages (which is constant for the entire resultant document). 
C# PDF File Split Library: Split, seperate PDF into multiple files
Application. Best and professional adobe PDF file splitting SDK for Visual Studio .NET. outputOps); Divide PDF File into Two Using C#.
convert pdf to text open source; convert pdf picture to text
VB.NET PDF File Split Library: Split, seperate PDF into multiple
Professional VB.NET PDF file splitting SDK for Visual Studio and .NET framework 2.0. Split PDF file into two or multiple files in ASP.NET webpage online.
converting pdf to editable text for; batch convert pdf to txt
Adding and Manipulating Page Content
Assembler Service and DDX Reference
Using style profiles     116
Example:Using built-in keys
<PDF result="doc3.pdf">
<p>Page <_PageNumber/> of <_LastPageNumber/></p>
<PDF source="doc1.pdf"/>
<PDF source="doc2.pdf"/>
The resultant document contains a centered header on each page. For a resultant document with 30 
pages, the headers are "Page 1 of 30", "Page 2 of 30", and so on.
_Created_Modified, and _DateTime can have an optional styleReference attribute that 
references a DatePattern element defined within a StyleProfile element. See “Formatting dates” 
on page118
for details.
This example uses two documents with the following metadata:
doc1.pdf: Title is History of Chocolate and Author is Charlie 
doc2.pdf: Title is Chocolate Futures and Author is Willy
Example:Using built-in keys
<PDF result="doc3.pdf">
<TableOfContents styleReference="myTOC"/>
<PDF source="doc1.pdf" bookmarkTitle="Section 1: _SourceTitle"/>
<PDF source="doc2.pdf" bookmarkTitle="Section 2: _SourceTitle"/>
<p>This was created by <_Author/>.</p>
This example would result in the following table of content entries for doc3.pdf:
Section 1: History of Chocolate ..... 1
Section 2: Chocolate Futures .......200
Along with a watermark which contains the text "This was created by Charlie."
Using style profiles
StyleProfile element can specify information about a package file, header, footer, watermark, 
background, table of contents, and date pattern. Other elements in a DDX document reference the named 
StyleProfile element to specify the corresponding characteristics. 
Referencing StyleProfile element lets you create and maintain a set of named styles that can be used 
in a DDX document as needed. You can reference a style profile in multiple places in the same DDX 
C# PDF File Merge Library: Merge, append PDF files in, ASP.
document file, and choose to create a new PDF file in .NET deleting, PDF document splitting, PDF page reordering and PDF page image and text extraction.
convert pdf to txt online; convert scanned pdf to text
Adding and Manipulating Page Content
Assembler Service and DDX Reference
Using style profiles     117
For example, to include the same header in two or more resultant documents, specify the following DDX 
Enclose a Header element describing the header within a StyleProfile element.
Set the name attribute of the StyleProfile element to an identifying name.
Use this name as the value of the styleReference attribute of all the Header elements to which you 
want to apply the style profile.
The following example places the same header in two different resultant documents.
Example:Using a style profile in two resultant documents
<PDF result="doc2.pdf"> 
<PDF source="doc1.pdf">
<Header styleReference="myProfile"/>
<PDF result="doc4.pdf"> 
<PDF source="doc3.pdf">
<Header styleReference="myProfile"/>
<StyleProfile name="myProfile">
<Left> <!--styled text--></Left>
<Center><!--styled text--></Center>
<Right><!--styled text--></Right>
Each StyleProfile can contain the following elements: HeaderFooterWatermarkBackground
TableOfContents, or DatePattern. There can be at most one of each element. The exception is when 
distinguishing between odd and even pages, in which case there can be two (see “Odd and even pages” 
on page26
Note:In terms of scope, elements that reference definitions within StyleProfile elements are treated 
as if the definition appeared directly inline.
With one exception, any of those elements appearing elsewhere in the DDX can use the 
styleReference attribute to reference the description in the style profile. 
The exception is DatePattern, which cannot appear anywhere other than in a StyleProfile element. 
It formats dates specified by the built-in keys _Created_Modified, and _DateTime. Those keys can 
reference a DatePattern element in a style profile with a styleReference attribute.
A DDX document can contain any number of StyleProfile elements as children of the DDX root 
element. The following example shows the use of two different profiles.
Example:Using two style profiles
<PDF result="doc2.pdf">
<PDF source="cover.pdf" pages="1">
<Header styleReference="cover"/>
<Footer styleReference="cover"/>
<PDF source="doc1.pdf">
Adding and Manipulating Page Content
Assembler Service and DDX Reference
Formatting dates     118
<Header styleReference="body"/>
<Footer styleReference="body"/>
<StyleProfile name="cover">
<DatePattern><DayNumber/> / <ShortMonthName/> / <Year/></DatePattern>
<p><_DateTime styleReference="cover"/></p>
<StyleProfile name="body">
<Center> <StyledText><p>Confidential</p></StyledText></Center>
<_DateTime styleReference="cover"/>
<Footer alternation="EvenPages">
<p>Page <_PageNumber/> of <_LastPageNumber/></p>
<Footer alternation="OddPages">
<p>Page <_PageNumber/> of <_LastPageNumber/></p>
For an example of using StyleProfiles for Package definitions, see “Creating a PDF package” on 
Formatting dates
The built-in keys _DateTime_Created and _Modified can be used to specify dates within 
StyledText elements. These keys have an optional styleReference attribute that references a 
StyleProfile element. This StyleProfile element can contain as a child a DatePattern element 
that specifies formatting for the dates.
Adding and Manipulating Page Content
Assembler Service and DDX Reference
Formatting dates     119
DatePattern can contain a number of child elements that represent the building blocks of a date string, 
along with text. The elements have mostly self-explanatory names such as SecondMinuteHourYear
and TimeZone. They take the current system time when the DDX document is processed and specify how 
to format it.
If only white space is required between two child elements, use one of the following:
Nonbreaking space entity number &#160; 
Space element for the DatePattern element and rich text elements
The default format in situations where DatePattern is not specified is equivalent to what is specified in 
this example:
Example:The default date pattern
For example, Jan 3, 2006 at 12:01am PST would be formatted as 
The following example specifies a header for all the pages in a source document. The Left element of the 
header specifies a formatted date string with a DateTime built-in key inside a StyledText element. The 
DateTime element references the StyleProfile whose name attribute is "greendate".
Example:Using a date pattern
<PDF result="doc2.pdf">
<PageLabel prefix="page "/>
<PDF source="doc1.pdf">
<p color="green" font-weight="bold">
<_DateTime styleReference="greendate"/>
<StyledText><p color="red"><_PageLabel/></p></StyledText>
<StyleProfile name="greendate">
<DayNumber01/>&#160;<ShortMonthName/><Space/><Year/> at 
This DDX would result in a page header with this appearance:
Adding and Manipulating Page Content
Assembler Service and DDX Reference
Formatting dates     120
01 Jan 2001 at 14:03
page 1 
Documents you may be interested
Documents you may be interested