c# httpclient download pdf : How to bookmark a page in pdf document application software tool html windows web page online cpf6-part1356

MarkLogic Server
Debugging and Recovering from Error Conditions
MarkLogic 8—February, 2015
Content Processing Framework Guide—Page 61
10.7 Find Documents in the Error State
When a document fails to complete a pipeline or enters some other error condition, the Content 
Processing Framework places the document in an error state. Because the states are stored as 
properties, you can easily query for documents in the error state. The following query finds all 
documents that are in the error state:
declare namespace cpf="http://marklogic.com/cpf"
declare namespace prop="http://marklogic.com/xdmp/property"
<errorReport>
{
(: set $dir to the document scope for your domain :)
let $dir := "http://myDomainScope/"
let $all :=
for $x in xdmp:directory($dir)
(: only find the documents in the error state :)
where xdmp:document-properties(xdmp:node-uri($x))//cpf:state/text() 
eq "http://marklogic.com/states/error"
return
(: return the document uri and the properties document :)
<errorState>{
(<uri>{xdmp:node-uri($x)}</uri> ,
xdmp:document-properties(xdmp:node-uri($x))/*)
}</errorState>
return
(: count the number of documents in the error state :)
(<countOfErrorStateDocuments>{count($all/prop:properties)
}</countOfErrorStateDocuments>
,
$all)
}
</errorReport>
Note:  This sample query works for the states defined in the Default Conversion Option. 
If you want to search only for 
cpf:error
properties, you can write a query using 
the following expression:
declare namespace cpf="http://marklogic.com/cpf"
xdmp:document-properties()//cpf:error
How to bookmark a page in pdf document - add, remove, update PDF bookmarks in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your C# Project with Rapid PDF Internal Navigation Via Bookmark and Outline
adding bookmarks to a pdf; excel hyperlink to pdf bookmark
How to bookmark a page in pdf document - VB.NET PDF bookmark library: add, remove, update PDF bookmarks in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your VB.NET Project with Rapid PDF Internal Navigation Via Bookmark and Outline
bookmark a pdf file; add bookmarks to pdf online
MarkLogic Server
The Default Conversion Option
MarkLogic 8—February, 2015
Content Processing Framework Guide—Page 62
11.0  The Default Conversion Option
73
This chapter describes the Default Conversion Option, which is designed to convert Microsoft 
Office, Adobe PDF, and HTML files to XHTML and DocBook. It includes the following sections:
• 
Installing the Conversion Pipelines and Framework
• 
Simple Drag-and-Drop Conversion
• 
What the Conversion Pipeline Generates
• 
Understanding and Using the Default Conversion Option
• 
Modifying the Default Conversion Option
11.1 Installing the Conversion Pipelines and Framework
The Default Conversion Option installation installs the Content Processing Framework for your 
database, sets up the domain for the pipeline, loads the needed triggers into the triggers database, 
and performs other pipeline initialization tasks. You need to install the Default Conversion Option 
for each database in which you plan on using conversion. 
Complete the following steps to install the Default Conversion Option into a database.
1.
If it is not already installed, install MarkLogic Server.
2.
Open the Admin Interface to the database page for the database in which you want to 
install the Default Conversion Option. For example, if you want to install the pipeline into 
the Documents database, open the database page for the Documents database.
Note:  MarkLogic recommends creating a new database to use when testing the Default 
Conversion Option.
3.
On the database configuration page, select a 
triggers database
to use with your database 
(for example, Triggers). You can use any database for the triggers database. It can be the 
same database as the one you are configuring (for example, you can set the Documents 
database as the triggers database for the Documents database) or it can be a different 
database (for example, the Triggers database created as part of the installation process).
4.
Click OK to apply the changes to the database configuration.
5.
In the left tree menu, click the Content Processing link under the database to which you 
want to install the Default Conversion Option. The Content Processing Summary page 
appears.
6.
On the Content Processing Summary page, click the Install tab. The Content Processing 
Installation page appears.
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
VB.NET PDF - How to Delete PDF Document Page in VB.NET. Please follow the sections below to learn more. DLLs for Deleting Page from PDF Document in VB.NET Class.
pdf bookmark; creating bookmarks pdf files
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
Easy to Use VB.NET APIs to Add a New Blank Page to PDF Document in VB.NET Program. DLLs for Adding Page into PDF Document in VB.NET Class.
bookmarks pdf file; how to bookmark a pdf file in acrobat
MarkLogic Server
The Default Conversion Option
MarkLogic 8—February, 2015
Content Processing Framework Guide—Page 63
7.
On the Content Processing Installation page, select 
true
for the 
enable conversion
option 
and click Install. Make sure 
enable conversion
is set to 
true
. If this is set to 
false
, then 
you will only install the Content Processing Framework, not the Default Conversion 
Option.
8.
Click OK to confirm the installation of content processing in your database.
9.
When the installation is complete, the Content Processing Summary page appears. It 
should show content processing installed in your database. 
The Default Conversion Option is now installed for the database. The default domain determines 
which documents are processed, and by default it has a document scope that applies to any 
document in the database with a URI starting with a slash (
/
).You can modify the domain 
settings if you want the Default Conversion Option to apply to a different set of documents. To 
modify the domain settings, click the default domain for your database (for example, Default 
Documents if you chose the Documents database) on the Content Processing Summary pages and 
make the needed modifications. For details on domains, see “Understanding and Using Domains” 
on page 26.
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
C#.NET PDF Library - Delete PDF Document Page in C#.NET. Able to remove a single page from PDF document. Ability to remove a range of pages from PDF file.
add bookmarks to pdf file; bookmark pdf acrobat
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
String filepath = @""; String outPutFilePath = @""; PDFDocument doc = new PDFDocument(filepath); // Copy the first page of PDF document.
creating bookmarks in pdf documents; create pdf with bookmarks from word
MarkLogic Server
The Default Conversion Option
MarkLogic 8—February, 2015
Content Processing Framework Guide—Page 64
11.2 Simple Drag-and-Drop Conversion
To try out the pipeline, you need to load some Adobe PDF, Microsoft Office, and/or HTML files 
into the database. You can load the documents using any method you like. This section describes 
an easy way to load documents using a WebDAV server and client. You can then use this 
configuration to test document conversion with the Default Conversion Option. For more 
information on WebDAV servers, see “WebDAV Servers” in the Administrator’s Guide.
Complete the following steps to load and process documents in a database.
1.
Create a WebDAV server with root 
/
that accesses the database in which you installed the 
Content Processing Pipeline.
a. In the Admin Interface, go to the Groups > Default > AppServers page.
b. Click the Create WebDAV tab.
c. Enter a server name (for example, 
CPF
).
d. Enter 
/
for the root.
e. Enter a port number (for example, 
9999
).
f. Select the database in which you installed the content processing pipeline (for 
example, 
Documents
).
g. Click OK.
2.
If you will not be logging into the WebDAV client as a privileged user, set up the needed 
security requirements for your WebDAV root directory and your WebDAV user. For a 
sample of how to set this up, see “Set the Needed Permissions on the Root Directory” on 
page 68.
3.
Create a WebDAV client that accesses the WebDAV server you just created. For example, 
the following procedure applies to Windows XP; other versions of Windows or other 
WebDAV clients have slightly different procedures:
a. Double-click My Network Places from your desktop.
b. Double-click Add Network Place.
c. For the location of the network place, enter the address with the hostname and port 
number of the WebDAV server you created. For example, if your server is on port 
9999 of the local machine, enter the following:
http://localhost:9999
C# PDF Page Insert Library: insert pages into PDF file in C#.net
Support to create new page to PDF document in both web server-side application and Windows Forms. DLLs for Inserting Page to PDF Document.
how to bookmark a page in pdf document; add bookmark pdf
VB.NET PDF File Split Library: Split, seperate PDF into multiple
file by defined page range in VB.NET class application. Divide PDF file into multiple files by outputting PDF file size. Split PDF document by PDF bookmark and
export pdf bookmarks; create pdf bookmarks from word
MarkLogic Server
The Default Conversion Option
MarkLogic 8—February, 2015
Content Processing Framework Guide—Page 65
d. Click the Next button.
e. If prompted, enter a username and password for your WebDAV server.
f. Enter a name for your WebDAV folder (for example, 
conversion
).
g. Click Finish.
h. If prompted, enter the username and password for your WebDAV server.
4.
Drag-and-drop Microsoft Word, Excel, Powerpoint, and/or Adobe PDF files into the 
WebDAV folder. This loads the documents in the database.
5.
After some time has passed, refresh the WebDAV folder (for example, View > Refresh). 
The amount of time it takes to convert depends on the number, size, and the complexity of 
the documents being converted. For simple and small documents, it will take just a few 
seconds. For larger documents, it might take significantly longer.
The converted documents, as well as the original documents and any parts generated as part of the 
conversion, will appear in the WebDAV folder. If you have large documents or if you load many 
documents into the database, the processing might continue for several minutes or longer.
11.3 What the Conversion Pipeline Generates
After the conversion process is finished, for each HTML, Word, Excel, Powerpoint, and PDF 
document you loaded, the Default Conversion Option produces the following:
•  The original document 
•  An XHTML document (
*.xhtml
)
•  A simplified DocBook XML document (*
.xml
)
•  A directory (
*_parts
) containing various parts generated as part of the conversion process. 
The parts are typically any images that were in the original document, a cascading style 
sheet document (
conv.css
), and a document containing an analysis of the stylesheet 
(
css.xml
). PDF documents also include toc.xml, which is an analysis of the table of 
contents structure.
The generated XHTML and XML documents have a URI that includes the suffix of the original 
document. For example, a document called 
word.doc
produces 
word_doc.xml
and 
word_doc.xhtml
.
C# PDF Page Rotate Library: rotate PDF page permanently in C#.net
Using this C# .NET PDF rotate page control SDK, you can easily select any page from a multi-page PDF document file, rotate selected PDF page to special
create pdf bookmarks online; create bookmark in pdf automatically
C# PDF Library SDK to view, edit, convert, process PDF file for C#
APIs for editing PDF document hyperlink (url) and quick navigation link in PDF bookmark. can be drawn and added to a specific location on PDF file page.
convert word to pdf with bookmarks; bookmark page in pdf
MarkLogic Server
The Default Conversion Option
MarkLogic 8—February, 2015
Content Processing Framework Guide—Page 66
11.4 Understanding and Using the Default Conversion Option
The Default Conversion Option uses the components of Content Processing Framework, as well 
as converters to create XML documents from Microsoft Office and Adobe PDF files, to create a 
unified conversion process which converts Microsoft Office, Adobe PDF, and HTML files to 
well-structured XHTML and simplified DocBook format XML documents. This section provides 
some background on how the default conversion process works, and includes the following 
sections:
• 
Components of the Default Conversion Option
• 
Steps in the Conversion Process
• 
Default Conversion Option States
• 
Errors, Troubleshooting, Debugging, and Recovery
11.4.1
Components of the Default Conversion Option
The Default Conversion Option includes the following components:
•  Status Change Handling Pipeline
•  Microsoft Office Pipeline
•  PDF Pipelines
•  HTML Pipeline
•  Supporting XQuery modules
•  Microsoft Office XML converter
•  Adobe PDF XML converter
•  The 
xdmp:tidy
function built into MarkLogic Server
There are also supporting XQuery modules for the Default Conversion Option for the following:
•  Generic Conversion
•  PDF Conversion
•  DocBook Conversion
•  CSS Conversion
•  XHTML Conversion
•  Microsoft Office Conversion
These XQuery modules include the XQuery source code, so you can analyze them and use their 
functions in your own applications. The XQuery modules are installed into the following 
directory:
<install_dir>/Modules/MarkLogic/conversion
For details on these functions, see the MarkLogic XQuery and XSLT Function Reference.
MarkLogic Server
The Default Conversion Option
MarkLogic 8—February, 2015
Content Processing Framework Guide—Page 67
11.4.2
Steps in the Conversion Process
The steps in the conversion process differ for the different document formats (Microsoft Office, 
Adobe PDF, and HTML). The steps are defined in the following pipelines:
•  html-pipeline.xml
•  msoffice-pipeline.xml
•  pdf-pipeline.xml
•  pipeline.xml
Generally, the conversion process perform the following tasks:
•  Check to see what kind of document it is.
•  Convert the document to XHTML based on its type.
•  Cleans up the converted XHTML.
•  Extract the style information into a CSS document.
•  Transform the XHTML to infer the table of contents structure for the document.
•  Transform the XHTML to create a simplified DocBook structured format for the 
document.
11.4.3
Default Conversion Option States
The conversion states are defined in the pipelines and are stored in the properties document for 
each document. The conversion process includes the following states:
•  http://marklogic.com/states/initial
•  http://marklogic.com/states/updated
•  http://marklogic.com/states/xhtml
•  http://marklogic.com/states/cleaned-xhtml
•  http://marklogic.com/states/structured-xhtml
•  http://marklogic.com/states/enhanced-xhtml
•  http://marklogic.com/states/pdf-xhtml
•  http://marklogic.com/states/analyzed-styles
•  http://marklogic.com/states/final
11.4.4
Errors, Troubleshooting, Debugging, and Recovery
This section describes the following error and troubleshooting situations you might encounter 
with the Default Conversion Option:
MarkLogic Server
The Default Conversion Option
MarkLogic 8—February, 2015
Content Processing Framework Guide—Page 68
• 
Microsoft Word 95 and Other Microsoft Office Errors
• 
Set the Needed Permissions on the Root Directory
• 
Default or Inherited Collections and Permissions
• 
Enable Debugging Capabilities
• 
Create Your Own Error Handling Pipeline
11.4.4.1 Microsoft Word 95 and Other Microsoft Office Errors
The Default Conversion Option only converts Microsoft Office 97 and newer documents; it 
cannot convert Microsoft Office 95 and earlier documents. If you try to convert Microsoft 
Word 95 or older documents (or other Microsoft Office 95 documents), the conversion will fail, 
putting the document in the 
http://marklogic.com/states/error
state. If this happens, you can 
do the following:
•  Find all of the documents that are in the error state (For details, see “Find Documents in 
the Error State” on page 61).
•  Open the documents in a newer version of Microsoft Word and then re-save them (as 
newer Word documents, not Word 95 or older documents).
•  Reload the saved files into the database. 
Once you reload the documents into a database with content processing installed and configured, 
the new documents will be converted.
There are other types of errors you might get with Microsoft Office documents. For example, if a 
document is password protected, the conversion will fail because it needs the password to open 
the document. In general, you can address these types of issues by opening the document in the 
appropriate Microsoft Office application, changing the cause of the error (for example, removing 
the password protection), re-saving the document, and reloading the document into the 
conversion domain.
11.4.4.2 Set the Needed Permissions on the Root Directory
When you add documents to the database for conversion, the user who adds the documents must 
have the needed permissions to add and modify documents. If you are using WebDAV server to 
drag-and-drop documents into the database, the root directory of the WebDAV server must also 
have the needed permissions.
One simple way to accomplish these security requirements is to do the following:
•  Create a URI privilege for the URI that is configured as the root directory of your 
WebDAV server.
•  Create a role that has the URI privilege and has default permissions of read. insert, and 
update for the role.
MarkLogic Server
The Default Conversion Option
MarkLogic 8—February, 2015
Content Processing Framework Guide—Page 69
•  Set the permissions on the WebDAV root directory for the role you created. For example, 
if the role you created is named 
webdav
, and the root directory has the URI 
/webdav/root/
run a query (as a privileged user) similar to the following:
xdmp:document-set-permissions("/webdav/root/",
( xdmp:permission("webdav", "read"),
xdmp:permission("webdav", "insert"),
xdmp:permission("webdav", "update") ) )
You can check the permissions with the following query:
xdmp:document-get-permissions("/webdav/root/")
•  Grant the new role (
webdav
in the example above) to the user who accesses the WebDAV 
server.
11.4.4.3 Default or Inherited Collections and Permissions
If you are using a collection in the domain to specify which documents to convert, the new 
documents created by the conversion process must be created as part of the collection specified in 
the domain. You can do this in the following ways:
•  Set the 
inherit collections
option at the database level to 
true
and make sure the parent 
directory belongs to the collection.
•  The user who runs the Default Conversion Option (that is, the user who originally creates 
the documents to be converted, whether by drag and dropping into a WebDAV folder or by 
some other means) can have the collection specified as a default collection (or a role to 
which the user is assigned). 
•  You can explicitly set the collection on a document (for example, in your XQuery module 
code or through XDBC).
Otherwise only the first phase of conversion will occur (because documents created during the 
conversion process will not be part of the collection specified in the domain). Similarly, you must 
have either the appropriate default permissions assigned to the user (or a role to which the user is 
assigned) or you should set the permissions to inherit at the database level. 
For information on inherited collections and inherited permissions, see the Administrator’s Guide. 
For information on permissions, see Understanding and Using Security Guide.
11.4.4.4 Enable Debugging Capabilities
If you need debugging capabilities, you can set trace events on the server for the Content 
Processing Framework. For details, see “Debugging and Recovering from Error Conditions” on 
page 54.
MarkLogic Server
The Default Conversion Option
MarkLogic 8—February, 2015
Content Processing Framework Guide—Page 70
11.4.4.5 Create Your Own Error Handling Pipeline
If you have special error handling needs, you can always extend the Default Conversion Option 
application by adding your own custom error handling pipeline. For details on pipelines and 
creating custom code, see “Understanding and Using Pipelines” on page 31 and “Using the 
Framework to Create Custom Applications” on page 48.
11.5 Modifying the Default Conversion Option
This section describes ways to modify the Default Conversion Option, and includes the following 
subsections:
• 
Copy Defaults and Modify
• 
PDF Alternate Pipelines
• 
Modifying the Options for Default Conversion
11.5.1
Copy Defaults and Modify
All of the XQuery code and all of the pipelines for the Default Conversion Option are installed 
with MarkLogic Server. The pipelines are installed in the following directory:
<install_dir>/Installer
The XQuery modules are installed under the Modules directory in the following location:
<install_dir>/Modules/MarkLogic/conversion/actions
You can create your own pipelines by copying and modifying the Default Conversion Option 
code to suit your needs. Make sure you understand domains, pipelines, the concepts of the 
Content Processing Framework, and the rules for XQuery modules in content processing 
applications before modifying the pipelines. For information on these topics, see the rest of this 
document. 
The modification possibilities are endless. You can add phases to the pipeline to do your own 
processing, add email notification to your application, add entity extraction from a semantic 
tagging service, and so on. For information on creating custom applications, see “Using the 
Framework to Create Custom Applications” on page 48.
Documents you may be interested
Documents you may be interested