DITA For Publishers User Guide
Conversion of pdf image to text - Convert PDF to txt files in C#.net, ASP.NET MVC, WinForms, WPF application
C# PDF to Text (TXT) Converting Library to Convert PDF to Text
convert .pdf to text; text from pdf
Conversion of pdf image to text - VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net, ASP.NET MVC, WinForms, WPF application
VB.NET Guide and Sample Codes to Convert PDF to Text in .NET Project
convert pdf file to text document; best pdf to text converter for
Contents
...........................................................................................................................................................4
About This Book..............................................................................................................................5
Release Notes....................................................................................................................................6
Release Notes: Version 0.9.16..............................................................................................................................6
Release Notes: Version 0.9.15..............................................................................................................................6
Release Notes: Version 0.9.14..............................................................................................................................7
Release Notes: Version 0.9.13..............................................................................................................................7
Release Notes: Version 0.9.12..............................................................................................................................7
Release Notes: Version 0.9.11..............................................................................................................................7
Release Notes: Version 0.9.10..............................................................................................................................8
Release Notes: Version 0.9.9................................................................................................................................8
Introduction to DITA For Publishers..........................................................................................10
The DITA For Publishers Open Toolkit Plugins........................................................................11
Installing the Toolkit Plugins..............................................................................................................................11
Setting Up The kindlegen Command-Line Utility..................................................................................12
Generating EPUBs and Kindle Books from DITA Content................................................................................12
Generating EPUBs From OxygenXML..................................................................................................13
Generating Kindle Books From OxygenXML........................................................................................13
Using Custom CSS Style Sheets.............................................................................................................14
Creating Cover Graphics and Covers......................................................................................................15
Creating Arbitrary EPUB OPF Metadata................................................................................................15
Implementing Overrides for Common Processing..................................................................................16
EPUB and Kindle Transformation Parameters.......................................................................................18
HTML2 Plugin....................................................................................................................................................21
Understanding the HTML2 Transformations..........................................................................................22
HTML2 Transformation Parameters.......................................................................................................23
Generating DITA from Documents (Word-to-DITA Transformation Framework)...........................................25
The DITA For Publishers Markup Vocabulary.........................................................................26
Understanding the DITA For Publishers Markup Vocabulary...........................................................................26
DITA For Publishers Domains............................................................................................................................28
Publication Map Domains.......................................................................................................................29
Topic Domains........................................................................................................................................29
Rendition Target Attribute Domain........................................................................................................30
Integrating D4P Modules Into Document Type Shells.......................................................................................30
Integrating Attribute Domains.................................................................................................................31
DITA For Publishers Vocabulary Reference......................................................................................................32
The DITA For Publishers Word to DITA and DITA to InDesign Tools..................................33
The Word-to-DITA Transformation Framework................................................................................................34
Getting Started With The Word2DITA Transform.................................................................................34
Generating DITA from Word Using the Toolkit Plugin.........................................................................35
Generating DITA From Within OxygenXML........................................................................................37
Style to Tag Mapping..............................................................................................................................38
Common Style-to-Tag Mapping Cases...................................................................................................42
Troubleshooting the Word-to-DITA Process..........................................................................................48
Word-to-DITA Style-to-Tag Mapping Video Tutorial...........................................................................50
Extending and Overriding the Word to DITA Transform.......................................................................50
Tips for Using Word With the Word-to-DITA Transform.....................................................................52
Word-to-DITA XSLT Transformation Parameters.................................................................................53
Word-to-DITA Ant Parameters...............................................................................................................54
The DITA-to-InDesign Transformation Framework..........................................................................................54
DITA For Publishers | TOC | 2
VB.NET PDF Converter Library SDK to convert PDF to other file
from PDF can be achieved with this VB.NET tutorial of PDF to text conversion. page offers you a piece of vb.net demo code for PDF to TIFF image conversion.
pdf to text; converting pdf to searchable text format
C# PDF Converter Library SDK to convert PDF to other file formats
C#.NET PDF to Jpeg Conversion. If you want to transform and convert PDF document to Jpeg image file format, this article should be read.
change pdf to txt file; convert image pdf to text
Overview of the InDesign and InCopy Products.....................................................................................56
Generating InDesign from DITA Using the Toolkit Plugin....................................................................56
Configuring the DITA-to-InDesign Transformation...............................................................................57
Preparing InDesign Templates for DITA-to-InDesign Use....................................................................60
This is an Appendix.......................................................................................................................64
Colophon.........................................................................................................................................65
DITA For Publishers | TOC | 3
.NET PDF Document Viewing, Annotation, Conversion & Processing
Convert PDF to images, like Tiff. Convert image files to PDF. File & Page Process. Re-order, rotate PDF pages. PDF Read. Extract text from PDF content.
convert scanned pdf to text; convert pdf to text doc
C# PDF Convert to Jpeg SDK: Convert PDF to JPEG images in C#.net
using RasterEdge.XDoc.PDF; Copy demo code below to achieve fast conversion from PDF file to Jpeg image in C# programming. // Load a PDF file.
convert pdf to txt format; c# extract text from pdf
DITA For Publishers |  | 4
VB.NET PDF Convert to Images SDK: Convert PDF to png, gif images
In addition, our PDF document conversion library also enables developers to render and convert PDF document to TIFF and vector image SVG.
best pdf to text; convert scanned pdf to text word
VB.NET PDF Convert to Jpeg SDK: Convert PDF to JPEG images in vb.
using RasterEdge.XDoc.PDF; Copy demo code below to achieve fast conversion from PDF file to Jpeg image in VB.NET program. ' Load a PDF file.
convert pdf to ascii text; extract text from pdf
About This Book
This publication provides general guidance on how to use the various DITA for Publishers (D4P) materials, in
particular, how to install and use the D4P Open Toolkit plugins and how to configure different XML editors to enable
editing of D4P documents.
The DITA For Publishers markup is documented separately in the DITA For Publishers Markup Guide and
Reference.
All DITA for Publishers materials are available through the DITA for Publishers project on SourceForge, http://
dita4publishers.sourceforge.net.
DITA For Publishers | About This Book | 5
VB.NET PDF Convert to HTML SDK: Convert PDF to html files in vb.
image solution, which is designed to help .NET developers convert PDF to HTML webpage using simple VB.NET code. With this Visual PDF to HTML conversion control
convert pdf to text c#; convert image pdf to text
C# Windows Viewer - Image and Document Conversion & Rendering in
Image Conversion. RasterEdge XDoc.Windows Viewer will show how to convert images(include common image files, such as Bitmap, Jpeg, Png, Gif): Convert to PDF.
convert scanned pdf to text word; convert pdf table to text
Release Notes
Details about changes from release to release
The DITA for Publishers materials consists of the following major components. Each component has its own version
number. The package of materials as a whole also has a version number, which is incremented for each release. For
example, the vocabulary modules may be updated without the need to update any of the Toolkit plugins. In that case,
the package and vocabulary version numbers are incremented but the Toolkit version numbers are not. All of the D4P
Toolkit plugins report their individual version numbers when then run.
The components are:
• The DITA for Publishers vocabulary modules, packaged as the Open Toolkit plugin
net.sourceforge.dita4publishers.doctypes.
• The Open Toolkit plugins for EPUB, Kindle, and HTML generation (the "HTML2" plugin).
• The Word-to-DITA transformation framework and Toolkit plugin
• The DITA-to-InDesign transformation framework and Toolkit plugin
The package also contains renditions of the DITA for Publishers User Guide.
The source materials for the DITA for Publishers project are available via anonymous Subversion access (including
Web-based Subversion access) from http://sourceforge.net/projects/dita4publishers/develop.
Release Notes: Version 0.9.16
Version 0.9.16 released 21 March 2011
Extensible transformation types (HTML2, EPUB, etc.)
• Corrected order of import extension point and base includes in top-level _template XSL files.
• Added sample no-op extension for the HTML2 transformation type (org.example.d4p.html2extensions).
Word to DITA
• Added new attribute, 
@styleName
to 
<style>
in style-to-tag-map documents. This allows you to define
mappings in terms of Word style display names rather than style IDs. The 
@styleId
attribute continues to be
supported.
This change addresses an issue seen with documents modified or created in Japanese versions of Word, where all
the style IDs got changed from what they were originally.
The documentation and samples have been updated to reflect the 
@styleName
attribute.
Release Notes: Version 0.9.15
Version 0.9.15 released 22 February 2011
Common XSLT library
• Implemented decoding of escaped UTF-8 characters in URIs.
Word to DITA
• Fixed issue 3186860, Tables with no header row emit empty thead. Tables with no header rows and tables with
only header rows should now produce valid DITA topics.
DITA For Publishers | Release Notes | 6
VB.NET PDF Convert to Tiff SDK: Convert PDF to tiff images in vb.
Using our VB.NET PDF Document Conversion Library, developers can easily convert PDF document to TIFF image file in VB.NET programming.
convert pdf to word editable text online; convert pdf to rich text format
Vocabulary
• Corrected design problem with MathML integration. In order for the 
<eqn-block>
and 
<eqn-inline>
elements
to be normal DITA elements, there must be another level of markup between those elements and the MathML
<math>
elements. I added a new container, specialized from 
<foreign>
, named 
<d4pMathML>
, that then
contains the 
<math>
element. This is the in d4pFormatting domain.
• Added 
<object>
and 
<foreign>
to content of 
<art>
. This allows 
<art>
to used to bind metadata to any kind
of media object or display.
Release Notes: Version 0.9.14
Version 0.9.14 released 7 February 2011
HTML2 Transformation Types
• Corrected bug in generation of index.html file to use name="contentwin" in addition to
id="contentwin". This fixes an issue with handling of links from the dynamic ToC to the content topics
displayed within the iframe.
Release Notes: Version 0.9.13
Version 0.9.13 released 5 February 2011
EPUB and Kindle Transformation Types
• Corrected bug that prevented the coverGraphicUri XSLT parameter from being set correctly by Ant.
• Corrected case of the idURIStub XSLT parameter to match the Ant script and the documentation (changed
"IdURIStub" to "idURIStub".
Kindle Transformation Type
• Removed duplicate definition of global paramter idURIStub.
Release Notes: Version 0.9.12
Version 0.9.12 released 12 January 2011
HTML2, EPUB, and Kindle Transformation Types
• Fixed bug with footnote callouts getting suppressed in topic content.
Release Notes: Version 0.9.11
Version 0.9.11 released 9 January 2011
General
• Fixed bug where plugins unconditionally turned off graphic copying for all transformation types.
DITA to InDesign
• Added new DITA-to-InDesign transformation type.
Note: The transformation type works but is not fully realized or completely documented.
DITA For Publishers | Release Notes | 7
• Added start of documentation for DITA-to-InDesign.
Vocabulary
• Added new experimental "variables" (d4p_variables) domain that is an experiment in using map and topic
metadata to define "variables" that can be defined within a specific map or topicref context.
Release Notes: Version 0.9.10
Version 0.9.10 released 5 Novemeber 2010
EPUB, Kindle, and HTML2 Transformation Types
• Rewrite pointers to CSS style sheets in generated HTML files.
Word-to-DITA
• Added new parameters for suppressing tab and br elements from DITA XML.
• Added parameter to include the back pointers to the original Word document.
Vocabulary
• Corrected all doctype Toolkit plugin descriptors and top-level catalog.xml files to use
dita.specialization.catalog.relative rather than dita.specialization.catalog.
Documentation
• Added more how-to and troubleshooting information for Word-to-DITA transform.
• Recorded video tutorial for Word-to-DITA style-to-tag mapping development. See Word-to-DITA Style-to-Tag
Mapping Video Tutorial on page 50.
Release Notes: Version 0.9.9
Version 0.9.9 released 31 October 2010
EPUB, Kindle, and HTML2 Transformation Types
• Added support for different file organization strategies, with built-in strategies "single-dir" and "as-authored".
Allows customization of organization and naming of output files through new mode "get-topic-result-url".
• Fixed bug with incorrect graphic reference URLs when topics are output into in directory under root directory or
graphics not in directory named "images"
• Fixed bug with literal "&#xA0;" in empty table cells
• Handle paragraphs within span for table descriptions
• Eliminated Toolkit graphic copying during preprocessing
EPUB and Kindle Transformation Types
• Added new parameter epub.exclude.auto.rellinks that turns off auto-generated related links.
HTML2 Transformation Type
• Allow user to specify name of root output file (defaults to "index.html" as for HTML1 transform type)
• Use first navigation topic reference as initial file for root file and frameset
• Refined default CSS for root page
DITA For Publishers | Release Notes | 8
Vocabulary
• Added 
<body-pullquote>
and 
<section-pullquote>
to publication content domain. These elements
specialize 
<bodydiv>
and 
<sectiondiv>
respectively.
DITA For Publishers | Release Notes | 9
Introduction to DITA For Publishers
The DITA for Publishers project applies the DITA standard and DITA technology to the specific requirements of
Publishers as distinct from the requirements of technical documentation. The general goal of the project is to make
creating and using DITA-based solutions for Publishing-specific business challenges as quick and easy as possible by
providing a solid base from which you can start immediately.
DITA For Publishers is an open-source project, currently hosted on SourceForge. It is intended to be a community
effort. The initial work on DITA for Publishers has been sponsored largely by Really Strategies, Inc.
By "Publishers" we mean enterprises whose primary business is producing authored material intended for reading by
humans, e.g., books and magazines, usually where print is (or has been) the primary delivery medium. This category
includes of course publishers of fiction and non-fiction trade books, magazines, journals, textbooks, nature and travel
guides, and so on. It also includes groups within other enterprises who publish materials that are not product manuals
or other very specialized information.
While DITA is often associated exclusively with technical documentation and highly modular information, DITA is a
completely general standard and technology and can be applied to documents of any sort. DITA absolutely does not
require modular writing or breaking all your content into small files or any other particular way of doing things. It
does, of course, support those ways of doing things quite well, but it also supports other ways of doing things just as
well.
As a technology, DITA offers a number of compelling advantages over other XML standards and approaches. In
particular, it enables blind interchange of content while also allowing customized markup. This aspect of DITA is of
vital importance to Publishers where the ability to interchange content with the lowest cost to all parties is of
paramount importance. As a Publisher you want to be able to license your content to others and licence other's
content. You want to be able to reuse components of publications in new packages as quickly and easily as possible.
You want your content to have the highest value for the lowest cost.
DITA enables all of this. The premise of the DITA for Publishers project is that DITA, because of its unique design
and architectural features, provides the lowest possible cost of startup and ownership and provides the highest
possible value for interchange.
But for Publishers (or any enterprise) to be able to take advantage of this value there must be something to start with
that works out of the box and that makes it practical to go forward. That is the goal of DITA for Publishers—to make
getting started with DITA in a publishing context as quick and easy as it can possibly be.
DITA for Publishers does this by providing the following materials:
• A set of DITA vocabulary modules ("specializations") optimized for representing typical Publishing documents,
namely books and magazines. The markup provided by these modules supports the business realities of
Publishing, such as the fact that publications can be quite varied in their structure, that sometimes you have to
capture arbitrary formatting, and on on.
• A set of plugins for the DITA Open Toolkit that support these vocabulary modules.
• An EPUB generation plugin for the DITA Open Toolkit, making it possible to generate publication-ready EPUBs
from DITA-based content.
• A general-purpose Word-to-DITA transformation framework for converting manuscripts in Word into DITA, in
order to support Word-primary editorial processes.
• A general-purpose DITA-to-InDesign transformation framework for generating InDesign articles and documents
from DITA-based content.
• General knowledge and guidance on how to apply the DITA technology and tools to typical Publishing business
processes.
DITA For Publishers | Introduction to DITA For Publishers | 10
Documents you may be interested
Documents you may be interested