selectpdf c# : Create pdf bookmark control SDK platform web page wpf .net web browser dml09-conversion0-part1547

MathML-aware article conversion from L
A
T
E
X.
Acomparison study.
Heinrich Stamerjohanns, Deyan Ginev, Catalin David, DimitarMisev,
VladimirZamdzhiev, Michael Kohlhase
Computer Science,Jacobs University Bremen
<first initial>.<last name>@jacobs-university.de
Abstract. Publishing in Mathematics and theoretical areas in Com-
puter Science and Physics has been predominantly usingT
E
X/LAT
E
Xas
aformattinglanguagein thelasttwodecades.This largecorpusof born-
digital materialis both aboon | L
A
T
E
Xis semi-semanticformat where
the sourceoften contains indications of theauthor’s intentions| and a
problem|T
E
Xis Turing-complete andauthors use thisfreedomtouse
thousands of styles and millions of user macros.
Several tools have been developed toconvert T
E
X/LAT
E
Xdocuments to
XML-based | i.e. Web and DML-compatible formats. Dierent DML
Projects use dierent tools, and the selection seems largely accidental.
Toputthechoiceofconvertersfor DML projectsontoamoresolidfoot-
ingand toencouragecompetitionandfeatureconvergencewesurveythe
market. In this paper we investigate and compare ve LAT
E
X-to-XML
transformers in three dimensions: a) ergonomic factors like documen-
tation, ease of installation, b) coverage, and c) quality of the resulting
documents (in particular the MathMLparts).
1 Introduction
Publishing in Mathematics and theoretical areas in Computer Science and
Physics has been predominantly using T
E
X/L
A
T
E
Xas a formatting language in
the last two decades. This large corpus of born-digital material is both a boon
|L
A
T
E
Xis semi-semantic format where the source often contains indications of
the author’sintentions|andaproblem|T
E
XisTuring-completeandauthors
use thisfreedomto use thousands ofstylesand millions of user macros.
On the other hand there is a growing eort to make mathematical publica-
tions available on the Internet in formats that are more adapted to the Web
than PostScript or PDF (which can readily be produced from T
E
X/LAT
E
X by
standard tools). Even though there are competitors, MathML [ABC
+
03] seems
to be the format of choice forrichmathematical content on the web, because it
supports high-level services like aural rendering (e.g. in Internet Explorer with
MathPlayer)or formula search [MM06,KS06].
Several tools have been developed to convert T
E
X/LAT
E
X documents to
XML+MathML-based | i.e. Web and DML-compatible formats. Some tools
Create pdf bookmark - add, remove, update PDF bookmarks in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your C# Project with Rapid PDF Internal Navigation Via Bookmark and Outline
create bookmarks in pdf from excel; creating bookmarks pdf
Create pdf bookmark - VB.NET PDF bookmark library: add, remove, update PDF bookmarks in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Your VB.NET Project with Rapid PDF Internal Navigation Via Bookmark and Outline
create bookmark pdf file; bookmarks pdf file
2
use the T
E
Xengine to parse the original LAT
E
Xsource, other tools try to reim-
plementacompleteT
E
Xparsertohavefullcontroloverthedocumentprocessing.
Dierent DMLProjectsuse dierenttools, andthe selectionseems largely acci-
dentalorgovernedby personal acquaintances. To name justtwo: the arXMLiv
project [SK08,arX] at Jacobs University uses LaTeXML [Mil09] for convert-
ing the Cornell ePrint arXiv [ArX07] whereas the NUMDAM and CEDRAM
projects[Bou08] use Tralics [Tra09].
In this paper we try to put the choice of converters for DML projects onto
amore solid footing and to encourage competition and feature convergence by
surveying the LAT
E
Xto XML+MathML transformation market and comparing
veavailablesystems.InSection2webrie y presenttheve testedsystemsand
compare themon the ergonomic factorslike documentation, ease ofinstallation.
In section 3 we investigate coverage, andquality ofthe resulting documents (in
particularthe MathMLparts)onacorpusofsample scientic articlesfromthe
arXivePrint server [ArX07].
This paper is short version of [SGD+09] which contains additional details,
will be kept up to date with new versions of the converter and will feature
extended tests, system updates and furthersystems.
We are utilizingourexperience,resources,andpartsofthebuildsystemfrom
the arXMLiv[SK08] project forthese tests, but we are trying ourbestto give
aneutral representation of the systems studied here and to avoid biases in the
presentation.Ifwe have misrepresentedany partsofthe systems,please feelfree
to contact the authors.
2 The Systems
In thispaper we investigate and compare ve LAT
E
X-to-XML transformersthat
generateMathMLoutput:Hermes,Tralics,LaTeXML,TeX4HTandTtM.
In addition to these ve systems we have found other T
E
X-to-XMLtransla-
tors (see [WG09] for a relatively complete list and references to system home-
pages) which we could not notinclude inour comparison forvarious reasons.
1. theBlaTeX, itex2mml, RiTeX
1
,MathMLStudioLite onlyconvertasubsetof
T
E
X/L
A
T
E
Xformulaeto MathML, butdo notseemto havea documentlevel.
They are more directedtowards authorsofmathematicaldocuments on the
web rather than born digital DML eorts. Therefore we have not included
them into the current study. But our comparison methods should apply to
themaswell, so we may include themin future studies.
2. The HeVeA, and LaTeX2html, transform LaTeX documents to HTML, but
do notseem to generate MathMLoutput (only images of formulae).
3. The University ofWestern Ontariooersanonline service [Wat09] totrans-
late documents into MathML. The software is supposedly written in Java.
We have asked forthe code but have notreceived an answer.
1
Not yet on [WG09],but see http://ritex.rubyforge.org/
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Text. Add Text Box. Drawing Markups. PDF Print. Work Barcode Read. Barcode Create. OCR. Twain. Create
how to create bookmark in pdf automatically; export pdf bookmarks to excel
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
Easy to create searchable and scanned PDF files from Word. Ability to get word count of PDF pages. Change Word hyperlink to PDF hyperlink and bookmark.
add bookmarks to pdf preview; create pdf with bookmarks from word
3
4. LXir[Sci09] has beenwritten by EDPSciences under the GPL. It claims to
to transform LAT
E
Xto XML. The authors have been unable to compile the
software,andsince detailedinstructionsareonly availableinFrench,wealso
leftthistool out.
5. Omega[PH]hasbeendiscontinuedandseemstobemergedinto LuaTeXwhich
issupposedto be anextendedversionofpdfTeX writteninLua.Theproject
is at an early stage and aims to supportthe OpenType mathof Microsoft.
In the following we will brie y give an overview overthe systems, theirstate
of development, their approach to the conversion problem and deployment and
discussinstallationandusabilityissuesthatmayplay aroleinmakinga decision
for a DML project.
Hermes
Hermes is a grammar based translator from (AMS)L
A
T
E
X to
Unicode(utf-8) encoded XML+MathML+metadata, however transformation of
pure (AMS)T
E
Xdocuments is not supported. MathML is the only valid XML
vocabulary and is also the only output format implemented and supported
currently by Hermes.
Thesystemis available fordownloadfromHermes’ ocialsite[Ang09b]. Itis
licensedunderGNUGPLandiseasy andstraightforwardto install fromsource.
Hermes works on Linux, Windows and OS X. However, the latest version of
the transformer 0.9.12 was released on 28 Nov. 2006 and development on it
hasbeendiscontinued. The documentationthat isavailable for Hermes isvery
scarce and contains only a very briefdescriptionof how Hermes works and its
usage, installation requirements and a shortdescription of the Hermes output
document.
Hermesworks,intheory,by semantically seeding a copy ofthe T
E
Xsource,
then uses latex on it and parses the resulting dvi le to form the MathML
output, which is a re ection of the T
E
Xsource. In practice this is achieved by
using a binary seed thatisobtained after compiling the source, using latex on
the semantically enriched le, followed by using the second binary hermes and
nally usinganxsltstylesheet.One stylesheetisavailable aftertheinstallation,
but others can be alternatively used. The command-line interface is very user-
unfriendly,no options can be speciedto customize/control the conversion (not
even a help option isavailable).
Hermes doesnot produce any information during the conversion except for
the logproduced by LAT
E
X, which howeverdoesnotindicate whether or notthe
conversionof the le was ultimately successful as it can fail at the later stages.
The conversion ofa large number of les is impractical, because of the absence
ofappropriate logleswhichmakesthe taskofevaluatingtheconversionharder,
since the observations have to be based on other criteria.
The conversion isslow mostly due to the use ofLAT
E
X, the Hermes binaries
however perform very fastin mostof the cases.
Tralics
Tralics is designed to translate LAT
E
Xsources into a customXML
representation with an outlook for a successive conversion to PDF or HTML.
The software is licensed under CeCILL[CeC09], which is a GPL-like license,
conformant with French law in particular. The original target of Tralics is
C# Create PDF from Word Library to convert docx, doc to PDF in C#.
Easy to create searchable and scanned PDF files from Word. Able to get word count in PDF pages. Change Word hyperlink to PDF hyperlink and bookmark.
creating bookmarks in pdf from word; add bookmarks to pdf reader
VB.NET PDF Convert to Tiff SDK: Convert PDF to tiff images in vb.
Qualified Tiff files are exported with high resolution in VB.NET. Create multipage Tiff image files from PDF in VB.NET project. Support
create bookmark in pdf automatically; export pdf bookmarks to text file
4
the conversion of annual activity reports[Gri03], with an outlook for ease of
customization via conguration les.
The software is readily available online[Tra09] and is deployable both from
source or a respective binary for eitherLinux, Mac OS or Windows. There is a
separationbetween\main"and\extra"functionality,where the \main"package
provides the conversion to XML, while the post-processing to HTML and PDF
resides in an additional bundle.
Anextensive documentation regarding use and customization is directly ac-
cessible online. The information is conveyed from a developer perspective, de-
scribing customization and extensibility. However, there could be more precise
guidelines regarding the usability of Tralics, building on the currently vague
overview of the dierent option switches. As for the \extra" bundle, the auxil-
iary post-processing stylesheets are explained from a low-level perspective, yet
no solid high-level use casesare given,making themhard to use outofthe box.
In its current form, the extensive documentation would be of great help to de-
velopers who are willing to extend or customize the processing, but it could be
improved furtherto help users interestedin using Tralics.
Tralicsuses the T
E
Xparser to expand the documentrecursively, stopping
whenthepageshavebeenconstructed.Consequently,theC++engineconstructs
the XMLdocument tree and convertsthe mathematics to MathML, also inte-
grating bibTeX in the resulting XML document. The conversion to the custom
XMLformatsupportsMathMLasa defaultrepresentationformathematicsand
can output images asan alternative.
LaTeXML
LaTeXML has been developed to support the creation of the
Digital Library of Mathematical Functions[DLM09]. It is written in Perl and
triestoemulateT
E
X. Anadditionalpost-processorconvertstheXMLdocument
into HTML orXHTML with MathML support.
LaTeXMLisfreelyavailable online[Mil09]andcanbeinstalledasapackage
or from source on Linux or Mac OS systems. Since it is written Perl it should
run onWindows, butso far it seemsthatnobody has actually tried to installit
on that platform.
Avery detailed manual iseither available online or as a 130-page PDF doc-
ument. It providesdetailed information about the architecture of this T
E
Xem-
ulator, as well as detailed chapters about customization, command usage and
post-processing.
The LaTeXML system consists of a T
E
Xemulator, an XML emitter, and
apost-processor. To cope with L
A
T
E
X documents, the system needs to supply
LaTeXMLbindings (special directivesfor the XML emitter) for the semantic
macros in LAT
E
Xpackages.
For the XML conversion, latexml processes a T
E
X or LAT
E
X document.
latexml loadsthe LaTeXMLbindings for the LAT
E
Xpackagesusedinthe doc-
umentandgeneratesa temporary LTXMLdocument,which closely mimicsthe
structure of the parse tree of the LAT
E
Xsource. The LTXML format provides
XML counterparts of all core T
E
X/LAT
E
Xconcepts, serves as a target format
C# Create PDF from Tiff Library to convert tif images to PDF in C#
Create PDF from Tiff. |. Home ›› XDoc.PDF ›› C# PDF: Create PDF from Tiff. Create PDF from Tiff in both .NET WinForms and ASP.NET application.
how to add bookmarks to pdf document; adding bookmarks in pdf
C# Create PDF from Excel Library to convert xlsx, xls to PDF in C#
C#.NET PDF SDK- Create PDF from Word in Visual C#. Online C#.NET Tutorial for Create PDF from Microsoft Office Excel Spreadsheet Using .NET XDoc.PDF Library.
how to add bookmarks to pdf files; how to bookmark a page in pdf document
5
for LaTeXML, and thus legitimizes the XML fragments in the LaTeXML
bindings.
In the post-processing phase, the L
A
T
E
X-near representation is transformed
into the target format by the latexmlpost program. This program applies a
pipeline ofintelligent lterstoits input. The LaTeXMLprogramsuppliesvar-
ious lters, e.g. for processing HTML tables, including graphics, or converting
formulae to Presentation-MathML. Otherlterslike transformation to Open-
Math andContent-MathMLare currently under development.
The speed ofthe conversion is ratherslow, foreach document a new process
needs to reload all needed bindings and perl modules.
TeX4HT
TeX4HT is one of the T
E
X based transforming system which is
mainly dedicated to output hypertext, though not restricted to that. Actually,
one ofthe mostinteresting characteristicsofthe TeX4HT system is the multi-
tude ofoutput formats this system supports.
The system is available online on the ocial website[Tex09]. This isthe rec-
ommended place to get it for installation, though it’s also possible to install it
fromthe repositories of some major Linux distributions (Ubuntu, Fedora).
In order to transform a le, the system modies and compiles the .tex le
with L
A
T
E
X, then runs the actual TeX4HT components in order to output a
.xml le which corresponds to the MathML and XHTML standards. By doing
that, the system actually supports all the L
A
T
E
X constructs that are available
on the systemand does notrequire any furtherbindings. The documentationis
available on the website and is simple and well organized. Being neither overly
technical, nor shallow, itprovides ease of access and understanding to any type
of user.
Biggestdrawback of TeX4HT isthe lack ofdebugging support. Firstofall,
by running LAT
E
X, the system is highly dependent on the status of the LAT
E
X
parsing and output, which makes batch testing rather dicult (in case L
A
T
E
X
hitsan error, the entire conversion processwould stop). Evenifthe error in the
L
A
T
E
Xsource would get corrected, the output still has chances of being broken
(invalidXML isthe most common, since TeX4HTdoes notguarantee thatthe
output is correct and suggests an external XML validator for checking that).
The log that is created corresponds to the LAT
E
Xlog le and is completed only
by a small amountofinformation aboutthe actual TeX4HT conversion.
Regarding the speed of the transformation process, the results are hindered
because of LAT
E
Xwhich is ran on a le three times, process which takes a lot
of time, while the actual TeX4HT script is written in C, giving very good
conversiontimes.
TtM
TtM is a T
eX t
o M
athML translator that has essentially all of the
capabilitiesofthe TeXtoHTMLtranslatorTtH,sinceitderivesfromthe same
code base. Itsupports all the complexities of T
E
Xexceptfor some featuresthat
do not translate readily into HTML. In most cases, T
E
Xand L
A
T
E
Xdocuments
thatconform to the appropriate standards will translate immediately.
TtM is available for WindowsandLinux platforms (only the Linux version
being free) online[TtM09].
C# Create PDF from PowerPoint Library to convert pptx, ppt to PDF
C#.NET PDF SDK- Create PDF from PowerPoint in C#. How to Use C#.NET PDF Control to Create PDF from Microsoft PowerPoint Presentation in .NET Project.
bookmark a pdf file; pdf bookmark
C# Create PDF from images Library to convert Jpeg, png images to
Create PDF from Images. |. Home ›› XDoc.PDF ›› C# PDF: Create PDF from Images. C#.NET PDF - Create PDF from Images in C# with XDoc.NET PDF Control.
pdf bookmark editor; creating bookmarks in a pdf document
6
TtM does not call the LAT
E
Xor T
E
Xprograms at all by default(instead it
triesto imitatehowthey work),andisnotspecicallydependentuponanyother
programs being installed on the translating system. Its portability is therefore
virtually universal, andinstallationisassimpleasextractinganarchive. TtMis
written using the  ex language, fromwhicha C executable is produced, making
itextremely fastindefaultmode. Conversionofeven large TEX lesisamatter
of a second or two, which makes it very suitable for use in an online script to
outputHTML directly fromTEX source.A very wellstructureddocumentation
comesbundledinthe distributionarchive.Themanualisrathershortandsimple
but covers pretty much all aspects of TtM, and is very easy to follow even for
the notso experienced users.
Almost all of T
E
X’s mathematics is supported with the exception of a few
obscure symbols that are absent from the fonts normally available to browsers.
L
A
T
E
Xsupportincludes essentially all mathematics plus mostofthe vital L
A
T
E
X
constructs. Although macro denitions are fully supported, TtM does not un-
derstand T
E
X category codes (catcodes), therefore it will not work for some
low-level T
E
X/L
A
T
E
X. In general, TtM will perform great on fairly vanilla
T
E
X/L
A
T
E
X, but it will fail if many unusual packages or style les are being
used.
3 Coverage and Processing Speed
In this section we will evaluate the coverage ofthe converters. For thiswe chose
the arXivcorpus, since it can be considered asone of the mostcomprehensive
sources of heterogeneous T
E
X/LAT
E
X documents. It contains more than a half
million of scientic papers from elds including Physics, Mathematics, (compu-
tational) Biology, and Computer Science from two decades. In our experience,
the corpusgivesa goodcross-section overthe T
E
X/LAT
E
Xinthe wild. Ofcourse
we cannot run the converters over the whole corpus (a complete run of La-
TeXMLisinthe orderofa processor-year),thereforewe have chosen arandom
sample of1000 documents.
Addressing coverage ofconvertersisnot straightforward, since there are dif-
ferent degrees of failure and reasons for them. Following our analysis for the
arXMLiv project [arX] we will concentrate on the three error classes thatcan
be established for all systems.
incomplete The converterdid notcomplete the conversionand crashed orsig-
nalledafatalerror.Forsomesystemwecanidentifysubclasseslike\timeout"
or \fatal error".
complete with errors The convertercompletedconversions, but signalled er-
rors. Some system give more indications on what the errors might be, a
commonone would be \missing macros", where some style le couldnot be
processed.
success The converter completed the conversion with no problems or only
\warnings" (i.e. problems the converter classies as minor).
7
Note thatthe assessmentinthis section only reliesonthe problemsreportedby
the systemsthemselves| apartfromprocessing speedand systemcrashesthat
canbemeasuredobjectively.Ofcoursesystemdiagnosticsmaybeinaccurate;for
instance asystemmay reportsuccessandonly produce anempty resultle.But
for the large numberofdocuments needed forstatistical validity in the coverage
tests, we cannotrunmanual quality controls. We have made quality evaluations
for the generatedMathML on a sample in the next section.
Hermes Coverage
Results
Count
%
incomplete
653
65:3
witherrors
0
0
success
347
34:7
The statistics were obtained by writing a script to
run Hermes over all of the les. 65:3% of the con-
versions resulted in producing an empty output le,
while34:7%ofthemwereconsideredsuccessful.Her-
meshasverypoordebuggingfeaturessothestatistics
are not based on Hermes’s report, but by running
Validator[Val09] on the generated output. According to Validator[Val09], all of
the les that Hermesproduced which are notempty are well-formed. In most
cases, after running latex on the seeded copy of the T
E
Xle there are many
warnings and some errors produced by it, which is overcome by running latex
in batch mode, and out of the 653 unsuccessful conversions, 362 failed at this
point. Running Hermeson all ofthe les took approximately 20 minutes.
Tralics Coverage
Results
Count
%
incomplete
0
0
witherrors
984
98:4
success
16
1:6
Duetoitsoriginally narrowscopeofcoverage,Tral-
ics encountered a substantial amount of undened
command sequences, giving it a success rate of only
about two percent. Considering that the conversion
is based on conguration les that dene the XML
translation of the dierent LAT
E
X commands, using
it to process a general selection of scientic LAT
E
Xarticlescould not lead to an
immediate success. Many ofthe documents ofthe arXivcorpususe specialized
packages and classes, either imposed by community standards, or as personal
convenience formacro denitions. Tralicsmet50 undened commandsonthe
average document,being properly setupand aware ofitsstandardconguration
les.Ontheotherhand,the conversionwasperformedinonlythreeminutesand
produced an XML output for each input article, regardless of the encountered
errors. A check for well-formedness showed 93% of the les were proper XML,
hence even an erroneousconversioncould be potentially utilized. Forsuchbatch
jobs, one can choose to run in a verbose or quiet mode, to save the details in a
log le and whether to use MathML for trivial math formulas, to name a few
useful options.
LaTeXML Coverage
Results
Count
%
incomplete
103
10.3
witherrors
357
35.7
success
540
54.0
It has to be mentioned that LaTeXML has an ad-
vantage here. Because of the ongoing arXMLiv ef-
fort many binding les have beenwritten to support
specically style les that are typically found in sci-
enticarticles.Therefore LaTeXMLdoesanicejob,
89%ofthe documentshavebeensuccessfullycreated
asXHTML. Howeverfor35.7%ofthe documentsLaTeXMLcannotguarantee
8
that the XHTML will be rendered fully correctly. Most ofthese converted doc-
uments rather have problems with layoutoriented packages, which is irrelevant
for XML.
Thetimetoprocessthese1000documentsisratherlong:morethan1.5hours
are needed to convertall documents.
TeX4HT Coverage
Results
Count
%
incomplete
414
34.33
witherrors
332
27.53
success
450
38.14
Asmentionedbefore,the TeX4HTsystemshouldbe
versatile because it actually runs L
A
T
E
Xon the les
and only afterwards calls the actual transformation
scripts that work on the DVI and lg les. However,
LAT
E
X is called three times in order to ensure that
the references are correct, action that, in the batch
testingthatwe made,takesalotoftimeand,becauseoferrors,hasthetendency
tointerrupttheactualconversionprocess.Thisissuehasbeenovercome byusing
aBASH scriptthatsetsatimeoutforthe conversionofeachle. One important
note aboutthe TeX4HTsystemisthat,incase oflargeles, itsplitsthe actual
leinmultipleles(thingwhichwasnowheretobefoundinthedocumentation),
thusresultingalargernumberoflesthanintheothersystemsthatweretested.
Running the system over all the documents, with a timeout of 60s for the
transformation of each individual le lasted, on average, for 90 minutes (result
mainly in uenced by the LAT
E
Xparsing).
TtM Coverage
Results
Count
%
incomplete
270
27
witherrors
650
65
success
80
8
In 40 seconds TtM managed to successfully convert
only 8% of the 1000 les. The low success rate is
mainly due tothe factthatTtMdoesn’tunderstand
category codes and nusepackage, which makes itun-
suitable forconverting general scientic papers.
Thisrunclearly shows thatTtMisanextremely
fast tool which needs about 0.04 seconds on average to convert a T
E
Xle to
XHTML+MathML. Onaverage there were 100 warningsperle, mostofwhich
relatedtoconvertingunknowncommands/environments,unknownbibitemsand
missingbibcites. 651errorsin total were reported, 30 ofwhich fatal (fatal errors
result in an immediate termination of the conversion producing an incomplete
XHTML output).
4 MathML Quality Evaluation
Inthissectionwewillevaluatethe qualityofMathMLformulaegeneratedbythe
ve tested converters. The overall test methodology is to establsh a \Formula
Quality Test Corpus" (FQC) consisting of a small set of non-trivial formulae
randomly chosen from the arXMLiv corpus.
Here we only have space to report the highlights of this evaluation on a
single example,thefull resultscanbefoundinAppendicesA toEof[SGD
+
09].
Generally, the quality of the generated XML is judged in terms of the
XHTML+MathML quality i.e. CSS usage, presentation vs content MathML,
9
4r
2
Z
=2
0
cos
2
d = 4r
2
Z
=2
0
1
2
(1+cos2)d
=2r
2
=2
0
+2r
2
Z
=2
0
cos2d
=r
2
+2r
2
(sin2)
=2
0
=r
2
Fig.1. An exampleformulatocheckthe quality of the converters
and formula tree quality. In particular addressing questions like: Is the re-
sulting XML valid? Can we revert back to LaTeX? Are formulae like x +y
2
disambiguated, etc.?
4.1 The Eqnarray* Environment
Here we examine particular features of the LAT
E
X to MathML conversion of
the example in Fig.1, which either make a rendering dierence or reveal an
interesting design choice ofthe conversion.
Representing Eqnarray Asa multi-line equation environment, eqnarray re-
quiresa tablerepresentationinXHTML.The solutionshere varyfromusing
aMathML hmtablei (Tralics,TeX4HT,TtM), through using only HTML
htablei, each cell of which has a separate math construct (LaTeXML), to
acombination ofboth (Hermes). Using only hmtablei allows to obtain an
equivalent mathematical fragment to the original and should be the long
term goal of all converters. However, pragmatic Al reasons, such as miss-
ing browser support for references (via the hmlabelledtri element), justify
the HTML htableiapproach, in the contextofthe current state ofart. The
mixed solution employed by Hermes, however, embodies the worst of both
approaches with an additionally crippledalignment ofthe rendering.
Operators and Symbols To represent mathematical operators, the convert-
ers start with a plain use of the hmoi element (Hermes) and enhance this
representationwithadditionalattributes, wheneverpossible. TeX4HTuses
the \class" attribute to achieve a better rendering of the symbols, while
Tralics uses the \form" attribute for their better positioning. Addition-
ally, LaTeXML makes use of \movablelimits", to achieve a deterministic
rendering of scripts. It is interesting that every converter has come with its
own disjoint enhancement, hence giving an outlook for an improved ren-
dering by making use of dierent attribute combinations, as each attribute
contributesto the quality ofdisplay.
Math spaces Spacingseemsto be adelicateissuetomostconverters. Hermes
andLaTeXMLforgetany spacinginformationwhenconvertingtoXHTML,
10
(a) Hermes
(b) Tralics
(c) LaTeXML
(d) tex4ht
(e) TtM
Fig.2. Renderedrepresentation of produced output in refox
which leadsto avery poordisplay ofdensely stackedsymbols. However, La-
TeXML tries to avoid this by adding its own heuristics to the processing,
addingan&ApplyFunctions;mathoperator,whereveritconsidersappropri-
ate. This leads to a satisfactory result when guessed correctly, but being a
semantic enhancement, itisnotalwayspresentwhenneeded. This leavesan
impressionofan inconsistentLaTeXMLrenderingofspacing. Ontheother
hand, Tralicsand TeX4HT sharply preserve the spacing from source, in
the formofhmspacei elements. TtMuses a more generic approachtomath
spacing, using only hmii&ensp;h/mii.
The j symbol We have the chance to analyze a symbol that seems to be a
mystery forall discussedconvertersintermsofmatchingitsL
A
T
E
Xrepresen-
tationinMathML.The commonsolutionistoutilize anhmoielementwith
afollowinghmsubsupi,whichis,however,acompletelydierentconcept,and
hence rendering, to the one ofthe LAT
E
Xoriginal. The only alternative solu-
tion comes from TeX4HT, where j is an \open" attribute to an hmfencedi
element. Additionally, thiselement is wrapped with hmstylei, adjusting the
size of j using the \mathsize" attribute. This lands closest to the originally
produced LAT
E
Xdisplay, yetit is still not a perfect solution.
Documents you may be interested
Documents you may be interested