Utilities
The Translator’s Tool Box - © International Writers’ Group, LLC C 153
In case you receive a CNT and HLP file for quoting or even translation 
purposes, there’s an easy way to "decompile" the HLP file into its RTF 
components. While there are a number of expensive commercial tools for 
compiling and decompiling WinHelps, under sourceforge.net/projects/
helpdeco you can find the HelpDeco application which allows you to break 
apart your help file and analyze and translate the resulting RTF files (and 
typically any number of image files). 
One file that is also created in the process is an HPJ file, the help project file. 
Though this file is not to be translated, it is important because it contains the 
information on how to re-compile the project once the translation is done. The 
free Microsoft program that can be used to do just that is called Microsoft Help 
The downside is that this is not a particularly user-friendly application. To use it, 
open a DOS window (Start> Programs> Accessories> Command Prompt
and point the HelpDeco application to the help file. So, assuming that you have 
placed the helpdeco.exe at C:\decompile and your help file anycount.hlp is located 
right at C:\ you would enter this:
Pdf form data extraction - extract form data from PDF in C#.net, ASP.NET, MVC, Ajax, WPF
Help to Read and Extract Field Data from PDF with a Convenient C# Solution
how to fill out a pdf form with reader; exporting data from excel to pdf form
Pdf form data extraction - VB.NET PDF Form Data Read library: extract form data from PDF in vb.net, ASP.NET, MVC, Ajax, WPF
Convenient VB.NET Solution to Read and Extract Field Data from PDF
collect data from pdf forms; c# read pdf form fields
Utilities
154
The Translator’s Tool Box - © International Writers’ Group, LLC
Workshop and can still be found at www.helpmaster.info/hlp-
developmentaids-hcw403.htm (Microsoft itself is not distributing it anymore). 
All you need to do to re-compile—i.e., to recreate the HLP file—is to open the 
HLP file with Help Workshop and click Save and Compile.
Figure 111: WinHelp compilation in Microsoft Help Workshop
VB.NET PDF Text Extract Library: extract text content from PDF
control provides text extraction from PDF images and image files. Enable extracting PDF text to another PDF file, and other formats such as TXT and SVG form.
extract data from pdf table; exporting pdf data to excel
C# PDF Text Extract Library: extract text content from PDF file in
Image text extraction control provides text extraction from PDF images and image files. Best C#.NET PDF text extraction library and component for free download.
pdf form data extraction; extract table data from pdf to excel
Utilities
The Translator’s Tool Box - © International Writers’ Group, LLC 155
HTMLHelp
The process for HTMLHelp is similar but much simpler. Unlike the WinHelp 
system, HTMLHelp consists of only one file, the CHM files. True to its name, 
most of the translatable content of an HTMLHelp system is contained in HTML 
files. To "get to" the HTML files, you will also need to decompile the help file. 
Fortunately, both the compilation and decompilation are done with the same 
freely available and easy-to-use tool: HTML Help Workshop
Figure 112: HTMLHelp decompilation in HTML Help Workshop
To decompile an existing help file, just select File> Decompile, locate the 
CHM file, and choose a location to which you would like to export the files. You 
could receive a great number of different file formats, but the most typical 
are:
• HHP: the non-translatable project file (you will need this file to recompile 
the help),
• HHC: the translatable (table of) contents file in HTML format,
You can download the latest version at msdn.microsoft.com/en-us/library/
ms669985%28VS.85%29.aspx.
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
image extraction from multiple page adobe PDF file in VB.NET. Extract multiple types of image from PDF file in VB.NET, like XObject Image, XObject Form, Inline
export pdf form data to excel; change font size pdf form reader
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Support PDF Image Extraction from a Page, a Region on a Page Extract various types of image from PDF file, like XObject Image, XObject Form, Inline Image
extracting data from pdf files; extract data from pdf into excel
Utilities
156
The Translator’s Tool Box - © International Writers’ Group, LLC
• HHK: the translatable index file in HTML format,
• graphic files: these are often translatable and/or have to be replaced with 
newly created target counter-parts and
• lots and lots of HTML files with lots and lots of translatable content.
Before you start with the translation of your HTMLHelp project, here is one 
thing you should be doing first: Talk to your client about the format in which 
the authoring of this project took place. Chances are that it was either 
authored in FrameMaker (like this present manual and help system), in some 
kind of XML form, or even within Word. While it is entirely possible and really 
quite easy to translate the HTMLHelp directly, your client may be much better 
served if you are able to work in the original format. Typically the original 
authoring environment is set up so that the output can be done in various 
formats (PDF, printed materials, web based, help systems, etc.), whereas it is 
much more complicated to do this when you start with a help system.
If your client asks you to translate the help system directly, translate the 
above-mentioned files, replace the graphics (save them under the same name 
and the same location), and then recompile the individual files with HTML Help 
Workshop.
VB.NET PDF Page Extract Library: copy, paste, cut PDF pages in vb.
VB.NET PDF - PDF File Pages Extraction Guide. Detailed VB.NET Guide for Extracting Pages from Microsoft PDF Doc. Free PDF document
extract data from pdf; how to make a pdf form fillable in reader
VB.NET PDF Library SDK to view, edit, convert, process PDF file
PDF Text Extraction. Mature and robust APIs are provided for programmers to integrate and perform PDF text extraction feature in .NET windows and web project.
export excel to pdf form; how to save pdf form data in reader
Utilities
The Translator’s Tool Box - © International Writers’ Group, LLC 157
Once you’ve fixed any possible errors, you can proceed with the compilation in 
HTML Help Workshop. Just select the HHP file (make sure that it’s placed at 
the root of your project folder), select File> Compile, and your help file will 
be all ready to go.
Figure 113: HTMLHelp compilation in HTML Help Workshop
Another concept of translating HTML help files is offered by localization tools 
like Catalyst or Passolo (see Software Localization Tools on page 321) or with 
the translation environment tool Publisher. Here the decompilation and 
recompilation is performed right within the tool (with the support of an 
You can also use HTML Help Workshop to convert existing WinHelp projects. 
When you convert a WinHelp project to an HTML Help project, the New Project 
Wizard converts the WinHelp project (HPJ) file to an HTML Help project (HHP) 
file, the WinHelp topic (RTF) files to HTML Help topic (HTM, HTML) files, the 
WinHelp contents (CNT) files to HTML Help contents (HHC) files, and the WinHelp 
index to HTML Help index (HHK) files.
C# PDF File Permission Library: add, remove, update PDF file
Data. Data: Auto Fill-in Field Data. Field: Insert Choose to offer PDF annotation and content extraction Enable or disable copying and form filling functions.
extract data from pdf form fields; how to type into a pdf form in reader
VB.NET PDF File Permission Library: add, remove, update PDF file
Data. Data: Auto Fill-in Field Data. Field: Insert Choose to offer PDF annotation and content extraction Enable or disable copying and form filling functions.
pdf data extractor; pdf form save in reader
Utilities
158
The Translator’s Tool Box - © International Writers’ Group, LLC
embedded version of HTML Help Workshop) so that the translator can directly 
translate the translatable files within the interface of the respective 
localization tool and the tool will then recompile the CHM files once the 
translation is done.
Figure 114: HTMLHelp file translation in Publisher
If you are translating a help system that was created in MadCap Flare, MadCap 
Lingo would certainly be a good choice for a translation environment tool (see 
page 236). 
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
Merge Microsoft Office Word, Excel and PowerPoint data to PDF form. PDF page deleting, PDF document splitting, PDF page reordering and PDF page image and
saving pdf forms in acrobat reader; edit pdf form in reader
VB.NET PDF Password Library: add, remove, edit PDF file password
passwordSetting.IsAnnot = True ' Allow to fill form. passwordSetting.IsFillForm = True ' Content extraction is allowed. True ' Add password to PDF file.
vb extract data from pdf; using pdf forms to collect data
Office Suites
The Translator’s Tool Box - © International Writers’ Group, LLC 159
Office Suites
It’s hard to imagine that a translator could work productively without some 
kind of office suite, a software bundle that includes word processing, 
spreadsheet and presentation applications, and, depending on the package, 
various other programs.
The most common suites include:
• The open-source LibreOffice (see www.libreoffice.org), an active 
development that stems from the more stagnant Apache OpenOffice 
(see www.openoffice.org); 
• DocsSheets and Slides in Google Drive (formerly Documents
Spreadsheets and Presentations in Google Docs) (see 
drive.google.com); and of course
• Microsoft Office (see office.microsoft.com/products). 
These products include comparable combinations of programs and are 
certainly adequate as office suites for personal or professional use. The reason 
I use Microsoft Office is because so many other programs, especially 
translation environment tools, rely on Word in some way or other, and 
because it is, quite simply, the standard. Though especially LibreOffice and 
Apache OpenOffice stress their compatibility with Microsoft Office, in reality 
conversion problems to and from Microsoft Office remain, and I find it hard to 
imagine that clients who take it for granted that translators are equipped with 
WordExcel and PowerPoint have the patience to deal with conversion issues.
This certainly does not mean that you could not have some of the other suites 
as well, or that some of the other suites are less productive and/or more of a 
headache (after all, I "grew up" with a DOS version of WordPerfect, and it 
took me a long time to get used to Word). What I find most exciting about this 
Office Suites
160
The Translator’s Tool Box - © International Writers’ Group, LLC
competitive situation is that LibreOffice/Apache OpenOffice as well as 
Microsoft Office 2007 and above are XML-based, which points toward a future 
when files from all these suites and applications will indeed be truly 
exchangeable and conversion will no longer even be an issue.
Still, I believe it’s more important to consider which line of Microsoft Office 
should be used and how often you should upgrade than which of the office 
suites a translator should use.
Release Versions of Microsoft Office
To find out which release version of Microsoft Office you should use, first look 
at all the other programs you use that in some way interact with programs of 
Office, most notably PowerPoint and Word. Many of the translation 
environment programs use Word plug-ins that often are not updated to the 
latest release of Word until months after Microsoft has published it, while 
other computer-assisted translation tools require a minimum version. Other 
programs that use Word plug-ins include Adobe Acrobat, virus check 
programs, and voice recognition programs.
If you are sure that you will not have any conflict with any other program, you 
can start to look into upgrading. In general, the best advice for upgrading 
Microsoft Office may be to wait until you buy a new computer (assuming that 
your new computer comes pre-installed with Office). The changes between 
the different versions often make very little difference in our work as 
translators, so it may be hard to justify the fairly significant expense.
However, there are some exceptions of Office upgrades that make a 
significant difference.
XML—eXtensible Markup Language—was developed by the World Wide Web 
Consortium as an alternative to HTML (see page 114)—which was not 
sophisticated enough for the creation of interactive content—and SGML—which 
proved to be too complex for web applications. The most important aspect of 
XML may be that it allows for the definition, transmission, validation, and 
interpretation of data between applications and between organizations.
Office Suites
The Translator’s Tool Box - © International Writers’ Group, LLC 161
Depending on the language version of Office you are using, there will be a 
limited number of spell checkers pre-installed. You can buy a full add-on 
version with 51 languages (Office 2003), 48 languages (Office XP) or 30 
languages (Office 2000) on Microsoft’s or other websites. 
For Office 2007, this system has changed quite a bit. Here you can buy the 
additional spell-checkers only as part of the Multi-Language Pack which also 
includes the user interface in the respective languages. You can either choose 
to buy all 37 covered languages or individual products for each of the 
languages. There is no compatibility between Office 2007’s additional spell-
checkers and those of earlier versions.
For Office 2010, things again have changed. There is now unfortunately no 
Multi-Language Pack for the non-corporate user and, of course, there is no 
compatibility between the language packs for Office 2007 and 2010. Each 
version of Office contains spell-checkers for between 3 and 7 languages (you 
can find a list under products.office.com/en-us/language-packs/office-2010-
suites-localized-versions). For additional languages you will have to purchase 
individual language packs. These also come with three or so spelling 
languages but only one additional user interface language.
On the bright side, it is much easier to find, purchase, and install the language 
packs in Office 2010. You will just need to select File> Options> Language 
in an Office program and there you’ll find the respective links.
If you are a user of a "minor" language, you might just be lucky enough to be 
able to download an LIP (Language Interface Pack) for your language that 
includes the ability to run Office in that language, the spelling checker of that 
language, and sometimes even a help systems and templates in that language. 
Under tinyurl.com/2g6y39l you can find out right here which approximately 60 
languages with what features are supported for that program.
Office Suites
162
The Translator’s Tool Box - © International Writers’ Group, LLC
For Office 2013 and above all of this has finally changed for good to what it 
really should have been in the first place: grammar and spellcheckers are now 
freely available for all languages (that are supported in the first place). That’s 
great, but it’s made even better by the fact that you are asked automatically 
whether you want to install a new language once it’s detected in your text (if 
you find the reminders annoying, you can disable them under File> 
Options> Language).
If you have Office 365, your particular version of Office corresponds to the most 
current version of the full Office version since that version is automatically 
updated.
Documents you may be interested
Documents you may be interested