MS-Word is Not a document exchange format
Jeff Goldberg
June 15, 2005
version 1.35
Typicallyyouaregettingthisbecauseyousentsomeoneanemailmessage
using MS-Word or some other operating system or text-processing specific
attachment. Alternatively,youmay haveplaced MS-Word files on theweb
astheonlymeansfor gettingat the document content.
Contents
1 What’s wrong with sending MS-Word files?
2
1.1 Requiresproprietarysoftware . . . . . . . . . . . . . . . . . . 2
1.2 Versionproblems . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Proprietarydataformat . . . . . . . . . . . . . . . . . . . . . 2
1.4 Virusesandsecurity . . . . . . . . . . . . . . . . . . . . . . . 3
1.5 Size . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.6 Priorversioninfo . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.7 Typicallyattached“wrong”toemail . . . . . . . . . . . . . . 5
1.8 Wordisnotdeviceindependent . . . . . . . . . . . . . . . . . 5
1.9 Wordisn’tevengoodatwhatitisdesignedfor . . . . . . . . 5
2 Alternatives
5
3 Where MS-Word is appropriate
6
4 Response to the “it’s the emergent standard”refrain
6
Seesection5.5forcopyrightnotice.
1
How to add an image to a pdf - insert images into PDF in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Sample C# code to add image, picture, logo or digital photo into PDF document page using PDF page editor control
how to add an image to a pdf in reader; add image to pdf preview
How to add an image to a pdf - VB.NET PDF insert image library: insert images into PDF in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Guide VB.NET Programmers How to Add Images in PDF Document
how to add image to pdf form; adding jpg to pdf
5 Historyand related documents
8
5.1 Similardocuments . . . . . . . . . . . . . . . . . . . . . . . . 8
5.2 Rantsabout MS-Word . . . . . . . . . . . . . . . . . . . . . . 10
5.3 Reactionsofar . . . . . . . . . . . . . . . . . . . . . . . . . . 10
5.4 Howyoucanhelp . . . . . . . . . . . . . . . . . . . . . . . . . 11
5.5 About thisdocumentandcopyrightnotice . . . . . . . . . . . 11
5.6 Shamelessplug . . . . . . . . . . . . . . . . . . . . . . . . . . 12
5.7 Acknowledgement . . . . . . . . . . . . . . . . . . . . . . . . . 12
1 What’s wrongwithsending MS-Wordfiles?
1.1 Requires proprietary software
You are basically assuming that everyone has on their desktop the same
software that you have. That often goes against the spirit of the Internet
which is supposed to be about inter-operability of heterogeneous systems.
Thatfactthat one “persistently predatorymonopoly”
1
attempts tosubvert
that goal,doesn’tmeanthat youshouldgoalongwithit.
Someonewhosendsmesuchmailisperfectlywelcometopurchaseforme
amachineandsoftwarespecificallysothatIcanreadmailinthatproprietary
system. ButIwillstillhave the inconvenience of having toforward the file
toasystem Iwouldn’tnormally use.
1.2 Version problems
EvenforthosewhochosetouseMS-Word,therearecompatibilityproblems
between various versions. Foreshadowing the next topic, it appears that
Microsoftis unwillingtoprovidefixesforverysubstantialsecurityproblems
inolderversions. AnarticleonCNN’swebsite(September13,2002)reports
suchaninstance.
1.3 Proprietary data format
Theabovetwoproblemsare closelytiedtothequestionofproprietary data
formats. When you store your work in MS-Word format, you are betting
that you willalways have accessto some licensedsoftware that willbeable
1
InthewordsofaU.S.federaljudge.
2
C# PDF Image Extract Library: Select, copy, paste PDF images in C#
Get image information, such as its location, zonal information, metadata, and so on. Able to edit, add, delete, move, and output PDF document image.
adding image to pdf; adding image to pdf in preview
VB.NET PDF Password Library: add, remove, edit PDF file password
VB: Add Password to PDF with Permission Settings Applied. This VB.NET example shows how to add PDF file password with access permission setting.
add a picture to a pdf document; add photo to pdf online
toreadthatformat. TheOpenDataFormatInitiativehasmoreinformation
onwhat iswrongwithclosedformats.
1.4 Viruses and security
MS-Word allows full macro-scripting. It is now the most common carrier
for viruses. What this means is that embedded within a Word file can be
a program which runs silently (or otherwise) on the recipient’s computer
whenever they view the file. Are you happy with letting other people run
programsonyour machine?
InoneinstancethatIknowof,asubstantialportionofanMBAgraduat-
ingclass sentoutr´esum´eswithaWordmacrovirus. Idon’tthink that this
helpedtheirjobprospects. Buttheparticularbusinessschoolhadanofficial
MS-Wordpolicy.
1.5 Size
Oftenwhatwouldbejustafewkilobytesofplaintextishundredsofkilobytes
asaWordfile. IfinditinterestingthatMS-filebrowsersandemailersdon’t
make itobvious tothe senderhowlargeparticularfilesare.
1.6 Prior version info
BecauseofWord’ssystemofdoingversioncontrol,itispossiblethatrecipi-
entsmayseeprior draftsofyour document (whichmaycontainconfidential
information).
I’veheardanumberof“friendofafriend”storiesaboutthissortofthing.
Inonecase,apotentialcustomerwasgivenaquoteforsomeproduct,andthe
quotewas sent inanMS-Wordfile. When the customerviewedtheversion
history,they foundthat aprevious version of thedocument had beenused
foraquotetoothercustomers,withmuchlowernumbers. Butsinceinitially
writingthis,I haveheard anumber offirst handaccounts. Some ofwhich
arebelow. SinceIalmost neverreadMS-Worddocumentssent tome,Iwill
havetorely ontheaccountsofothers.
Probably one of the most spectacular instances of information inadver-
tentlyleakedbecausesomeone(theBritishPrimeMinister’soffice)usedMS-
WordfordocumentexchangeisdescribedinanarticlebyRichardM.Smith,
3
VB.NET PDF Image Extract Library: Select, copy, paste PDF images
DLLs for PDF Image Extraction in VB.NET. In order to run the sample code, the following steps would be necessary. Add necessary references:
add a jpeg to a pdf; add image pdf acrobat
C# PDF Password Library: add, remove, edit PDF file password in C#
C# Sample Code: Add Password to PDF with Permission Settings Applied in C#.NET. This example shows how to add PDF file password with access permission setting.
add an image to a pdf with acrobat; add an image to a pdf form
MicrosoftWordbytesTonyBlairinthebutt. Theedithistoryofthe“Febru-
ary dossier” has become a matter of contention to say the least. Smith’s
articleprovideslinksanddetails.
Other,moremundane,accountsofmeta-dataleakingfromMS-Worddoc-
umentsfollow.
In aUsenet news article,Alan Frame describes some ofhis experiences
withthis
In the past,I’ve received MS Word documents from anagency,
describingajobvacancywherethey’verefusedtonametheclient
–loandbehold,thedocumentproperties revealsall.
Andalso
Indeed,I’vealsoseenaninternalbusinessproposalwhichappears
to have originated at the supplier that the proponent was err,
proposing.
Ihavealsoreceivedwordfrom others saying,
ThisregularlyhappenstomebecauseIdealwithpublicrelations
companieswho always use the very latest spiffy versionof Word
andPowerpointandseemtobetotallyunawarethatnoteveryone
doesthesame.
NormallyIjunkthesedocs,butifIneedthemIviewthem...and
oftensee where corrections have beenmade...
I have never seen anything really sensitive as a result of this,
probablybecausemostpressreleasesaren’tonverysensitivesub-
jects. UsuallyIseecommentslike“CLAIRE:shouldwedescribe
whatthepossibletreatmentoptionsmightbe?”,plusminorword-
changes. But Iliveinhope.
Charles Wankelpostedamessage concerningthis totheE-Medialistof
theAcademy ofManagementsaying,
I received a paper for an effort that I was an editor for from
someone who had useda ghostwriter. The ghostwriter had had
embedded her name in such a way that when I looked at the
document in a source view I could see it with the dates that
wrote,edited,andre-editeddrafts ofthedocument.
4
C# Create PDF from images Library to convert Jpeg, png images to
List<Bitmap> images = new List<Bitmap>(); images.Add(new Bitmap(Program.RootPath + "\\" 1.gif")); / Build a PDF document with GIF image.
add a jpg to a pdf; acrobat insert image in pdf
C# PDF Sticky Note Library: add, delete, update PDF note in C#.net
C#.NET PDF SDK - Add Sticky Note to PDF Page in C#.NET. Able to add notes to PDF using C# source code in Visual Studio .NET framework.
adding an image to a pdf in preview; add picture to pdf
1.7 Typically attached “wrong” to email
While this is not strictly speaking a problem with MS-Word files, it is a
related problem. People and systems that think that it is right to just
sendsuch things, seem to think that it is OK to send everything with the
MIME Content-type of application/octet-stream and let the recipient
work things out from the filename info that is also sent. That is a viola-
tion of the intent of the MIME standards, and indicates broken design for
exchange ofinformation.
1.8 Word is not device independent
IhavebeentoldthatMS-Worddocumentswillformatdifferentlydepending
onthespecificsoftheprinter. Thisisnotmerelyissuesofprinterresolution
or color depth, but the actualformatingof thedocument willdiffer. Iwas
surprised to learn this. I had assumed that Word was “What You See Is
WhatYouGet”,butit appearsthatIwasmistakenaboutthat. Soitwon’t
evenachievethegoalofensuringthatyourrecipientsees thingswithallthe
formattingyouseethingswitheveniftherecipientalsousesMS-Word.
1.9 Word isn’t even good at what it is designed for
Asanaside,IfeelthatMS-Wordproducesprobablytheworstoutputandis
theslowestandmosttedioustoworkinofanydocumentpreparationsystem
inserious useI’veseen inthepast15years. Ifindit remarkablethatwhen
people are presented a choice between a structural mark-up system (what
you meanis what get) versus a visualmark-up system(what yousee is all
you get) people opt for the latter. For more on this point see section 5.2.
NotethattheargumentthatMS-Wordisaninappropriateexchangeformat
is independent of this point about its quality as a document preparation
system.
2 Alternatives
When talking aboutthings sent by emailit is important to distinguish be-
tweendocumentexchangeandmessageexchange. Message exchangeistyp-
ically what one does by email. Making announcements or participating in
adiscussion,andmany of the otherthings wetypically do with email. For
5
C# PDF remove image library: remove, delete images from PDF in C#.
C# Read: PDF Image Extract; C# Write: Insert text into PDF; C# Write: Add Image to PDF; Remove Image from PDF Page Using C#. Add necessary references:
adding an image to a pdf; add image to pdf in preview
VB.NET PDF remove image library: remove, delete images from PDF in
C# Read: PDF Image Extract; C# Write: Insert text into PDF; C# Write: Add Image to PDF; VB.NET: Remove Image from PDF Page. Add necessary references:
add photo to pdf file; adding images to a pdf document
theseplaintextistheonly reasonable thing. It is the safest,most portable
and by far the most compact. It allows responses quoting portions, and
has none of the dangers mentioned above. The small added value of the
formatinginformationisn’t worthalloftheproblems.
Ifyouabsolutelyneed topresenttheformatinginformationfordocument
exchange,thenuseapagedescriptionlanguagelikePDF.
Also consider using (standards compliant) HTML. Please note that I
am not in any way advocating the use of HTML in ordinary email. It is
grossly inappropriate for that for reasons that arebeyondthe scopeof this
document.
In earlier versions of this document, I listed RTF (Rich Text Format)
asa morestandards basedway ofexchangingword-processor documents. I
have been correctedon that point innumerable times. RTF is little better
than MS-Wordformatitself. Itisa ¡em¿little¡/em¿better,butitsharesall
ofthe problems as MS-Word. AlthoughRTF wasadvertisedasadocument
exchange format,it never lived up to that. It appears tohave varying fea-
tures, and the various version of RTF that Microsoft products create have
elements whichonlyMicrosoft Products canread. Notethatthis is not be-
causeMS-Wordisabetterproduct,butbecauseMicrosoftkeepselementsof
whatitconsiderstobeRTF secret.
3 Where MS-Word is appropriate
MS-Wordisappropriatefordocumentexchangeamongco-authorsofadocu-
mentwhoarealldevelopingitandhaveagreedbeforehandtouseMS-Word.
Ifyouhavebeenreferredtothedocumentyouarenowreading,thentheper-
sonwhoreferredyoutoitprobablydoesn’tconsiderthemselvespartytosuch
anagreement,andhavingsentthemanMS-Worddocumentisinappropriate.
4 Response to the “it’s the emergent stan-
dard” refrain
Severalpeoplehaverespondedwithsophisticated“networkanalysis”essays
aboutMS-Wordbeingadefacto standard,andpointingoutthatevenifthe
standard isn’t the optimal one, it is better to go along with the standard
anyway. Mycounterargumentis two-fold:
6
1. Whether or not the argument about emergent standard holds for au-
thorship(eg,“I useWord because it is what my potential co-authors
use”) haslittlebearingonwhatyouusefordocument exchange. Iuse
L
A
T
E
Xfor document preparation, but I distribute them as PDF.
2
So
theremay beanargumentforusingMS-Wordeventhoughitisinferior
tootheroptions,butthatinnowaysuggeststhatMS-Wordshouldbe
usedfordocumentexchange.
2. Thesecondargumentis anethicalone,andIstartwithananalogy.
Over the past fewyears it has become fashionable in the USto drive
someformoftruckasaprimarycommuting/errandsvehicle. Thereare
many issues regarding that fashion, but for this analogy I wouldlike
to focus on twoof them. When two vehicles collide the occupants of
the lighter one are far more likely to suffer injury thanthey would if
thehadcollidedwithanequallylightvehicle. Sowhensomeonedrives
a truck, they are putting those in normal sized vehicles at an extra
risk. Thesecondproperty is similar. The headlightsof the trucks are
muchhigher offtheground thanthose of cars. Driving acarat night
withone of these trucks close behind you is extremely annoying and
possibly dangerous. In both of these cases, the drivers of the trucks
don’texperiencethedisadvantageofothersdrivingtrucks. Inthefirst
case,theytooareinheavyvehicles,andinthesecondthedriverishigh
enough off the ground to not be impaired by the headlights of other
trucks.
By the logic of the “emergent standard” advocates, the only way to
deal with the truck problems I’ve described is to switch to driving
a truck oneself. The emergent standard argument might have some
validity if the standards were arbitrary, but if some are particularly
destructive to community as a whole, they should be opposed. Use
ofMS-Wordfordocumentexchangeissimplybadnetworkcitizenship.
Paraphrasing Juhapekka Tolvanen: using MS-Word is like smoking;
usingitfordocument exchangeis likeblowingyoursmokeineveryone
else’sface.
2
UsingLAT
E
X does have exactlythecost describedbythosewhoraisethe“de facto
standard”argument: Ifindmyselflimitedinco-authorstoasubsetofclueful,intelligent
andnetworkcooperativeindividuals.
7
3. Thereis athirdargument,closely relatedtothesecond: Doyouwant
tobepartofMicrosoft’s marketingeffort?
5 History and related documents
5.1 Similar documents
WhenIfirst wrotethefirstversionofthisdocumentinMarch,2001,itwas
because I not only was fed up with peoplesendingme unwantedMS-Word
documents,butbecauseIwas tiredofexplainingrepeatedlywhyIobjected
tothem. Iwrotethistobepart ofacannedresponse.
Being remarkably lazy, Ididn’t want to investigateand write this up if
someoneelsehadalreadywrittensomething. SoIdidalittlebitofsearching
for documents like this. I knewfrom personalcommunication that while I
aminaminoritythereisasubstantialminoritywhichfeelsexactlythesame
way. Iexpectedthatsomeonewouldhavealreadywrittensomethinglikethis
document.
Ididn’tfindanywhenIlooked,butclearlyIdidn’tlookcarefullyenough.
IhavesincebeeninformedofothersthatI’vemissed. Ilistthemhere,along
withsomewhichwerewrittenafter my document.
plaintext: In praise of practical e-mail hygiene ThisisMartinVermeer’s
essay. Itcoversthesamepointsasminebutgoesdeeperintotryingto
persuadepeopletobebetternetworkcitizens.
http://www.netby.dk/Oest/Europa-Alle/vermeer/plain.html
We can put an end to Wordattachments ThisisanarticlebyRichard
M. Stallman advocating efforts like mine to discourage people from
sendingMS-Worddocuments. The articleitselfisaimedatthosewho
already knowthatWordattachmentsarewrong.
http://www.gnu.org/philosophy/no-word-attachments.html
Sincere Choice This isthehomepageoftheSincereChoiceplatformwho
say “We believe that there should be a fair, competitive market for
computersoftware,bothproprietary andOpenSource.”
http://sincerechoice.com/
8
The Sincere Choice principles of open standards and interoperability
underly muchofwhathasbeenstatedhere.
http://sincerechoice.com/Principles/Open
Standards.html
http://sincerechoice.com/Principles/Choice
Through
Interoperability.
html
Open Data Format Initiative This is anattempt toencourage software
companies tofully document theformats oftheir data files. Topara-
phrase earlier words of the founder of this initiative, if you own the
datainthePowerPointpresentationyoucreated,whyshouldyouneed
alicensefromMicrosoft toget atyourpresentation?
http://odfi.org/
Miksi on typer¨a¨a postittaa s¨ahk¨opostin... As you can see, this de-
tailedessayandanalysisbyJuhapekkaTolvanenisinFinnish. Idon’t
readthatlanguage,buttherearesomeusefullinksfromthat. Hecomes
upwithaveryusefulanalogy,whichIwillrephrasemoreharshly: Us-
ingMS-Wordislikesmoking;emailingthosefilesislikeblowingsmoke
intootherpeople’s faces.
http://www.cc.jyu.fi/
juhtolv/mswordmail.html
MS-Word? nom obrigado Asimilardocumenttomine,availableinPor-
tugues and Galician, by Ram´on Flores d’as Seixas. While this docu-
mentisbasedontheotherslistedhere,italsoaddspointsaboutwhat
makes agooddocumentexchangeformat. Italso discussesthe values
ofstandards ofexchangein terms of establishinga levelplaying field.
TheGalicianisprettymuchreadabletothosewhocanreadSpanish.
http://members.tripod.com.br/ramonflores/word/index.html
Brave new Word A similar document in Norwegian, a language I can’t
read. WrittenbyThomasGramstad. Ithassomelinksattheendthat
mightbeusefultopeople whodon’treadNorwegian.
http://www.efn.no/brave-new-word.html
Avoid E-Mail attachments, especiallyMicrosoft Word Asimilardoc-
ument to this, but much shorter. It gives some brief instructions to
MS-Wordusers onalternatives they canusefordocumentexchange.
http://bcn.boulder.co.us/
neal/attachments.html
9
Elektronische infomatieoverdracht binnen de VU-organisatie: Het gebruik van e-mail en MS Word (PDF)
Adocument in Dutch by Reinout van Schouwen. Also it is directed
internally.
http://www.cs.vu.nl/
reinout/word-attachments.pdf
5.2 Rants about MS-Word
The focus of this document has been onthe misuse of Wordfor document
exchange. It is geared toward MS-Word users to encourage them to send
documentsinotherformats,eveniftheycontinuetouseWordfordocument
production. It should be noted, however, that those individuals who are
most annoyedby receivingMS-Word filesfor documentexchange arethose
who do not regularly use MS-Word. None the less, it is hoped that fans
of MS-Word willrecognize that whatever its virtues, it is not a document
exchange format.
The arguments I’ve presented stand even if MS-Word were a goodtool
fordocumentpreparation. However,I’dalsoliketopointtosomedocuments
whichargue(correctlyinmyview)whyMS-Wordisabadchoiceofdocument
preparationsystemandnotjustabadchoiceofdocument exchangeformat.
Word Processors: Stupid and Inefficient by Allin Cottrell discusses
whatiswrongwithWhatYouSeeisAllYouGetsystemsusingvisual
mark-up,asopposedtothefarmorereasonablestructuralsystemwhere
you separate the tasks of controlling theappearance from the task of
writingthecontent.
http://www.ecn.wfu.edu/
cottrell/wp.html
No ProprietaryBinaryData Formats bySamSteingold. Thisdiscusses
the dangers of keeping important data in formats which require re-
stricting and licensed software to recover. MS-Word is a proprietary
and secret document format. You are trusting your future access to
youowndocumentstothewhimofapersistentmonopolist.
http://www.podval.org/
sds/data.html
5.3 Reaction so far
Asfar asIcantellmycampaignhas met withlittlesuccess sofar(January
2002)otherthanafewpeopletakingsomecaretosendmeRTFdocuments
10
Documents you may be interested
Documents you may be interested