21 
Ensuite onglet « Développeur » du ruban / Macros pour Word 2007-2010 ou menu Outils / 
Macros  pour  Word  2003,  vous  choisissez  la  macro  Typo  (typo.typo),  et  vous  cliquez  sur 
Exécuter. 
b) Soit vous pouvez placer les macros dans la barre d’accès rapide (tout à fait en haut à 
gauche de la fenêtre) 
Convert pdf to plain text online - application control tool:C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net, ASP.NET MVC, WinForms, WPF application
C# PDF to Text (TXT) Converting Library to Convert PDF to Text
www.rasteredge.com
Convert pdf to plain text online - application control tool:VB.NET PDF Convert to Text SDK: Convert PDF to txt files in vb.net, ASP.NET MVC, WinForms, WPF application
VB.NET Guide and Sample Codes to Convert PDF to Text in .NET Project
www.rasteredge.com
22 
Vous pouvez même les personnaliser en leur attribuant une petite icône (vous remarquerez 
que j’ai rajouté aussi dans cette barre l’insertion des caractères spéciaux et des notes de bas de 
page, bien pratiques lors de la relecture). 
application control tool:C# PDF insert text Library: insert text into PDF content in C#.net
a single text character and text string to PDF files using online source codes in C#.NET class program. Insert formatted text and plain text to PDF page using
www.rasteredge.com
application control tool:VB.NET PDF Password Library: add, remove, edit PDF file password
doc.Save(outputFilePath). VB: Add Password to Plain PDF File. Following are examples for adding password to a plain PDF file in Visual Basic programming.
www.rasteredge.com
23 
Il vous suffit alors de cliquer sur l’icône pour lancer la macro Typo. 
Vous allez voir que votre texte va devenir beaucoup plus beau sur le plan typographique… 
Et voilà, les travaux préliminaires sont terminés, et il faut maintenant s’attaquer au plus 
long : comparer mot à mot, phrase à phrase, le doc et le PDF pour corriger les 
erreurs. Là, pas de technique particulière, il suffit d’avoir de bons yeux. Bien évidemment, si 
vous avez fait le choix de faire cette correction mot à mot dans FineReader, alors vous ne la 
faites pas dans Word… 
2
e
niveau de travail 
Nous avons laissé passer quelques jours, quelques mois (selon le temps de chacun), et le 1
er
niveau de correction est terminé. Nous avons même trouvé quelqu’un qui accepte de relire le 
texte pour trouver les dernières fautes. Oui, mais avant, il nous reste deux types de tâches : 
Améliorer la correction par des moyens informatiques 
Finaliser la mise en forme 
Améliorer la correction par des moyens informatiques 
Lancer  une vérification orthographique et grammaticale pour le document. Cette 
étape  vous  permettra  de  détecter  les  mots  mal  orthographiés  mais  aussi  de  mettre  des 
majuscules accentuées et de détecter des sauts de paragraphes inopportuns. 
Il faut choisir les bonnes options. Tout se passe dans l’onglet Fichier / Options, j’ai entouré 
les points importants : 
application control tool:VB.NET Create PDF from Text to convert txt files to PDF in vb.net
Able to convert plain text to various fonts, colors and sizes of text content in PDF. Free SDK component built in .NET framework. Online evaluation source code
www.rasteredge.com
application control tool:VB.NET PDF insert text library: insert text into PDF content in vb
Insert formatted text and plain text to PDF page. features, like delete and remove PDF text, add PDF text box and Access to online VB.NET class source codes.
www.rasteredge.com
24 
Attention, 80 % minimum des propositions de corrections proposées par Word ne sont pas 
pertinentes, il ne faut donc pas les accepter. Mais les 20 % restant valent le coup… Et pour 
savoir celles qui sont valables, c’est très simple, consultez à chaque fois le scan… Et n’oubliez pas 
une chose : il y a peu d’erreurs dans les éditions papier, généralement, il y a donc peu d’erreurs 
dans le scan… 
Recherche des erreurs résiduelles que l’œil ne voit pas 
Nous  allons  maintenant  exécuter  la  macro  Recherche_erreurs.  Que  fait-elle ?  Elle  se 
contente de mettre en rouge du texte susceptible de contenir une coquille. La majorité du texte 
en rouge ne contient pas de coquille, heureusement. Mais, en général, une partie du texte en 
rouge contient des coquilles qui ont échappé au correcteur. Il suffit ensuite de se mettre au 
début du texte, et de faire une recherche sur le texte de couleur rouge : 
Il faut de 30 mn à 1h30 pour vérifier tout le rouge dans un livre, selon le nombre de pages et 
l’état du texte. 
Évidemment, une fois que c’est terminé, vous enlevez tout le rouge… (Rechercher : police 
rouge / Remplacer tout : police couleur automatique) 
Finaliser la mise en forme 
* Mettre un paragraphe vide en tête du doc, le centrer en veillant à ce que tous les retraits 
soit  égaux  à  0  (autrement,  ce  n’est  pas  un  vrai  centrage…),  et  y  coller  une  belle  image, 
suffisamment grande et rectangulaire dans le sens de la hauteur (je vous conseille au moins 
11 cm de haut), qui servira plus tard de couverture (onglet Insertion / Image). Vous pouvez 
vérifier / modifier la taille de l’image en faisant un clic droit sur l’image, Format de l’image / 
Onglet Taille : 
application control tool:C# PDF Password Library: add, remove, edit PDF file password in C#
Support to add password to PDF document online or in C#.NET WinForms for PDF file protection. C# Sample Code: Add Password to Plain PDF File in C#.NET.
www.rasteredge.com
application control tool:C# Create PDF from Text to convert txt files to PDF in C#.net, ASP
Viewer & Editors, C# ASP.NET Document Viewer, C# Online Dicom Viewer, C# Online Jpeg images Viewer, C# HTML Convert plain text to PDF text with multiple fonts
www.rasteredge.com
25 
* Sur le paragraphe suivant, mettre le nom de l’auteur et appliquer le style Auteur. 
* Sur le paragraphe suivant, mettre le titre du livre et appliquer le style Titre_livre 
* Sur le paragraphe suivant, mettre des renseignements tels que date de parution, nom du 
traducteur, etc, éventuellement séparés par des sauts de ligne, et appliquer le style Date_Sortie 
* Exécutez à nouveau la macro Typo (il y a toujours des corrections faites qui ont modifié 
certains éléments de la typo) 
* Je vous conseille enfin de refaire un petit coup de Ctrl+A, et Ctrl+Maj+F9 pour éliminer les 
signets ou liens hypertexte qui se glissent subrepticement sous le texte et foutent ensuite le 
bordel pour la conversion au format epub. 
3
e
niveau de travail 
Pour que la qualité finale soit bonne, il est fortement conseillé d’effectuer maintenant une 
relecture. L’idéal est de trouver un œil neuf, quelqu’un qui fera la relecture pour vous. Si ce n’est 
pas possible, vous la faites vous-même. 
2 – Ce qu’il faut faire et ne pas faire avec Word (ou un 
autre traitement de texte) 
Avant d’aborder la question des conversions  en différents formats, nous allons  faire une 
petite liste de ce qu’il faut faire et ne pas faire. 
application control tool:C#: XDoc.HTML5 Viewer for .NET Online Help Manual
Enter the URL to view the online document. Click to OCR edited file (one for each) to plain text which can be copied Click to convert PDF document to Word (.docx
www.rasteredge.com
application control tool:C# Word: How to Extract Text from C# Word in .NET Project
Simple to convert a Visual C# MS Word doc Word text extractor preserves both the plain text as well powerful & profession imaging controls, PDF document, image
www.rasteredge.com
26 
Les styles Titre 1,2, 3… 
Les chapitres, parties, doivent être impérativement structurés en leur appliquant les styles 
préexistants Titre 1, Titre 2, etc de façon à ce que les TDM (tables des matières) soient générées 
automatiquement dans les différents formats. 
Personnellement, s’il n’y a que des chapitres, je leur applique le style Titre 1 ; s’il y a des 
parties et des chapitres dans le livre, j’applique le Titre 1 aux parties et le Titre 2 aux chapitres. 
Si votre titre de partie ou de chapitre est sur 2 ou 3 lignes, comme dans l’exemple ci-dessous, 
vous ne devez surtout pas mettre un saut de paragraphe entre les lignes, il faut un saut de 
ligne seulement : touche maj + entrée (et non touche entrée). 
Il est inutile d’insérer une table des matières dans le doc Word de base, qui servira à la 
conversion vers les formats epub, Mobipocket : la table des matières n’apparaît pas dans le texte 
lui-même pour ces formats. Par contre, nous ferons ensuite un doc spécial pour le format PDF, 
et là, nous insérerons la table des matières. 
À propos des sauts de page 
Essayez de ne jamais insérer de sauts de page manuellement, c’est une source d’ennuis 
infinis pour corriger une mise en page. 
Les sauts de page doivent être intégrés dans les styles ou dans les formats de paragraphes : 
deuxième onglet du format paragraphe ; pour les styles, en particulier Titre 1 qui comporte 
presque toujours un saut de page, vous modifiez le format paragraphe du style. Ainsi, les sauts 
de page deviennent visibles dans la fenêtre des styles et vous pouvez les modifier d’un clic. 
27 
28 
À propos de sauts de paragraphe multiples 
Au lieu de mettre 4 ou 5 paragraphes vides pour indiquer un grand espacement entre deux 
paragraphes de texte, il faut modifier l’espacement avant ou après du format de paragraphe 
(Format paragraphe / 1
er
onglet) ou du style. 
De plus veillez à être cohérent, à toujours mettre le même espacement avant ou après pour 
un type de paragraphe donné. 
À propos des retraits et indentations 
Format paragraphe / 1
er
onglet 
Comme vous le verrez, le modèle que je vous propose utilise une indentation (retrait de 1
re
ligne)  modeste  de  0,6  cm.  De  même  si  j’applique  des  retraits  à  gauche  pour  décaler  un 
paragraphe, ils sont en général de 0,6 ou 1,2 cm, au grand maximum de 1,8 cm, de façon à ce 
que le cumul avec l’indentation ne soit jamais supérieur à 2,4 cm . Il y a une raison précise 
à cela, qui concerne le rendu de l’ebook,  par exemple au format epub, sur  de  petits écrans 
(nombreux sont ceux qui lisent sur un écran de téléphone de 3 – 4 pouces, le rendu n’est pas le 
même que sur un ordinateur). 
Dans certains livres, le décalage horizontal des paragraphes est très important. Dans ce cas, 
j’utilise les alignements centré ou droite pour transposer la mise en page originale. 
De même, je vois souvent des docs qui comportent des paragraphes avec des espaces avant 
ou après de 300, 400 pts. Tout cela pour imiter les livres papier… Ce type d’espacement est 
catastrophique pour les formats redimensionnables, epub ou mobi, pensez-toujours que votre 
ebook  doit  être  lisible  sur  un  iPhone  (pour  prendre  un  exemple).  Dans  cette  optique, 
l’espacement maximum devrait être de 60 pts. 
Autres erreurs à éviter 
N’oublions pas que nous faisons un document en vue de le transformer en epub. Certaines 
pratiques courantes en traitement de texte ne passeront pas toujours bien dans ce format. 
Il faut donc éviter d’utiliser les tabulationslistes à puces et les petites majuscules . De 
même ne pas laisser de paragraphe vide avant un saut de page. 
De même, il ne faut généralement pas insérer de signets (sauf à savoir exactement pourquoi 
on le fait). Si vous en avez insérés par erreur, ce qui arrive, nous avons pu le constater, il suffit 
d’utiliser  la  commande  « Insertion  /  Signets »,  et  de  les  supprimer  avec  le  bouton 
« Supprimer ». 
Voilà,  je pense avoir dit l’essentiel. Si vous voulez voir un exemple de doc prêt à  être 
converti  au  format  epub,  et  qui  obéit  aux  règles  ci-dessus  énoncés : 
richepin_chanson_des_gueux_epub.doc (le doc est zippé). Le PDF image correspondant, pour 
voir la mise en page originale : richepin_chanson_des_gueux_ocr.pdf (7 Mo). 
29 
IV 
CONVERSION AUX FORMATS EBOOKS 
1 – Format ePub 
Normalement  votre  doc  est  maintenant  prêt  à  être  converti  au  format  epub.  Il  existe 
plusieurs méthodes pour cela, j’en citerai quatre : 
* Méthode Amanuensis : Amanuensis permet très facilement, à partir d’un fichier .odt de 
créer un epub léger, de qualité et qui gère bien les images, les tableaux et les lettrines. Pour 
découvrir toutes ses possibilités le mieux est de lire le manuel très complet inclus dans l’archive 
(sous-dossier Manual). C’est la méthode que je considère la meilleure, que j’utilise au quotidien 
pour le site Ebooks libres et gratuits. 
* Méthode Atlantis : La plus rapide et la plus simple pour les débutants en informatique, 
même  si  elle  est  moins  bonne  qu’Amanuensis,  notamment  pour  les  images.  Son  gros 
inconvénient est qu’elle ne gère pas du tout les tableaux. 
* OpenOffice – Libre Office : Il existe plusieurs extensions qui permettent de convertir un 
doc/odt en epub, que vous pouvez utiliser, même si vous avez travaillé votre doc sous Word. 
L’extension writer2xhtml permet d’obtenir d’excellents résultats, très proches des 2 premières 
méthodes. Vous trouverez sur le forum MobileRead  un sujet très complet avec un tutorial rédigé 
par Roger64, très fan de cette solution. 
* Méthode Calibre : Elle a de nombreux adeptes, même si je considère personnellement que 
c’est la moins bonne des 4 méthodes. Je reprendrai ici un tutoriel fait par quelqu’un d’autre. 
Méthode Amanuensis 
Une fois terminé votre travail sous Word fermez votre fichier. Ouvrez-le avec OpenOffice ou 
plutôt Libre Office qui est plus régulièrement mis à jour, puis enregistrez-le au format texte ODF 
(.odt). 
Faites  ensuite  glisser  le  document  odt  obtenu  sur  le  programme  Amanuensis  ou  son 
raccourci sur le bureau. Vous pouvez aussi faire un clic droit sur votre document puis choisir 
Envoyer vers… Amanuensis, si vous avez créé un raccourci vers Amanuensis dans le dossier 
Envoyer vers (SendTo) : c’est expliqué dans la manuel Amanuensis. 
Je  vous  conseille  de  lire  attentivement  le  manuel  d’Amanuensis  et  notamment  ce  qui 
concerne  le  fichier  d’options  AMANUENSIS.cfg ;  si  vous  voulez  connaître  les  options  que 
j’utilise, voici mon fichier de configuration 
Méthode Atlantis 
Voyons ce je dis sur ce logiciel sur notre site : 
30 
Une dernière solution, particulièrement adaptée pour les débutants, est le traitement de 
texte Atlantis ; rappelons que c’est un traitement de texte léger (on peut même l’utiliser sur clé 
USB), rapide, et très facile d’accès, avec lequel on peut ouvrir les documents aux formats RTF 
et Word (toutes versions). Une autre qualité est qu’il est capable d’enregistrer les documents 
dans  un  format  RTF  extrêmement  compact.  Et  surtout,  il  possède  une  fonction 
d’enregistrement au format epub tout à fait performante. Atlantis est une bonne solution pour 
convertir un « doc » en un ebook au format epub, d’un clic, qu’il s’agisse d’un livre ou d’un 
document  de  travail.  Il  faut néanmoins  signaler un  gros  défaut :  il  ne  sait  pas  gérer  les 
tableaux… Le prix de ce logiciel est d’environ 30 euros TTC, un coût raisonnable au regard de 
ses qualités (et vous pouvez le tester gratuitement pendant un mois). Voici le lien  vers la partie 
de l’aide en ligne (très bien faite) d’Atlantis, consacrée à la conversion au format epub. 
Nota : Atlantis est un logiciel Windows seulement. Mais les linuxiens seront heureux de 
savoir qu’Atlantis fonctionne parfaitement sous Linux grâce à Wine, et conserve sa rapidité. 
Il n’y a donc en fait aucune explication à donner pour faire votre epub avec Atlantis, si vous 
avez suivi mes conseils et utilisé mon modèle : 
Menu  Fichier  /  Enregistrements  spéciaux  /  Enregistrer  comme  ebook 
(Ctrl+maj+E). Donner un nom au fichier. Ensuite écrire les métadonnées : Titre, Auteur (sous la 
forme « Jules Verne »), etc. Et c’est tout… 
En dehors du problème des tableaux, signalons qu’Atlantis ne sait pas gérer en pourcentage 
les images rectangulaires en largeur et qu’il est difficile d’éditer l’epub produit avec Sigil si on 
veut retoucher tel ou tel aspect de l’epub du fait d’une gestion atypique des styles de titre (Titre1, 
Titre2, etc) et de la table des matières. 
Méthode Calibre 
Calibre est un excellent logiciel, libre et gratuit, pour gérer sa bibliothèque d’ebooks et pour 
faire de nombreuses conversions, de et vers les formats ebooks. 
La méthode ci-après est reprise à partir d’un forum : 
* Ouvrir le .doc 
* Supprimer en première page les informations de couverture (image de couverture, auteur, 
titre, etc) et les pieds de pages 
* Sauvegarder le doc au format HTML – Page web filtrée (important, ne pas choisir le 
HTML « normal ») 
* Importer le HTML dans Calibre (Nouveau livre…). Calibre va le transformer en zip… 
* Modifier les données Méta (Ajouter la couverture…) et faire la conversion conformément 
aux screenshot ci-dessous. 
* Dans l’onglet « Table des matières », indiquer : 
Niveau 1 TDM : //h : h1 
Niveau 2 TDM : //h : h2 
* Dans l’onglet « Détection de la structure », pour « marque de Chapitre », il faut choisir 
« none » au lieu de « pagebreak » afin de coller au plus près du .doc initial, et mettre à blanc le 
champ « Insérer un saut de page avant (expression xPath) ». 
* Dans « Préférence ->conversion -> présentation », cocher la case « conserver les ligatures » 
pour que les œ soient conservés. 
*  Compatibilité  Booken  (Opus  Orizon)  pour  éviter  les  polices  bloquées :  Dans  « Option 
commune  ->détection  de  la  structure »  cocher  la  case  « Supprimer  l’entête »  et  dans 
Documents you may be interested
Documents you may be interested