Introduction aux éditeurs et convertisseurs HTML
La page qui suit est destinée à aider le pourvoyeur d'information à bien choisir les outils grâce auxquels il pourra rédiger des pages WWW.
Sommaire
- Nouveautés dans cette page
- Y a-t-il des éditeurs HTML spécifiques ?
- Y a-t-il moyen de convertir des textes existants en HTML ?
- Peut-on revenir de HTML vers Word ou ...
1. Nouveautés dans cette page
- 27 juin 1996
- Ajout d'une référence sur les convertisseurs .
- 16 janvier 1996
- Révision du chapitre sur les conversions en HTML .
Modifications dans les éditeurs HTML (+ PageMill)
2. Y a-t-il des éditeurs HTML spécifiques ?
D'abord, tout éditeur de texte général (Word, TeachText, MS-Word, Word Perfect...) peut faire l'affaire à condition d'enregistrer le résultat en mode "texte seul". Un document HTML n'est qu'un simple texte dans lequel on insère des commandes (ferrets) du genre:
Le lion <strong>rugit</strong> dans le désert
qui donnera comme résultat lorsqu'il sera vu par un client (visionneur) WWW:
Le lion rugit dans le désert.
Cela dit, il existe plusieurs programmes qui aident à ajouter les ferrets < strong> </strong> dans le texte. L'idée est de sélectionner le mot "rugit", d'aller dans un menu et de demander d'accentuer (strong) le texte sélectionné, ce qui donnera très souvent du gras.
Editeurs générant les ferrets explicitement
- MacHTML...
Met relativement bien les ferrets (tags) autour des phrases sélectionnées. On peut aussi générer d'abord les ferrets et puis y insérer la phrase.
- BBEdit
Comme le précédent...
Editeurs générant les ferrets implicitement (WYSIWYG)
- Arachnid
Se veut un éditeur graphique...mais n'est pas encore au point
- PageMill d'Adobe
Réussit à être un éditeur graphique. On peut composer sa page entière sans voir un seul ferret. Même pour faire un lien ou ,mieux, une image clicable. C'est un produit remarquable (et payant) destiné probablement à une personne qui n'aurait plus que des pages Web à faire dans sa vie professionnelle.
Méthode mixte
Cette méthode est appelée mixte parce qu'on ne verra pas les ferrets HTML en Word, mais qu'elle générera un texte en pur HTML dans lequel il faudra normalement intervenir.
La méthode (développée dans le chapitre sur la conversion: l'usage de RTFtoHTML avec l'utilisation des styles Word orientés HTML) transforme Word Macintosh en un éditeur spécialisé ("light"). Il suffit d'acquérrir le bon réflexe: d'abord choisir un style puis remplir le paragraphe. Ensuite,
- enregistrer le texte terminé d'abord en mode normal (afin de pouvoir le reprendre en vue de corrections ultérieures)
- puis enregistrer le texte terminé en mode RTF (en gardant le même nom suivi du suffixe .RTF par exemple)
- enfin activer RTFtoHTML et demander la conversion en HTML.
3. Y a-t-il moyen de convertir des textes existants en HTML ?
Ce chapitre parlera des différentes méthodes utilisables pour convertir un texte en HTML. Le but n'est pas d'entrer dans le comment des méthodes mais plutôt de les situer les unes par rapport aux autres.
Par ordre de complexité, on pourrait classer ces méthodes en 3 groupes:
- enregistrement immédiat en format HTML.
- enregistrement immédiat en format HTML basé sur les styles.
- enregistrement en format RTF suivi d'une conversion du format RTF en HTML. Méthode normalement basée sur les styles.
- Autres méthodes de conversion
On voit que le nombre d'opérations demandées par la 1ère méthode est moindre que pour la 3ème. Par contre, cette méthode permettra plus de souplesse. Elle est aussi plus générale.
Convertir des documents sans styles en HTML
La version 4 du logiciel ClarisWorks, sur Mac, se base sur la taille réelle des polices utilisées pour déduire le format HTML adéquat. Ce programme suppose que si une phrase a été mise en 18 points de haut, c'est que l'auteur voulait en faire un titre de niveau élevé, par exemple "h2". Cette supposition donne d'excellents résultats si la personne qui rédigeait le document a été fort rigoureuse dans l'usage des tailles (ce qui arrive).
Convertir de MS-WORD-Windows en HTML
La version 6.0a de MS-Word sous Windows dispose d'un "Internet Assistant" (c'est à dire un programme annexe au Word) remarquable qui permet de générer "automatiquement" du texte HTML. Le mot automatiquement est mis entre guillemets parce qu'il n'y a pas de miracles. En gros, la méthode suppose que le texte est basé sur une feuille de styles et à chaque style est associé un type de paragraphe HTML.
Un autre avantage de cet "assistant" est d'incorporer au Word un visionneur WWW (browser).
Convertir de MS-WORD-Mac en HTML
Si vous disposez de documents déjà rédigés en MS-Word pour Macintosh, Microsoft n'ayant pas encore produit l'équivalent de son "assistant" dans ce monde, il existe un programme qui permet de les convertir "automatiquement" en HTML. Cette méthode, si elle s'applique d'abord aux documents anciens, peut aussi être utilisée pour générer des nouveaux documents HTML à partir de Word.
On doit procéder en 2 étapes:
- Convertir le document Word en format RTF.
Le format RTF a été développé par Microsoft pour communiquer entre différents systèmes de traitement de texte. On trouve aujourd'hui plusieurs traiteurs de texte (Word Perfect...) qui connaissent ce format. Donc, ce qui est dit à propos du MS Word est valable pour tous les logiciels de traitement de texte qui peuvent fournir du format RTF.
On peut trouver une définition du format RTF ainsi que des outils qui s'y rapportent à
ftp://ftp.primate.wisc.edu/pub/RTF
- Donner ce document converti en RTF au programme RTFtoHTML qui va le convertir (au mieux) en un document HTML.
Attention, il existe plusieurs programmes qui font la même chose et qui portent, forcément, des noms semblables RTF2HTML etc. Celui que nous prenons en exemple s'appelle strictement RTFtoHTML.
Quand on dit "au mieux" on veut dire qu'un document Word cochonné donnera en sortie un document HTML cochonné suivant le vieux principe du GIGO (garble in, garble out). Par contre, un document Word écrit avec style -- au sens où chaque type de paragraphe a reçu un style Word spécifique -- pourra être traduit avec une grande efficacité.
Il faudra probablement, après la conversion automatique, ajuster quelques détails mais 85 % du texte sera bien converti.
On a préparé une procédure qui facilitera la bonne utilisation de ces styles.
Autres méthodes de conversion
On a parlé principalement du Word de Microsoft, fort utilisé à l'UCL, mais il y a des utilisateurs qui utilisent d'autres outils de traitement de textes. Que faire dans ce cas ?
Pour rappel,
- l'usage de la version 4 de ClarisWorks est assez général parce que ClarisWorks peut ouvrir des documents en code Acta, MacWrite, MS Word, WordPerfect, WriteNow et même HTML (ce qui permet de les retraiter ou de les convertir).
- MS-Word pour Windows peut reconnaître plusieurs formats étrangers et donc les convertir en HTML grâce à l'Internet Assistant,
- la méthode du "passage par RTF" est très générale aussi puisqu'elle permet à tout logiciel pouvant produire des documents en code RTF de pouvoir produire indirectement des documents en code HTML; on trouve le programme RTFtoHTML dans les mondes Mac, PC et Unix.,
Pour ceux qui ne seraient pas encore satisfaits; je signale que le Consortium W3 (W3C) tient à jour une
liste d'autres outils de conversion,
dont je ne donnerai que les noms des logiciels qui n'ont pas encore été évoqués
jusqu'ici: conversion de Postscript vers HTML, de Framemaker..., de troff...,
de LateX..., de BibTeX..., de Textinfo..., de DECwrite..., d'Interleaf...,
de QuarkXPress..., de PageMaker..., d'AmiPro..., de Scribe..., de Persuasion...,
d'EndNote..., de Linuxdoc.
Enfin, par soucis d'exhaustivité, on doit aussi citer la
liste de Nelson (?)
qui est également très complète.
4. Le retour de HTML vers Word ou ...
Faut-il déjà abandonner le papier ?
Dans certains cas la réponse est facile à donner. Dans d'autres; elle est beaucoup plus nuancée: parfois on ne l'abandonnera jamais, parfois, on ne pourra l'abandonner que lorsqu'un nombre suffisant de consultants seront branchés sur l'Internet (et cela pourra prendre du temps).
Dans tous les cas où on doit garder une double production (forme papier -- une brochure -- et forme électronique -- des pages WWW), il faut gérer ce double travail en essayant de le réduire à sa plus simple part. Il faut d'abord décider où sera l'original. Ce sera le document destiné à l'impression ou celui mis à disposition sur le serveur Web. Le choix peut dépendre de celui qui est mis à jour.
Si l'on décide que ce sera le document HTML, on doit pouvoir encore assurer la production d'un papier (revue, brochure) équivalent (ou non) au contenu des pages HTML. Dans ce cas, si votre imprimeur peut traiter du texte codé en HTML, le problème est résolu.
Pour rappel, le HTML est un sous ensemble du SGML qui a été spécialement conçu pour assurer la communication avec les imprimeurs.
Si votre imprimeur ne peut rien faire avec un texte HTML, il faut, soit changer d'imprimeur (ou le menacer de le faire), soit reconvertir le texte HTML en texte qu'il peut traiter, du Word, par exemple.
Pour ce faire, je renvoie encore à une liste de W3C qui signale une trentaine de produits pour assurer le retour.
Je signalerai en plus la nouvelle version de MacLinkPlus (8.0i), chez
DataViz
qui n'est pas encore reprise dans la liste de W3C. Elle permet, en ouvrant un fichier HTML de l'intérieur de Word, par exemple, d'obtenir un texte purement Word pour communication à l'imprimeur. De manière plus générale, MacLinkPlus peut lire un texte en HTML pour le convertir en un grand nombre de formats différents.
Page : UCL
| Que lire sur
| Pointeurs utiles.
2 février 1996.
Responsable: Jean-Pierre Mitsch
<Mitsch@ipm.ucl.ac.be>