eao.gif

MÉTHODE RAISONNÉE POUR ÉCRIRE AVEC UN ORDINATEUR

Site de l'auteur Plan Précédent Suivant



I. CARACTÈRES ET FORMATS




LES JEUX DE CARACTÈRES



Un texte, numérisé ou non, est fait à l'aide d'un jeu de caractère, c'est à dire qu'un nombre fini de caractères peut être indéfiniment combiné. Tous les ordinateurs, tous les systèmes, ne possèdent pas les mêmes jeux de caractères.


Les jeux de caractères (charset)

L’alphabet latin comporte deux fois 26 lettres (majuscules et minuscules) et 10 chiffres, auxquels on doit ajouter un certain nombre de signes, notamment, les ponctuations et les espaces. Un premier jeu de caractères a été créé pour l’usage de l’anglais : l’US-ASCII.

 


ASCII

Ce jeu de caractère est toutefois très incomplet pour la plupart des langues occidentales. Celui du Macintosh a été le premier à palier à ces limites.
Jeu de caractères du Macintosh :


mac.1

mac.2

Ce jeu contient deux fois plus de caractères que l’ASCII. Les 127 premiers sont les mêmes, et il en contient 127 de nouveaux.

Il eut été bien simple que tous les systèmes l’adoptent, mais on se demande bien pourquoi faire simple quand on peut faire compliqué. On m’aurait alors privé de la nécessité d’écrire ce paragraphe un peu abrupt au début de ma méthode, et, par là, on aurait privé le lecteur d’un effort intellectuel qui ne peut que lui être bénéfique.

Bref, les jeux de caractères qu’utilisent les systèmes varient. Quasiment tous cependant utilisent les 127 premiers caractères du code ASCII, et l’on peut au moins s’assurer d’une communication sans problème tant qu’on reste dans ses limites.

Afin de résoudre ces problèmes de conversion, un nouveau jeu de caractères s’est imposé comme standard. Il s’appelle ISO-LATIN-1 (ou ISO-8851-1 pour les intimes).


Jeu de caractères ISO-LATIN-1 :


ISO-LATIN

ISO-LATIN

Deux ordinateurs utilisant deux systèmes différents peuvent donc s’entendre pour utiliser l’ISO-LATIN-1 afin de communiquer. Ils peuvent le faire, mais encore doit-on parfois savoir le leur demander.

Il est parfois plus sûr d'utiliser l'US-ASCII pour communiquer entre systèmes différents. Un certain nombre de caractères qui n'en font pas partie peuvent alors être écrits dans un code : "é", par exemple, s'écrit "&ecute;". Ce code ASCII ouvre toujours avec un "&", et ferme avec un ";". Exemples : "œ" s'écrit "œ"..

Il n'est naturellement pas question d'apprendre ce code par coeur. Des programmes se chargent très bien de la conversion. Tous les navigateurs sont capables d'afficher le code US-ASCII sous la forme de l'ISO-LATIN-1, ou des jeux de caractères d'une autre langue.

Cette introduction un peu austère était nécessaire pour aborder les questions de format.




 


Quelques autres jeux de caractères :

UTF-8 (Unicode) Jeu de caractères universels
ISO-8859-1 (Latin-1) Europe occidentale, Amérique
ISO-8859-2 (Latin-2) Europe centrale et orientale
ISO-8859-3 (Latin-3) Europe du sud-est
ISO-8859-4 (Latin-4) Scandinavie, pays baltes
ISO-8859-5 Cyrillique
ISO-8859-6 Arabe
ISO-8859-7 Grec
ISO-8859-8 Hébreu
ISO-8859-9 Turc
EUC-JP ou Shift_JIS Japonais



Site de l'auteur Plan Précédent Suivant



© Jean-Pierre Depétris, 2002