Qu'est-ce qu'un texte ?

VII FIGURATION ET INFORMATION

   
   

    La notion d’information
   
    L’information est quantifiable. La théorie de l’information prend comme unité de mesure la quantité d’information qui divise l’incertitude par deux. Si j’apprends que le livre que je recherche est en Français, cette information diminue considérablement le champ de ma recherche. Si j’apprends qu’il est broché et non relié, il en sera encore diminué. On nomme “N” le nombre d’événements possibles, et “n” le sous ensemble désigné par l’information — dans mon exemple, N est, disons, l’ensemble des livres d’une bibliothèque, et n les livres en Français brochés.
    On pose ainsi l’unité d’information : I=log2 (N/n)
    Soit N le nombre des livres de la bibliothèque, n1 le nombre de livres en Français, n2 le nombre de livres brochés en Français,

   
6.jpeg

   
    Si l’on a 800 livres dont 50 sont en Français, 200 brochés et 20 brochés en Français, l’information « en Français » vaut : 800/50=2 ; « broché » : 800/50=4 ; et « brochés en Français » : 800/20=5,32.
   
    Un texte brut, tel que nous pourrions le saisir sur une machine à écrire, même s’il est très long, ne contiendra pas beaucoup d’informations, puisqu’il ne sera que la réitération d’une nombre limité de touches, ou de combinaisons de touches. Si vous les mémorisez toutes, ça ne fera pas une grande quantité d’information, qui pourtant contiendra tout le texte.
    Imaginez maintenant une lettre bien dessinée dont vous voulez réduire l’échelle. Vous devez alors connaître ses proportions et ses mesures : vecteurs, angles, courbes… De telles informations pourraient devenir plus nombreuses que pour un texte entier. Pour s’en donner une idée, il suffit de regarder la taille en octet d’un fichier texte (de quelques ko à quelques centaines en général) et d’ouvrir le dossier des polices pour comparer les tailles plusieurs dizaines ou centaines de fois supérieures.
    Supposons maintenant que nous ne voulions plus seulement mémoriser la forme de la lettre, mais aussi sa teinte, sa texture. Nous devons alors considérer chaque point de sa surface, et la quantité d’information alors pourra être plus importante que celle d’une police vectorielle complète.
   
   
    Figures et figuration
   

    Selon l’approche numérique, nous n’avons en fait que des figures — deux sortes de figures (vectorielles et bitmap) dont les différences ici importent peu. À travers elles, se distinguent cependant, d’un point de vue à la fois fonctionnaliste et constructiviste, plusieurs modes de figuration.
    La figuration déterminante, pour ce qui concerne le texte, est la figuration d’objets logiques, fonctionnant au sein d’un système. L’ensemble des figures constitue alors ce qu’on appelle proprement une police.
    Par ce moyen, chaque figure, appartenant à un ensemble fonctionnant en système, peut être remplacée par une figure appartement à un autre ensemble équivalent. Si les deux ensembles fonctionnent dans le même système, c’est à dire si les deux polices figurent le même alphabet, le texte ne devrait pas en être affecté dans un usage courant.
    Si ce n’est pas le cas, il ne le sera que superficiellement. Le texte ne sera certes plus déchiffrable, mais les relations internes entre objets logiques ne seront pas changées, et il suffira de choisir un autre ensemble de figures pour que le texte devienne à nouveau lisible.
   

   
61.gif


    Il en va tout autrement pour des formes ne figurant pas des objets logiques. On peut distinguer alors des quantités de modes de figuration.
   
   
    Figuration et information
   

    Considérons cette simple phrase par rapport à l’information qu’elle est susceptible de véhiculer : « passe-moi le sel. »
    On peut être à table, et il peut très bien ne se trouver sur cette table qu’une salière et un poivrier à faire passer. Dans ce cas, l’information que véhicule cette phrase, en supplément de la gestuelle et de la mimique qu’elle accompagne, peut se figurer par un rapport de 1 sur 2. Une paire de signes (0-1) suffirait à figurer les occurrences en jeu. On peut aussi imaginer un distributeur automatique où il suffirait de choisir entre deux boutons plutôt que d’articuler une telle phrase.
    On peut considérer cette phrase d’une quantité d’autres points de vue. Elle pourrait être utilisée dans un cours de français, ou un manuel, pour enseigner l’emploi de l’impératif, par exemple.
    Elle pourrait aussi bien être utilisée pour présenter une police, ou encore comme mot de passe, ou pour supporter une empreinte vocale. Dans tous ces cas, et dans d’autres possibles, nous n’avons plus à faire au même objet, ni aux mêmes symboles.
    Dans la première occurrence (à table), la même phrase pourrait être remplacée par une autre de la même famille : « Peux-tu me passer le sel ? » « Le sel, s’il te plaît. »…Etc.
   
    J’envoie la phrase « passe-moi le sel » sous la forme d’un fichier texte en données brutes. Ces données qui transiteront n’auront qu’à permettre l’identification des objets logiques que constituent les caractères. Il se pourrait aussi que « passe-moi le sel » ne soit que le texte d’une case à cocher, dans un jeu, par exemple, ou un didacticiel de Français.
    Si la police et le style m’importent, il y aura deux possibilités : soit mon correspondant disposera déjà sur place de la même police, et l’information n’aura, par rapport à la précédente, qu’à permettre en plus de les identifier. Soit cette police et ses styles devront lui être communiqués aussi, sous la forme d’un fichier de figures.
    Pour ce qui est d’une telle phrase en tant qu’objet sonore, un logiciel serait bien capable de prononcer du texte brut, et, si cela me suffit, la quantité d’information qui transitera sera faible. Si je tiens, au contraire, à ce que le ton et la voix soient restituées, la quantité d’information pourra être très élevée en proportion de mes exigences.
    Ce qui constitue en principe une même phrase peut ainsi être rendu par une quantité de données allant de 2 à 218 et plus.
   



<- ->

La Version 01 française de Qu'est-ce qu'un texte ? est constitué
de 16 fichiet html associés à une feuille de style (text1.css)
et d'un dossier "graphics" contenant 15 fichiers,
réunis dans un fchier txt_fr, que l'on peut librement télécharger.

© Jean-Pierre Depétris, avril 2002, avril 2003
Copyleft : cette oeuvre est libre, vous pouvez la redistribuer
et/ou la modifier selon les termes de la Licence Art Libre.
Vous trouverez un exemplaire de cette Licence sur le site Copyleft
Attitude http://www.artlibre.org ainsi que sur d'autres sites.
Adresse de l'original : jdepetris.free.fr/what_a_text/txt_fr/text0.html