Qu'est-ce qu'un texte ?

IV LA NOTION DE TEXTE BRUT



    Le texte brut
   
    Un texte brut est une suite de caractères comme nous en écrivons avec une machine à écrire, ou encore comme nous en écrivons la plupart du temps à la main. Un texte brut contient tout ce qui peut être prononcé dans une succession de signes.
    Il n’est pas « mis en page », et tous ses aspects visuels : polices, marges, alinéas, espaces entre les lignes, nombre de mots par ligne ou de lignes par page, sont contingents. En règle générale, nous n’écrivons que du texte brut, mais nous en lisons assez rarement, à moins d’être correcteur ou enseignant.
   
    Le texte brut contient toutes les catégories de caractères et rien d’autre : les lettres et les symboles, les ponctuations et les caractères invisibles. Il les contient seulement en tant qu’objets logiques, pas en tant que formes plastiques. Lorsqu’on dit qu’un texte est reitérable, c’est à dire éditable, ou encore recopiable, cette propriété ne concerne en fait que le texte brut.
    La plupart du temps, je ne m’intéresse à rien d’autre qu’à ce texte brut lorsque j’écris. On pourrait considérer qu’il est le texte proprement dit. Or, justement, parce que le texte brut se suffit à lui-même, on peut souhaiter lui ajouter des enrichissements qui sont autant d’informations supplémentaires. Ne nous y trompons pas cependant, le texte brut n’est pas seulement du texte au kilomètre, et ses ressources de mise en page ne sont pas négligeables grâce aux caractères invisibles. La plupart des poèmes spatialistes peuvent parfaitement être édités dans un strict texte brut.
   

Cosmos
   
    Cosmos, Pierre Garnier, dans Prototypes (1965).

   

    Les caractères invisibles, espaces et sauts de paragraphe, ont ici une fonction aussi déterminante que les lettres.


    La ponctuation
   
    Je préfère parler de « caractères de ponctuation » pour désigner seulement le signe graphique en le distinguant de sa valeur sonore. En fait, le signe de ponctuation est double : le signe graphique, le caractère, à pour fonction de marquer un signe sonore.
    Lorsqu’on écoute quelqu’un lire un texte à haute voix, ou aussi bien lorsqu’on fait lire ce dernier par un logiciel, on s’aperçoit que la voix marque de plus nombreux silences que la ponctuation n’en demande.
   
    Les silences et les intonations que la ponctuation marque sont généralement ceux qui ont une valeur grammaticale.
    Comparons ces deux phrases :

       La lune sur la mer blanche… 
       La lune sur la mer, blanche… 

   
En tant que caractère, la virgule n’a aucune signification grammaticale, mais la respiration qu’elle marque en a une. La rupture indique que l’adjectif « blanche » ne se rapporte pas au nom « mer » qui le précède immédiatement.
    De même, ce n’est pas le signe graphique qu’est le point d’interrogation qui indique une tournure interrogative. Il marque la montée du ton jusqu’à la fin de la phrase, et c’est son suspens seul qui donne le ton interrogatif.
   
    Il n’est pas très évident de définir les formes phonétiques particulières que doivent prendre la lecture des parenthèses ou des tirets. Il ne fait pourtant pas de doute qu’elles en ont de différentes, et que nous n’avons le plus souvent pas de mal à les trouver.
   
   
    Les caractères invisibles

   
    Les caractères invisibles ne sont pas si invisibles que ça, puisqu’ils marquent de très visibles espaces vides entre les signes, les mots, les fins de lignes et les bords de la page. Ils peuvent même être rendus plus visibles encore sous forme de caractères spéciaux, afin d’être manipulés plus efficacement.
    Comme les signes de ponctuation, les caractères invisibles marquent des ruptures et des respirations dans le texte, mais celles-ci sont alors plus visuelles que sonores. La parole utilise de nombreuses ressources qui disparaissent dans l’écrit. D’abord, la parole est une suite de phonèmes dans le temps. Ce temps n’est pas seulement une durée, mais plutôt un tempo, avec une complète architecture musicale : mesure, rythme, mélodie, assonances, harmonie…
    Le texte ne se déploie pas dans le temps mais dans l’espace, ce qui le rend mieux parcourable, navigable ; et il a deux façons de se diviser. L’une est contingente, l’autre a une signification et contribue à son caractère d’objet logique.
   
   
    Le texte en tant qu’objet logique
   
    Un caractère est un objet logique, et un texte, dans la mesure où il est une combinaison de caractères, en est un aussi.
    Un objet logique n’a pas de forme particulière. Il peut prendre n’importe laquelle, mais il doit en prendre une. Il peut être manuscrit ou typographié dans n’importe quelle police, et copié sous toute forme possible. Cela donne une nature ambiguë à l’objet logique : une, logique et dotée de sens, une autre, physique et contingente.
    Cette double nature est particulièrement saillante dans les différentes divisions que peut avoir un texte. D’un point de vue physique, et donc contingent, la page est la principale division d’un texte, son unité de mesure. Dès qu’un texte en a plus d’une, elles sont numérotées. S’il en comporte un bon nombre, plan et index renverront à ces numéros de page, éventuellement aux lignes, qui parfois sont aussi numérotées et constituent une autre division importante du texte.
    Dans les métiers de l’édition et la presse, on a longtemps appelé « feuillet » une page d’à peu près deux mille caractères (sans compter les espaces) et mesuré la taille des textes en feuillets. Mais de telles divisions du texte n’ont aucune existence pour l’objet logique ni pour le texte brut ; la pagination étant susceptible de changer pour chaque réitération.
    En tant qu’objet logique, il ne connaît pas de telles divisions. Quand il atteint la marge d’une page, il continue sur une autre ligne, et quand la page est pleine, il passe à une autre, mais ni largeur du papier, ni hauteur des feuilles n’ont de réelles existences pour lui. Il ne connaît la page qu’à travers le caractère qu’est le saut de page.
    Il connaît moins encore la ligne, à moins qu’un saut de ligne ne soit forcé. Il connaît surtout le paragraphe. La principale division du texte en tant qu’objet logique est le paragraphe, objectivé par un caractère invisible “¶”, placé à la fin de celui-ci. Ce caractère détermine dans le texte enrichi tous les attributs du paragraphe : ses marges, son alignement, son alinéa, l’espace avant, après, et entre les lignes.
   
   

<- ->

La Version 01 française de Qu'est-ce qu'un texte ? est constitué
de 16 fichiet html associés à une feuille de style (text1.css)
et d'un dossier "graphics" contenant 15 fichiers,
réunis dans un fchier txt_fr, que l'on peut librement télécharger.

© Jean-Pierre Depétris, avril 2002, avril 2003
Copyleft : cette oeuvre est libre, vous pouvez la redistribuer
et/ou la modifier selon les termes de la Licence Art Libre.
Vous trouverez un exemplaire de cette Licence sur le site Copyleft
Attitude http://www.artlibre.org ainsi que sur d'autres sites.
Adresse de l'original : jdepetris.free.fr/what_a_text/txt_fr/text0.html