IV LA NOTION DE TEXTE BRUT
Le texte brut
Un texte brut est une suite de caractères comme nous en écrivons avec une machine à écrire, ou encore comme nous en écrivons la plupart du temps à la main. Un texte brut contient tout ce qui peut être prononcé dans une succession de signes.
Il nest pas « mis en page », et tous ses aspects visuels : polices, marges, alinéas, espaces entre les lignes, nombre de mots par ligne ou de lignes par page, sont contingents. En règle générale, nous nécrivons que du texte brut, mais nous en lisons assez rarement, à moins dêtre correcteur ou enseignant.
Le texte brut contient toutes les catégories de caractères et rien dautre : les lettres et les symboles, les ponctuations et les caractères invisibles. Il les contient seulement en tant quobjets logiques, pas en tant que formes plastiques. Lorsquon dit quun texte est reitérable, cest à dire éditable, ou encore recopiable, cette propriété ne concerne en fait que le texte brut.
La plupart du temps, je ne mintéresse à rien dautre quà ce texte brut lorsque jécris. On pourrait considérer quil est le texte proprement dit. Or, justement, parce que le texte brut se suffit à lui-même, on peut souhaiter lui ajouter des enrichissements qui sont autant dinformations supplémentaires. Ne nous y trompons pas cependant, le texte brut nest pas seulement du texte au kilomètre, et ses ressources de mise en page ne sont pas négligeables grâce aux caractères invisibles. La plupart des poèmes spatialistes peuvent parfaitement être édités dans un strict texte brut.
Cosmos, Pierre Garnier, dans Prototypes (1965).
Les caractères invisibles, espaces et sauts de paragraphe, ont ici une fonction aussi déterminante
que les lettres.
La ponctuation
Je préfère parler de « caractères de ponctuation » pour désigner seulement le signe graphique en le distinguant de sa valeur sonore. En fait, le signe de ponctuation est double : le signe graphique, le caractère, à pour fonction de marquer un signe sonore.
Lorsquon écoute quelquun lire un texte à haute voix, ou aussi bien lorsquon fait lire ce dernier par un logiciel, on saperçoit que la voix marque de plus nombreux silences que la ponctuation nen demande.
Les silences et les intonations que la ponctuation marque sont généralement ceux qui ont une valeur grammaticale.
Comparons ces deux phrases :
La lune sur la mer blanche
La lune sur la mer, blanche
En tant que caractère, la virgule na aucune signification grammaticale, mais la respiration quelle marque en a une. La rupture indique que ladjectif « blanche » ne se rapporte pas au nom « mer » qui le précède immédiatement.
De même, ce nest pas le signe graphique quest le point dinterrogation qui indique une tournure interrogative. Il marque la montée du ton jusquà la fin de la phrase, et cest son suspens seul qui donne le ton interrogatif.
Il nest pas très évident de définir les formes phonétiques particulières que doivent prendre la lecture des parenthèses ou des tirets. Il ne fait pourtant pas de doute quelles en ont de différentes, et que nous navons le plus souvent pas de mal à les trouver.
Les caractères invisibles
Les caractères invisibles ne sont pas si invisibles que ça, puisquils marquent de très visibles espaces vides entre les signes, les mots, les fins de lignes et les bords de la page. Ils peuvent même être rendus plus visibles encore sous forme de caractères spéciaux, afin dêtre manipulés plus efficacement.
Comme les signes de ponctuation, les caractères invisibles marquent des ruptures et des respirations dans le texte, mais celles-ci sont alors plus visuelles que sonores. La parole utilise de nombreuses ressources qui disparaissent dans lécrit. Dabord, la parole est une suite de phonèmes dans le temps. Ce temps nest pas seulement une durée, mais plutôt un tempo, avec une complète architecture musicale : mesure, rythme, mélodie, assonances, harmonie
Le texte ne se déploie pas dans le temps mais dans lespace, ce qui le rend mieux parcourable, navigable ; et il a deux façons de se diviser. Lune est contingente, lautre a une signification et contribue à son caractère dobjet logique.
Le texte en tant quobjet logique
Un caractère est un objet logique, et un texte, dans la mesure où il est une combinaison de caractères, en est un aussi.
Un objet logique na pas de forme particulière. Il peut prendre nimporte laquelle, mais il doit en prendre une. Il peut être manuscrit ou typographié dans nimporte quelle police, et copié sous toute forme possible. Cela donne une nature ambiguë à lobjet logique : une, logique et dotée de sens, une autre, physique et contingente.
Cette double nature est particulièrement saillante dans les différentes divisions que peut avoir un texte. Dun point de vue physique, et donc contingent, la page est la principale division dun texte, son unité de mesure. Dès quun texte en a plus dune, elles sont numérotées. Sil en comporte un bon nombre, plan et index renverront à ces numéros de page, éventuellement aux lignes, qui parfois sont aussi numérotées et constituent une autre division importante du texte.
Dans les métiers de lédition et la presse, on a longtemps appelé « feuillet » une page dà peu près deux mille caractères (sans compter les espaces) et mesuré la taille des textes en feuillets. Mais de telles divisions du texte nont aucune existence pour lobjet logique ni pour le texte brut ; la pagination étant susceptible de changer pour chaque réitération.
En tant quobjet logique, il ne connaît pas de telles divisions. Quand il atteint la marge dune page, il continue sur une autre ligne, et quand la page est pleine, il passe à une autre, mais ni largeur du papier, ni hauteur des feuilles nont de réelles existences pour lui. Il ne connaît la page quà travers le caractère quest le saut de page.
Il connaît moins encore la ligne, à moins quun saut de ligne ne soit forcé. Il
connaît surtout le paragraphe. La principale division du texte en tant quobjet logique est le
paragraphe, objectivé par un caractère invisible ¶, placé
à la fin de celui-ci. Ce caractère détermine dans le texte enrichi tous les attributs
du paragraphe : ses marges, son alignement, son alinéa, lespace avant, après,
et entre les lignes.
La Version 01 française de
Qu'est-ce qu'un texte ? est constitué
de 16 fichiet html associés à une feuille de style (text1.css)
et d'un dossier "graphics" contenant 15 fichiers,
réunis dans un fchier
txt_fr, que l'on peut librement télécharger.
© Jean-Pierre Depétris, avril 2002, avril 2003
Copyleft : cette oeuvre est libre, vous pouvez la redistribuer
et/ou la modifier selon les termes de la Licence Art Libre.
Vous trouverez un exemplaire de cette Licence sur le site Copyleft
Attitude http://www.artlibre.org ainsi que sur d'autres sites.
Adresse de l'original :
jdepetris.free.fr/what_a_text/txt_fr/text0.html
|