Aller au contenu

Comptes rendus

Afficher toutes les informations ⮟

  • ISBN: 978-2-8124-0408-5
  • ISSN: 2262-0346
  • DOI: 10.15122/isbn.978-2-8124-4260-5.p.0121
  • Éditeur: Classiques Garnier
  • Date de parution: 27/08/2012
  • Périodicité: Semestrielle
  • Langue: Français
Accès libre
Support: Numérique
121
COMPTES RENDUS



BAUDELAIRE, Les Fleurs du Mal. Concordances, index et relevés statistiques

établis d'après l'édition Crépet-Blin paz le Centre d'Etude du Voca-
bulaire français de la Faculté des Lettres de Besançon, avec la collabora-
tion de K. Menemencioglu, 1 vol. br., 21 X 27, 246 p., 28 francs. Paris,
s. d. (1965) Ed. Larousse.

On pourrait se contenter de quelques lignes pour signaler cette publi-
cation ; il suffirait d'attirer l'attention de ceux qui s'intéressent à Baudelaire,
ou plus généralement au langage poétique, sur ce relevé lexical complet du
texte et de ses vaziantes  :chacun des mots qui y figurent étant remis à sa
place alphabétique et suivi de tous les vers qui le contiennent, un coup d'oeil
donne une première mesure de ses emplois, de ses valeurs et des associations
qu'il peut créer  ; on citerait aisément quelques exemples suggestifs  ; on
signalerait les tableaux récapitulatifs, qui à la fin du volume regroupent cer-
taines données numériques ; et il ne resterait qu'à se féliciter une fois de
plus de l'heureuse collaboration des machines, qui permet au linguiste d'épaz-
gner son temps, et à souhaiter que la collection ainsi inaugurée nous propose
bientôt d'autres concordances semblables.

Ce serait traiter à la légère l'énorme travail qu'a exigé cet ouvrage, et
les nombreux problèmes de méthode qu'il a posés (1), justement pazce qu'il
ouvre une série et qu'il engage l'avenir. Les options les plus futiles en appa-
rence, dans ce cas, prennent leur importance si elles doivent être reportées
sur d'autres oeuvres  ; car l'unité et la stabilité des normes est la condition
première des comparaisons et des synthèses futures. C'est à ce titre que l'on
doit soumettre l'ouvrage à un examen scrupuleux, et même vétilleux. Le
meilleur moyen de reconnaître le travail des auteurs n'est-il pas de meure en
lumière les difficultés qu'ils ont rencontrées, même si quelques-unes leur ont
résisté, et d'aider à corriger les quélques imperfections de ce premier essai  ?

Notons d'abord la réussite technique, obtenue après de nombreux tâton-
nements, qui permet maintenant de passer directement des listages de la
tabulatrice à l'impression, par reproduction photographique  ;économie consi-
dérable, qui rend plus accessibles de telles publications. Remarquons aussi
que ce classement intégral des formes a été obtenu paz les seuls moyens de la
mécanographie, dont la lourdeur relative est compensée par des avantages
appréciables dans l'examen et le tri des formes homographes qui s'ensuit.

(t) On trouvera un reflet des travaux prépazatoires effectués à Besançon sous la
direction de B. Quemada dans les numéros I, II et III du Bulletin d'Information du
Laboratoire d'analyse lexicologique (Besançon, i96o).

122 Les opérations commencent, on le sait (a), paz l'établissement d'une
bande perforée, d'où l'on tire mécaniquement un double fichier  :cartes-mots
et cartes-contextes. On a pris comme unité de contexte le vers, même court,
solution économique qui se révèle presque toujours très suffisante pour les
identifications grammaticales, et même pour l'intelligence des sens.

Le résultat de cette première opération est un catalogue des formes (3),
accompagnées de leurs références ; ce qui revient (comme dans les Index de
Besançon) à réunir (le) bois et (je) bois, mais à séparer cette dernière forme
de (nous) buvons, comme l'on sépaze yeux de ceil. Certes, on peut s'en tenir
là ; c'est ce que fit un précurseur, William T Bandy, auteur du Il~ord Index
to Baudelaire's poems (ronéotypé, Madison, 1939) ~ une telle liste de formes
est déjâ un outil précieux ; mais elle n'est guère utilisable sans un constant
recours au texte ;car celui qui s'intéresse à l'or chez Baudelaire devra d'abord
se débarrasser des références qui le mènent à la conjonction homonyme ; et
l'image du ver ne sera constituée qu'après avoir rassemblé singuliers et pluriels

O vers  ! noirs compagnons sans oreille et sans yeux  !

et après avoir écarté

je te donne ces vers...

et .

Crispe ses poings vers Dieu...

L'index des formes ne devient donc un index de mots qu'après la sépa-
ration des homographes et le regroupement des formes fléchies. Lourde
tâche, en français plus qu'ailleurs, et à laquelle les machines participent assez
peu ; elles ne peuvent que sépazer les formes homographes quand celles-ci
ont été préalablement codées paz une intervention humaine

Ce codage peut se limiter aux formes ambiguës ; la plupart du temps,
la catégorie grammaticale suffit our rattacher correctement à un lemme, et
un code numérique d'un signe ~de o à 9) convient, si l'on ne tient pas à dis-
tinguer nombres, genres, personnes, temps et modes des formes qui dépendent
d'un même lemme  ; on a ainsi bois o (= substantif), singulier ou plunel, et
boisa (= verbe), Ire ou ae personne du singulier ; ou bien or o et or g (= con-
jonction). Reste le cas des homographes de même catégorie  : (le) voile et (la)
voile, air (= as ect) et air (= atmosphère), les deux voler, (il) convient et
(ils) convient, (je~ vis (de voir) et ( !e) vts (de vivre), etc. Il faut ici introduire
des discriminants non grammaticaux.

Mais on peut aussi coder tous les mots du texte, ce qui prépaze des comp-
tages paz catégorie grammaticale. C'est la solution adoptée pour cette concor-
dance. Elle néglige toutefois les homographes sans différence de catégorie,
qui ont dû être ensuite séparés «  à la main  ».Ace stade du travail interviennent
les décisions, parfois embazrassantes ;ainsi on a réuni fonds singulier (cc dans
mon fonds le plus ténébreux  ») et fonds, pluriel de fond («  les gouffres sans
fonds  ») ; en revanche, on a codé différemment mort dans «  le mort joyeux  »

(i) Voir à ce sujet le n° I du Bulletin déjà cité, et l'exposé de B. Quemada au Col-
loque de Strasbourg en 1987 (Lexicologie et lexicographie françaises et romanes, C.N.R.S.,
196i, P• 53 s4q•)•

(3) Sur les index de mots et les index de formes, voir Ch. Muller. Les Indez de
vocabulaire, in Bulletin des 3`eunes Romanistes, n° 4~ P• 9 sqq. (1961) et n° 8, p. 44 sqq

(1963)•

123 et «  un mort libre et joyeux  » (¢) ; on a traité comme substantif (S) la forme
belle dans

A te voir marcher en cadence

Belle d'abandon...

On a réuni tous les sens de air sous une seule vedette, ce qui est défendable,
mais contraire à la tradition lexicographique ; on n'a pas distingué Dieu et
dieu, ce qui du reste est souvent difficile et qui a la caution de plusieurs dic-
tionnaires (dont le Petit Larousse,Dieu et Satan figurent le premier dans
la partie générale, le second dans la partie historique et géographique). Mais
on a distingué diane et Diane.

C'est après ce codage grammatical de toutes les formes que l'on obtient
l'index statistique qui occupe les pages ao3 à a25  : chaque forme y est accompa-
gnée de sa fréquence et de sa « répartition  », c'est-à-dire du nombre de poèmes
où elle figure. Ce recensement exclut les variantes, traitées dans un index

articulier (pp. a37-a¢¢). Notons une défaillance de la machine à la page Zo5
brisés ¢scindé en deux) et une faute de frappe à la page 223 (syllables) (6).

Pour passer de cet index statistique à la concordance, il a fallu éliminer
les mots à fréquence très élevée, regrouper les formes fléchies, faire suivre
chaque mot-vedette des contextes et des références.

Si la concordance était faite sans aucune élimination, elle comporterait
autant de contextes, donc de vers, qu'il y a de mots dans le recueil, soit un
peu plus de 30 000 ; la seule entrée a le, art. déf  », serait suivie de quelque
a Soo citations, une bonne moitié des Fleurs du Mal. On pouvait, pour éviter
cet encombrement bien inutile, écarter de la concordance tous les mots qui
dépasseraient une certaine fréquence  :mais dans la concordance d'une autre
oeuvre, la liste des éliminations serait différente ; on a donc dressé une liste
de mots grammaticaux, une cinquantaine en tout, choisis à la fois d'après
leur fréquence et leur faible intérêt lexicologique, et formant des séries cohé-
rentes  :ainsi on écarte eux, c~ui n'appazaît que 12 fois, pazce qu'il appartient
aux pronoms personnels, mais on conserve comme, quia 331 occurrences et
dont les contextes occupent plus de deux pages  :quel secours pour celui qui
s'intéresse aux comparaisons  !

On a regroupé les formes fléchies de façon diverse  :pour les verbes, toutes
les formes, y compris les participes adjectivés, sont réunies ; au contraire les
formes d'un adjectif ou d'un substantif restent distinctes  :plein, pleine, pleines
et pleins fournissent quatre entrées, que l'on se contente de rapprocher si
elles ne se suivent pas dans l'ordre alphabétique  ; ainsi yeux vient se placer
après aril, et rêves n'est plus séparé, de rêve, comme clans l'index statistique,
par réveil, revenir, rêver, etc. Quelques oublis cependant dans ce regroupe-
ment  :travaux est sépazé de travail par travailler et travailleur; fol et folles
n'ont pas rejoint fou ; vieux, vieil, vieille, etc. sont dispersés. D'autre part on
a réuni, sans doute pour gagner de la place, des formes codées différemment
comme mort masc. et mort fém.

(4) Les deux pdche, tous deux substantifs féminins, ont été correctement distingués,
ainsi que tour masculin et tour féminin

(S) J'hésite aussi à considérer comme une forme du verbe suivre a ... un beau
vaisseau qui prend le lazge, chazgé de toile, et va roulant suivant un rythme doux, et
paresseux, et lent  ».

(6) Autre indication pour un erratum  : le vers « Que d'ignobles bourreaux plan-
taient dans tes chairs vives n comporte une faute de frappe (qui pour que) qui n'a été
rectifiée que dans une seule des citations.

124 Le point le plus contestable me semble être le traitement des participes.
Je sais que c'est là le chapitre le plus désespérant de la casuistique lexico-
graphique, mais j'ai peine à approuver la solution adoptée ici. Lors du codage,
on avait distingué trois cas

— forme impersonnelle de verbe code 3
— adjectif qualificatif ou participe passé employé sans

auxiliaire code 4

— substantif code o

Le classement des formes en -ant dans ces trois catégories ne crée guère
de difficultés ;elles sont codées 3 quand elles sont précédées de en (gérondif ),
quand elles sont senties comme invariables, quand elles sont transitives ;
elles sont chiffrées ¢quand elles sont vaziables ou senties comme variables.
Cela ne soulève aucune objection. Mais dans l'établissement de la concor-
dance, on a rangé le tout à la suite du verbe, alors qu'en général on considère
que charmant, plaisant, languissant, triomphant, etc. sont des unités lexicales
devenues indépendantes. Mais le plus déroutant est que lorsque le verbe
correspondant n'appazaît pas sous d'autres formes clam le recueil, ces mots
retombent au niveau des adjectifs. Ainsi triomphant, triomphante et triomphants
donnent trois entrées, alors que languissants et languissante sont réunis sous
languir; il est évident que dans la concordance d'une oeuvre où triompher
serait présent et où manquerait languir, le classement de ces adjectifs serait
différent. Or, c'est là un des effets d'une norme constante  :chaque forme doit
venir se classer dans une case lexicale préétablie ; idéal difficile à concilier
avec une linguistique rigoureuse, certes ;mais dans un état de langue donné,
la norme ne devrait pas dépendre des contingences du texte analysé.

Pour le participe présent, le problème est du reste simple, et les contextes
ambigus sont très razes. On n'en dira pas autant du pamcipe passé, qui offre
des difficultés quasi insolubles. Le critère de l'auxiliaire me pazaît sans grande
valeur. Je ne vois pas de différence lexicale entre

Il est tombé dans cette geôle

Andromaque, des bras d'un grand époux tombée
La Cloche fêlée (titre)

Moi, mon âme est fêlée

Pas plus, à mon compte, qu'on ne serait fondé à classer différemment «  le ciel
pur  » et « l'air est pur  ».

Il y a certes des participes que leur adjectivation a détachés du verbe
parent  :tels sacré, interdit, étourdi, parfait..., etc. Mais le fait est révélé paz
des critères sémantiques, forcément subjectifs, et de force très inégale suivant
les contextes ; il est assez raze qu'ils soient corroborés paz des faits de position
(un parfait amant). On n'a donc aucune peine à reconnaître qu'il existe un
participe adoré et un adjectif adoré; mais dans une bonne partie des contextes,
il est difficile ou impossible de dire auquel des deux on a à faire ; or, si le
lexicographe peut sélectionner ses citations et écarter les cas douteux, le
statisticien doit classer tous les cas. Aussi ne peut-on reprocher aux auteurs
de la concordance d'avoir indifféremment reclassé sous les verbes toutes les
formes de participes passés, à l'exception de quelques cas du type sacré. Tout
au plus jugera-t-on imprudent le classement d'interdit, codé comme verbe
dans .

... des péchés qui t'ont interdit le tombeau

et .

ni entre
et .

125 COMPTES RENDUS I23
et comme adjectif dans  :

... d'un gouffre interdit à nos sondes.

Mais dont les deux occurrences sont ensuite réunies sous une vedette d'adjectif :

Ces détails de classement, du reste, ne nuisent aucunement à l'usage
normal de la concordance, qui est la lecture synthétique de contextes ayant un
mot en commun L'essentiel est que les regroupements soient correctement
faits lors des relevés récapitulatifs, cequi est le cas (sauf peut-être pour fol,
oublié p. 230). Ils ne prendraient quelque importance que si l'on devait établir
des concordances plus étendues ou très nombreuses et compazer entre eux les
données de divers textes. Mais la chose aurait-elle un sens si ces textes n'appaz-
tiennent pas à un même état de langue  ?

Le volume contient également un index statistique des Soo mots les plus
fréquents. Cette fois il ne s'agit plus de formes, mais bien d'unités lexicales
englobant leurs variantes morphologiques, avec indication, pour chacune de
ces vaziantes, de sa fréquence et de sa répartition. Seuls entrent dans ce relevé
les mots de la concordance, à l'exclusion des mots grammaticaux éliminés de
celle-ci. Son point de départ n'est donc créé ni par une fréquence déterminée,
ni par un rang dans l'échelle des fréquences, ni (comme chez Pierre Guiraud)
paz une limite plus ou moins conventionnelle entre mots pleins et mots-outils.
Son point final est assez azbitraire ; à fréquence égale, les mots sont classés
alphabétiquement ; or le Soo~ est l'adjectif tendre, qui a la fréquence ~  ;
il laisse donc passer devant lui tous les mots de fréquence 7 qut
le précèdent dans l'alphabet, mais non ceux qui le suivent  :triomphant, ville
et bien d'autres sont ainsi écartés de ce palmazès pour une raison toute for-
melle. Il fallait évidemment ici appliquer la règle des ex-crquo dans les con-
cours (~), et pousser la liste jusqu'à la fin de la fréquence ~.

Cette partie, d'ailleurs, cache quelques autres erreurs. ll semble qu'on
ait voulu ica procéder à une autre distribution des formes nominales du verbe.
Ainsi les participes présents adjectivés sont traités à part du verbe  :vivre d'une
part, vivant de l'autre  ; les participes passés, adjectivés ou non, y sont au
contraire joints (cf, par exemple cormu, damné, tombé, etc.) ; cela semble
parfaitement justifié. Mais paz ailleurs on a généralement joint les adjectifs
substantivés aux adjectifs  :vide («  le vide  », emploi dit neutre) aussi bien que
mourant ~«  un mourant  »), ce qui est déjà plus contestable, surtout pour le
remier e ces deux cas. Enfin on a intégré au verbe des infinitifs substantivés
coucher de soleil, paz exemple), mais pas tous (cf. baiser, souvenir, etc.). Cette
redistribution, acceptable dans l'ensemble, a causé quelques flottements

maudit, tant adjectif que substantif, condamné (id.), rejoignent leurs verbes ;
mais pendu n'a pas été compté avec pendre, ni brûlé avec brûler (au passage,
notons un lapsus qui a rangé marchand sous marcher) ;quant au cas de mort,
substantif masculin, il a déjà été relevé.

Il est donc prudent de ne pas utiliser sans vérification les fréquences
fournies par cette partie de l'ouvrage, et de consulter de préférence la concor-
dance proprement dite, où les contextes permettent un classement immédiat.

Puisque le mot de statistique est employé à plusieurs reprises dans
l'ouvrage, exprimons un regret  :bien que les auteurs ne se soient proposé
que de livrer des matériaux bruts, n'eût-il pas été indiqué de donner un
tableau récapitulatif des fréquences et des effectifs correspondants  ? La répaz-

(~) Procédé employé dans le Frequency Dictionary of Spanish Words de Juillaad
et Rodriguez (Mouton, 1964).

126 tition par catégories grammaticales, qui est établie, fournit une indication
stylistique importante. Mais la structure quantitative du vocabulaire, classé
paz fréquence, est aussi un élément essentiel, trop souvent passé sous silence.
On peut certes l'extraire de l'un des index, mais au prix d'un travail assez
long. Ce voeu nous ramène à la question des normes du comptage. Question
irritante, certes, mais qui doit être résolue au prix de quelques conventions
simples pour ouvrir la voie aux études compazatives. Malgré les imperfec-
tions dont il ne faudrait pas exagérer l'importance, ce dépouillement intégral
et attentif d'un teste littéraire très significatif mérite d'être exploité paz de
nombreûs chercheurs, et retiendra l'attention de tous ceux qui se sont déjà
livrés aux tâches harassantes de l'analyse lexicale.

Ch. MULLER.