Aller au contenu

Classiques Garnier

Comptes rendus

  • Type de publication : Article de revue
  • Revue : Cahiers de lexicologie
    1965 – 2, n° 7
    . varia
  • Auteur : Muller (Ch.)
  • Pages : 119 à 124
  • Réimpression de l’édition de : 1965
  • Revue : Cahiers de lexicologie
  • Thème CLIL : 3147 -- SCIENCES HUMAINES ET SOCIALES, LETTRES -- Lettres et Sciences du langage -- Linguistique, Sciences du langage
  • EAN : 9782812442605
  • ISBN : 978-2-8124-4260-5
  • ISSN : 2262-0346
  • DOI : 10.15122/isbn.978-2-8124-4260-5.p.0121
  • Éditeur : Classiques Garnier
  • Mise en ligne : 09/11/2012
  • Périodicité : Semestrielle
  • Langue : Français
121
COMPTES RENDUS



BAUDELAIRE, Les Fleurs du Mal. Concordances, index et relevés statistiques

établis d'après l'édition Crépet-Blin paz le Centre d'Etude du Voca- bulaire français de la Faculté des Lettres de Besançon, avec la collabora- tion de K. Menemencioglu, 1 vol. br., 21 X 27, 246 p., 28 francs. Paris, s. d. (1965) Ed. Larousse.
On pourrait se contenter de quelques lignes pour signaler cette publi- cation ; il suffirait d'attirer l'attention de ceux qui s'intéressent à Baudelaire, ou plus généralement au langage poétique, sur ce relevé lexical complet du texte et de ses vaziantes  :chacun des mots qui y figurent étant remis à sa place alphabétique et suivi de tous les vers qui le contiennent, un coup d'oeil donne une première mesure de ses emplois, de ses valeurs et des associations qu'il peut créer  ; on citerait aisément quelques exemples suggestifs  ; on signalerait les tableaux récapitulatifs, qui à la fin du volume regroupent cer- taines données numériques ; et il ne resterait qu'à se féliciter une fois de plus de l'heureuse collaboration des machines, qui permet au linguiste d'épaz- gner son temps, et à souhaiter que la collection ainsi inaugurée nous propose bientôt d'autres concordances semblables.
Ce serait traiter à la légère l'énorme travail qu'a exigé cet ouvrage, et les nombreux problèmes de méthode qu'il a posés (1), justement pazce qu'il ouvre une série et qu'il engage l'avenir. Les options les plus futiles en appa- rence, dans ce cas, prennent leur importance si elles doivent être reportées sur d'autres oeuvres  ; car l'unité et la stabilité des normes est la condition première des comparaisons et des synthèses futures. C'est à ce titre que l'on doit soumettre l'ouvrage à un examen scrupuleux, et même vétilleux. Le meilleur moyen de reconnaître le travail des auteurs n'est-il pas de meure en lumière les difficultés qu'ils ont rencontrées, même si quelques-unes leur ont résisté, et d'aider à corriger les quélques imperfections de ce premier essai  ?
Notons d'abord la réussite technique, obtenue après de nombreux tâton- nements, qui permet maintenant de passer directement des listages de la tabulatrice à l'impression, par reproduction photographique  ;économie consi- dérable, qui rend plus accessibles de telles publications. Remarquons aussi que ce classement intégral des formes a été obtenu paz les seuls moyens de la mécanographie, dont la lourdeur relative est compensée par des avantages appréciables dans l'examen et le tri des formes homographes qui s'ensuit.
(t) On trouvera un reflet des travaux prépazatoires effectués à Besançon sous la direction de B. Quemada dans les numéros I, II et III du Bulletin d'Information du Laboratoire d'analyse lexicologique (Besançon, i96o).
122 Les opérations commencent, on le sait (a), paz l'établissement d'une bande perforée, d'où l'on tire mécaniquement un double fichier  :cartes-mots et cartes-contextes. On a pris comme unité de contexte le vers, même court, solution économique qui se révèle presque toujours très suffisante pour les identifications grammaticales, et même pour l'intelligence des sens.
Le résultat de cette première opération est un catalogue des formes (3), accompagnées de leurs références ; ce qui revient (comme dans les Index de Besançon) à réunir (le) bois et (je) bois, mais à séparer cette dernière forme de (nous) buvons, comme l'on sépaze yeux de ceil. Certes, on peut s'en tenir là ; c'est ce que fit un précurseur, William T Bandy, auteur du Il~ord Index to Baudelaire's poems (ronéotypé, Madison, 1939) ~ une telle liste de formes est déjâ un outil précieux ; mais elle n'est guère utilisable sans un constant recours au texte ;car celui qui s'intéresse à l'or chez Baudelaire devra d'abord se débarrasser des références qui le mènent à la conjonction homonyme ; et l'image du ver ne sera constituée qu'après avoir rassemblé singuliers et pluriels
O vers  ! noirs compagnons sans oreille et sans yeux  !

et après avoir écarté
je te donne ces vers...
et .
Crispe ses poings vers Dieu...
L'index des formes ne devient donc un index de mots qu'après la sépa- ration des homographes et le regroupement des formes fléchies. Lourde tâche, en français plus qu'ailleurs, et à laquelle les machines participent assez peu ; elles ne peuvent que sépazer les formes homographes quand celles-ci ont été préalablement codées paz une intervention humaine
Ce codage peut se limiter aux formes ambiguës ; la plupart du temps, la catégorie grammaticale suffit our rattacher correctement à un lemme, et un code numérique d'un signe ~de o à 9) convient, si l'on ne tient pas à dis- tinguer nombres, genres, personnes, temps et modes des formes qui dépendent d'un même lemme  ; on a ainsi bois o (= substantif), singulier ou plunel, et boisa (= verbe), Ire ou ae personne du singulier ; ou bien or o et or g (= con- jonction). Reste le cas des homographes de même catégorie  : (le) voile et (la) voile, air (= as ect) et air (= atmosphère), les deux voler, (il) convient et (ils) convient, (je~ vis (de voir) et ( !e) vts (de vivre), etc. Il faut ici introduire des discriminants non grammaticaux.
Mais on peut aussi coder tous les mots du texte, ce qui prépaze des comp- tages paz catégorie grammaticale. C'est la solution adoptée pour cette concor- dance. Elle néglige toutefois les homographes sans différence de catégorie, qui ont dû être ensuite séparés «  à la main  ».Ace stade du travail interviennent les décisions, parfois embazrassantes ;ainsi on a réuni fonds singulier (cc dans mon fonds le plus ténébreux  ») et fonds, pluriel de fond («  les gouffres sans fonds  ») ; en revanche, on a codé différemment mort dans «  le mort joyeux  »
(i) Voir à ce sujet le n° I du Bulletin déjà cité, et l'exposé de B. Quemada au Col- loque de Strasbourg en 1987 (Lexicologie et lexicographie françaises et romanes, C.N.R.S., 196i, P• 53 s4q•)•
(3) Sur les index de mots et les index de formes, voir Ch. Muller. Les Indez de vocabulaire, in Bulletin des 3`eunes Romanistes, n° 4~ P• 9 sqq. (1961) et n° 8, p. 44 sqq
(1963)•
123 et «  un mort libre et joyeux  » (¢) ; on a traité comme substantif (S) la forme belle dans
A te voir marcher en cadence

Belle d'abandon...
On a réuni tous les sens de air sous une seule vedette, ce qui est défendable, mais contraire à la tradition lexicographique ; on n'a pas distingué Dieu et dieu, ce qui du reste est souvent difficile et qui a la caution de plusieurs dic- tionnaires (dont le Petit Larousse,Dieu et Satan figurent le premier dans la partie générale, le second dans la partie historique et géographique). Mais on a distingué diane et Diane.
C'est après ce codage grammatical de toutes les formes que l'on obtient l'index statistique qui occupe les pages ao3 à a25  : chaque forme y est accompa- gnée de sa fréquence et de sa « répartition  », c'est-à-dire du nombre de poèmes où elle figure. Ce recensement exclut les variantes, traitées dans un index
articulier (pp. a37-a¢¢). Notons une défaillance de la machine à la page Zo5 brisés ¢scindé en deux) et une faute de frappe à la page 223 (syllables) (6).
Pour passer de cet index statistique à la concordance, il a fallu éliminer les mots à fréquence très élevée, regrouper les formes fléchies, faire suivre chaque mot-vedette des contextes et des références.
Si la concordance était faite sans aucune élimination, elle comporterait autant de contextes, donc de vers, qu'il y a de mots dans le recueil, soit un peu plus de 30 000 ; la seule entrée a le, art. déf  », serait suivie de quelque a Soo citations, une bonne moitié des Fleurs du Mal. On pouvait, pour éviter cet encombrement bien inutile, écarter de la concordance tous les mots qui dépasseraient une certaine fréquence  :mais dans la concordance d'une autre oeuvre, la liste des éliminations serait différente ; on a donc dressé une liste de mots grammaticaux, une cinquantaine en tout, choisis à la fois d'après leur fréquence et leur faible intérêt lexicologique, et formant des séries cohé- rentes  :ainsi on écarte eux, c~ui n'appazaît que 12 fois, pazce qu'il appartient aux pronoms personnels, mais on conserve comme, quia 331 occurrences et dont les contextes occupent plus de deux pages  :quel secours pour celui qui s'intéresse aux comparaisons  !
On a regroupé les formes fléchies de façon diverse  :pour les verbes, toutes les formes, y compris les participes adjectivés, sont réunies ; au contraire les formes d'un adjectif ou d'un substantif restent distinctes  :plein, pleine, pleines et pleins fournissent quatre entrées, que l'on se contente de rapprocher si elles ne se suivent pas dans l'ordre alphabétique  ; ainsi yeux vient se placer après aril, et rêves n'est plus séparé, de rêve, comme clans l'index statistique, par réveil, revenir, rêver, etc. Quelques oublis cependant dans ce regroupe- ment  :travaux est sépazé de travail par travailler et travailleur; fol et folles n'ont pas rejoint fou ; vieux, vieil, vieille, etc. sont dispersés. D'autre part on a réuni, sans doute pour gagner de la place, des formes codées différemment comme mort masc. et mort fém.
(4) Les deux pdche, tous deux substantifs féminins, ont été correctement distingués, ainsi que tour masculin et tour féminin
(S) J'hésite aussi à considérer comme une forme du verbe suivre a ... un beau vaisseau qui prend le lazge, chazgé de toile, et va roulant suivant un rythme doux, et paresseux, et lent  ».
(6) Autre indication pour un erratum  : le vers « Que d'ignobles bourreaux plan- taient dans tes chairs vives n comporte une faute de frappe (qui pour que) qui n'a été rectifiée que dans une seule des citations.
124 Le point le plus contestable me semble être le traitement des participes. Je sais que c'est là le chapitre le plus désespérant de la casuistique lexico- graphique, mais j'ai peine à approuver la solution adoptée ici. Lors du codage, on avait distingué trois cas
— forme impersonnelle de verbe code 3 — adjectif qualificatif ou participe passé employé sans
auxiliaire code 4
— substantif code o
Le classement des formes en -ant dans ces trois catégories ne crée guère de difficultés ;elles sont codées 3 quand elles sont précédées de en (gérondif ), quand elles sont senties comme invariables, quand elles sont transitives ; elles sont chiffrées ¢quand elles sont vaziables ou senties comme variables. Cela ne soulève aucune objection. Mais dans l'établissement de la concor- dance, on a rangé le tout à la suite du verbe, alors qu'en général on considère que charmant, plaisant, languissant, triomphant, etc. sont des unités lexicales devenues indépendantes. Mais le plus déroutant est que lorsque le verbe correspondant n'appazaît pas sous d'autres formes clam le recueil, ces mots retombent au niveau des adjectifs. Ainsi triomphant, triomphante et triomphants donnent trois entrées, alors que languissants et languissante sont réunis sous languir; il est évident que dans la concordance d'une oeuvre où triompher serait présent et où manquerait languir, le classement de ces adjectifs serait différent. Or, c'est là un des effets d'une norme constante  :chaque forme doit venir se classer dans une case lexicale préétablie ; idéal difficile à concilier avec une linguistique rigoureuse, certes ;mais dans un état de langue donné, la norme ne devrait pas dépendre des contingences du texte analysé.
Pour le participe présent, le problème est du reste simple, et les contextes ambigus sont très razes. On n'en dira pas autant du pamcipe passé, qui offre des difficultés quasi insolubles. Le critère de l'auxiliaire me pazaît sans grande valeur. Je ne vois pas de différence lexicale entre
Il est tombé dans cette geôle
Andromaque, des bras d'un grand époux tombée La Cloche fêlée (titre)
Moi, mon âme est fêlée
Pas plus, à mon compte, qu'on ne serait fondé à classer différemment «  le ciel pur  » et « l'air est pur  ».
Il y a certes des participes que leur adjectivation a détachés du verbe parent  :tels sacré, interdit, étourdi, parfait..., etc. Mais le fait est révélé paz des critères sémantiques, forcément subjectifs, et de force très inégale suivant les contextes ; il est assez raze qu'ils soient corroborés paz des faits de position (un parfait amant). On n'a donc aucune peine à reconnaître qu'il existe un participe adoré et un adjectif adoré; mais dans une bonne partie des contextes, il est difficile ou impossible de dire auquel des deux on a à faire ; or, si le lexicographe peut sélectionner ses citations et écarter les cas douteux, le statisticien doit classer tous les cas. Aussi ne peut-on reprocher aux auteurs de la concordance d'avoir indifféremment reclassé sous les verbes toutes les formes de participes passés, à l'exception de quelques cas du type sacré. Tout au plus jugera-t-on imprudent le classement d'interdit, codé comme verbe dans .
... des péchés qui t'ont interdit le tombeau

et .
ni entre et .
125 COMPTES RENDUS I23 et comme adjectif dans  :
... d'un gouffre interdit à nos sondes.
Mais dont les deux occurrences sont ensuite réunies sous une vedette d'adjectif :

Ces détails de classement, du reste, ne nuisent aucunement à l'usage normal de la concordance, qui est la lecture synthétique de contextes ayant un mot en commun L'essentiel est que les regroupements soient correctement faits lors des relevés récapitulatifs, cequi est le cas (sauf peut-être pour fol, oublié p. 230). Ils ne prendraient quelque importance que si l'on devait établir des concordances plus étendues ou très nombreuses et compazer entre eux les données de divers textes. Mais la chose aurait-elle un sens si ces textes n'appaz- tiennent pas à un même état de langue  ?
Le volume contient également un index statistique des Soo mots les plus fréquents. Cette fois il ne s'agit plus de formes, mais bien d'unités lexicales englobant leurs variantes morphologiques, avec indication, pour chacune de ces vaziantes, de sa fréquence et de sa répartition. Seuls entrent dans ce relevé les mots de la concordance, à l'exclusion des mots grammaticaux éliminés de celle-ci. Son point de départ n'est donc créé ni par une fréquence déterminée, ni par un rang dans l'échelle des fréquences, ni (comme chez Pierre Guiraud) paz une limite plus ou moins conventionnelle entre mots pleins et mots-outils. Son point final est assez azbitraire ; à fréquence égale, les mots sont classés alphabétiquement ; or le Soo~ est l'adjectif tendre, qui a la fréquence ~  ; il laisse donc passer devant lui tous les mots de fréquence 7 qut le précèdent dans l'alphabet, mais non ceux qui le suivent  :triomphant, ville et bien d'autres sont ainsi écartés de ce palmazès pour une raison toute for- melle. Il fallait évidemment ici appliquer la règle des ex-crquo dans les con- cours (~), et pousser la liste jusqu'à la fin de la fréquence ~.
Cette partie, d'ailleurs, cache quelques autres erreurs. ll semble qu'on ait voulu ica procéder à une autre distribution des formes nominales du verbe. Ainsi les participes présents adjectivés sont traités à part du verbe  :vivre d'une part, vivant de l'autre  ; les participes passés, adjectivés ou non, y sont au contraire joints (cf, par exemple cormu, damné, tombé, etc.) ; cela semble parfaitement justifié. Mais paz ailleurs on a généralement joint les adjectifs substantivés aux adjectifs  :vide («  le vide  », emploi dit neutre) aussi bien que mourant ~«  un mourant  »), ce qui est déjà plus contestable, surtout pour le remier e ces deux cas. Enfin on a intégré au verbe des infinitifs substantivés coucher de soleil, paz exemple), mais pas tous (cf. baiser, souvenir, etc.). Cette redistribution, acceptable dans l'ensemble, a causé quelques flottements
maudit, tant adjectif que substantif, condamné (id.), rejoignent leurs verbes ; mais pendu n'a pas été compté avec pendre, ni brûlé avec brûler (au passage, notons un lapsus qui a rangé marchand sous marcher) ;quant au cas de mort, substantif masculin, il a déjà été relevé.
Il est donc prudent de ne pas utiliser sans vérification les fréquences fournies par cette partie de l'ouvrage, et de consulter de préférence la concor- dance proprement dite, où les contextes permettent un classement immédiat.
Puisque le mot de statistique est employé à plusieurs reprises dans l'ouvrage, exprimons un regret  :bien que les auteurs ne se soient proposé que de livrer des matériaux bruts, n'eût-il pas été indiqué de donner un tableau récapitulatif des fréquences et des effectifs correspondants  ? La répaz-
(~) Procédé employé dans le Frequency Dictionary of Spanish Words de Juillaad et Rodriguez (Mouton, 1964).
126 tition par catégories grammaticales, qui est établie, fournit une indication stylistique importante. Mais la structure quantitative du vocabulaire, classé paz fréquence, est aussi un élément essentiel, trop souvent passé sous silence. On peut certes l'extraire de l'un des index, mais au prix d'un travail assez long. Ce voeu nous ramène à la question des normes du comptage. Question irritante, certes, mais qui doit être résolue au prix de quelques conventions simples pour ouvrir la voie aux études compazatives. Malgré les imperfec- tions dont il ne faudrait pas exagérer l'importance, ce dépouillement intégral et attentif d'un teste littéraire très significatif mérite d'être exploité paz de nombreûs chercheurs, et retiendra l'attention de tous ceux qui se sont déjà livrés aux tâches harassantes de l'analyse lexicale.
Ch. MULLER.