Aller au contenu

Classiques Garnier

Introduction à la première partie

21

Introduction
à la première partie

Cette partie de notre étude est consacrée à lanalyse des prérequis pour la constitution de notre outil dalignement, à lexplication détaillée de son fonctionnement, et aux améliorations possibles dans un futur proche.

Pour parvenir à nos résultats, nous avons eu recours à de nombreuses techniques héritées du traitement automatique de la langue (TAL), et notamment de la traduction automatique. Létude de lhistoire de la traduction automatique a orienté nos choix dans les algorithmes que nous avons développés, et nous avons dû tester de nombreux logiciels de traitement automatique de la langue avant de les implémenter dans notre programme, intitulé Odysseus. Odysseus est un aligneur automatique basé sur les techniques dalignements de séquences employées par la bio-informatique. Il permet daligner des séquences sémantiques équivalentes entre elles. Pour ce faire, Odysseus calcule la proximité sémantique de chaque séquence, notamment en utilisant les techniques de vectorisation sémantique. Une fois que les séquences sont alignées, Odysseus permet de comparer statistiquement et syntaxiquement chaque séquence de chaque texte.