L’article est conçu du point de vue d’une spécialiste linguiste et lexicologue travaillant dans le domaine de la linguistique de corpus anglaise ; il s’appuie sur son expérience de mise au point de systèmes automatisés de repérage de configurations lexicales au sein de l’Unité de recherche et développement des études anglaises (connue sous le sigle anglais RDUES). Le point de départ de la réflexion est l’état de la recherche relative à la thématique de ce numéro de Neologica, « La disponibilité actuelle de très grands corpus (qui) ouvre des voies nouvelles pour l’étude de la néologie, notamment par le biais de programmes d’extraction automatique et de classification des différents néologismes » (FRAMONDE, 13 février 2015). L’étape suivante est l’identification des opportunités à saisir mais aussi des défis posés par les corpus en constante expansion connus sous le nom de Big Data. Les avantages apportés par ces gros corpus par rapport aux ressources traditionnelles seront alors analysés, ainsi que l’intérêt que l’on a à recourir aux corpus diachroniques pour le travail en néologie. Seront examinées ensuite les difficultés inhérentes aux très gros corpus, qui sont à la fois technologiques, pratiques et théoriques. La conclusion prend la forme d’une évaluation des implications de ces bouleversements pour la néologie et la linguistique de corpus telles qu’elles se pratiquent aujourd’hui.
Thème CLIL : 3147 -- SCIENCES HUMAINES ET SOCIALES, LETTRES -- Lettres et Sciences du langage -- Linguistique, Sciences du langage
ISBN :978-2-406-06279-0
EAN :9782406062790
ISSN : 2262-0354
DOI : 10.15122/isbn.978-2-406-06279-0.p.0015
Éditeur : Classiques Garnier
Mise en ligne : 25/07/2016
Périodicité : Annuelle
Langue : Anglais
Mots-clés : Néologie, Big Data, corpus diachronique