Résumé : Notre travail de recherche s’inscrit dans une perspective élargie du domaine de la phraséologie (Legallois et Tutin 2013). Cet article traite des séquences polylexicales à fonction discursive, éléments apparaissant dans différents genres mais particulièrement fréquents dans les corpus d’écrits scientifiques. L’acquisition de ces unités lexicales s’avère selon nous indispensable pour aider les étudiants allophones à construire un discours cohérent. Ayant pour objectif final de mettre en place un dispositif d’aide à l’écriture scientifique, cette contribution présente une typologie des marqueurs polylexicaux établie sur des critères fonctionnels et un modèle d’analyse linguistique adaptées aux outils du TAL et à d’autres activités didactiques. Dans cette étude, les analyses linguistiques serviront à nourrir les réflexions didactiques.