Résumé : La présente étude vise à apporter quelques lumières sur la phraséologie du roman contemporain, telle qu’attestée dans le Corpus de référence du français contemporain (CRFC) et un grand corpus de romans anglophones. Trois objectifs président à cette investigation : 1) montrer comment l’impression subjective de « littérarité » émanant d’œuvres de fiction se fonde, au moins en partie, sur l’emploi statistiquement significatif de mots et de phraséologismes hautement spécifiques ; 2) élaborer une première classification de ces séquences « littéraires » ; 3) exemplifier et contraster les séquences « littéraires » associées aux noms soleil et sun. L’analyse comprend trois étapes : 1) analyse des mots-clés ; 2) extraction de l’ensemble des bigrammes, trigrammes, quadrigrammes et pentagrammes contenus dans les corpus de romans ; 3) analyse contrastive des n-grammes et collocations associés aux mots-clés soleil et sun. Les résultats montrent que le roman d’après-guerre est caractérisé par un emploi très large de certaines catégories de mots-clés et de séquences spécifiques, telles que les n-grammes (ne pouvait détacher son regard), les motifs (pronom personnel + en + être + là + de + pronom possessif + réflexions / pensées / interrogations/… + quand / lorsque) et les collocations (le soleil déclinant).