Aller au contenu

Classiques Garnier

Recherches digitales et production des données, bouleversement des épreuves pour le chercheur en SIC

  • Type de publication : Article de revue
  • Revue : Études digitales
    2018 – 2, n° 6
    . Religiosité technologique, II
  • Auteurs : Cormerais (Franck), Lakel (Amar)
  • Résumé : Après avoir interrogé la place de la technoscience dans la rénovation des SIC et la nécessité d’une politique de formation d’un nouveau lettré digital, il convient de souligner les « épreuves » que rencontre la recherche en SHS à l’heure des humanités numériques. Notamment en termes d’accessibilité des données de la recherche. Il faut interroger la place grandissante de l’outillage algorithmique envisager la remise en cause de la figure de l’auteur par des agencements pluridisciplinaires.
  • Pages : 155 à 179
  • Revue : Études digitales
  • Thème CLIL : 3157 -- SCIENCES HUMAINES ET SOCIALES, LETTRES -- Lettres et Sciences du langage -- Sciences de l'information et de la communication
  • EAN : 9782406095637
  • ISBN : 978-2-406-09563-7
  • ISSN : 2497-1650
  • DOI : 10.15122/isbn.978-2-406-09563-7.p.0155
  • Éditeur : Classiques Garnier
  • Mise en ligne : 15/10/2019
  • Périodicité : Semestrielle
  • Langue : Français
  • Mots-clés : Technoscience, lettré digital, formation, humanités numériques, pluridisciplinarité
155

Recherches digitales et production
des données, bouleversement
des épreuves pour le chercheur en SIC

Entre les données désirables et les données accessibles, entre les recommandations idéales, théoriques et méthodologiques faites et les conceptions de chacun, il existe une notable différence.

R. Estivals, Les sciences de lécrit, 1993, p. 6.

Introduction

Le « tournant digital » de la société est désormais une évidence même si sa définition fait encore débat dans les milieux académiques. À tout le moins, il est possible de dire que les technologies qui y sont impliquées permettent une explosion, dinterfaces interconnectées à des systèmes dinformation globaux. Un ensemble, chaque jour plus important, de phénomènes est médiatisé par des interfaces qui fonctionnent comme des dispositifs signifiants enregistrant des données (data). Des millions de traces sont, chaque seconde, stockées dans des bases de données et dans des serveurs de fichiers. Ordinateurs, tablettes, smartphones, caméras, objets mobiles sont un essaim de capteurs au service dune production darchives qui échappent à toute forme de régulation. Les sciences humaines et sociales ont été dans ce contexte, elles aussi, touchées par la digitalisation des traces et toute la valorisation de la donnée. Le passage du mémorisable au prédictif ouvre sur des enjeux économiques, politiques et scientifiques qui reconfigurent profondément la structure des actants dans la production de savoir.

156

Cet article propose une contribution critique du « tournant digital » des SIC. Comment un régime neuf de la trace engendre-t-il un remaniement profond du document entendu comme source du savoir ? Comment cette numérisation du signe fait-elle entrer lalgorithme dans un outillage du chercheur ? Comment cette masse de traces, produites parfois en temps réel, redessine les collaborations scientifiques, voire remet au goût du jour une inter ou transdisciplinarité ? Notre terrain critique est laboutissement de deux projets de recherche innovants en sciences de linformation et de la communication et en sociologie qui semblent dessiner une prise de position pratique « commune ». Ces travaux viennent éclairer les changements majeurs à lœuvre dans la recherche en communication numérique1. À travers létude critique de ces réalisations scientifiques récentes, engageant des méthodes digitales issues tant des SHS que de linformatique et du monde professionnel, nous interrogeons cette nouvelle économie scientifique en trois moments dans la volonté de dégager les nouvelles pratiques opérationnelles en humanités digitales et numériques.

Dans un premier temps, les datafications des corpus et les données massives ouvrent un champ de pratiques hybrides en mutation. Nous voulons souligner les dynamiques induites par une économie numérique du document, où le mémorisable devient une source de revenus et donc de pouvoir. Dans un second temps, nous abordons le passage entre data et corpus engageant les recherches algorithmiques dans un processus de signifiance qui tente de dépasser les oppositions traditionnelles entre « quanti » et « quali ». Enfin, dans une troisième partie, il apparaît que les enjeux des études digitales rendent nécessaire une interrogation sur le statut et lautonomie des agencements de chercheurs dans la perspective dun questionnement et dun dialogue entre les disciplines.

157

Le document digital et les données :
lépreuve de laccès aux données

Les problèmes documentaires renvoient à une histoire du document qui redistribue les relations entre la mémoire et loubli, le visible et linvisible2. Avec le digital, la documentologie comme science du document3 connaît une nouvelle étape de problématisation au sein des SIC quil nous faut expliciter afin de mieux éclaircir les enjeux de la recherche dans le domaine. Trois points peuvent être successivement évoqués pour en décrire la dynamique : le témoignage, laccessibilité et linterconnexion. Ces trois « épreuves » du document numérique permettent de mieux saisir les voies de la documentologie de notre temps en ce quelles redéfinissent lépistémè des savoirs numériques.

Le défi de lhétérogénéité des données massive
face à l
information et à la connaissance

Séries binaires enregistrées en bases de données, fichiers numériques, codes informatiques : cette pluralité de formats liée à la convergence des régimes documentaires apparaît comme la première épreuve du chercheur en SHS. Les dispositifs digitaux sont la source dune production de documents très hétérogènes, constitués de couches multiples et imbriquées de traitements, qui viennent bousculer les techniques traditionnelles de lenquête4. Notons dabord lexistence de limmense corpus possible en temps réel des conversations5 auquel il faut ajouter les formes variées de léditorialité numérique6 qui sont autant de traces des échanges. Ajoutons à cela que ces traces sont de plus en plus hétérogènes 158dans leurs formats. Image, vidéo et son, par leur massification dans les échanges intersubjectifs, interrogent la place des méthodes visuelles en SHS face à des corpus de plus en plus multimédias. Il faut adjoindre à cela lensemble des documents produits par des captations de comportements (caméras, téléphones mobiles, capteurs autonomes, objets connectés, etc.) qui engendrent une surveillance généralisée dans un quantify self plus ou moins volontaire7. Ces captations numériques ont pu paraître comme une promesse dun témoignage généralisé dont les sciences seraient lun des bénéficiaires (loin derrière lindustrie de lattention). Mais pour chacun de ces systèmes sociotechniques, la première des prudences scientifiques nest-elle pas dinterroger lécart entre lusage et ses traces ?

La production des données est en réalité le symptôme dune extension indéfinie de la captation du monde dont le « ghost » numérique nest quun sous-ensemble8. Derrière les données se pose le problème de la capacité de la signifiance compris comme processus interprétatif qui mélange une culture matérielle et une culture logicielle9. Si linformation est le résultat dune trace au service dune intention, il faut en conclure que les données impliquent toujours un traitement vu comme processus de signifiance problématique10. Cest donc à une volonté de savoir que la data doit être assignée pour assurer la production dune connaissance à partir de linformation. La promesse de la data science réside dans un découplement entre collecte a priori généralisée du monde et problématisation de lenquêteur finie et a posteriori. Mais la multiplicité des rationalités de la captation11 implique, comme préalable à la connaissance, la construction dun cadre de « traduction » où les traces accessibles émergent comme première étape de la signifiance.

Nous faisons désormais face à un territoire de la donnée si vaste quil transforme chaque chercheur en archéologue (cest-à-dire aussi en géologue). Le chercheur dans les humanités digitales va devoir puiser 159dans la tradition archivistique des sciences historiques pour élaborer son nouvel éthos. Cependant, il nest plus dans un terrain fait de raretés enfouies dans une terre familière (quelle soit de glaise ou de papiers), mais, au contraire, face à des signes numériques abondants, toujours traces secondes dun monde familier disparut. Un terrain médiatisé par de fortes compétences numériques qui nécessite, pour le scientifique, un outillage de traitement de la data non encore stabilisé. Ce bouillonnement dinnovations continues (et dont lintelligence artificielle pointe un voyage vers linconnu) ouvre un nouvel horizon dépreuves pour nos disciplines12 si elles veulent sengager dans la compréhension des mondes massivement captés.

Laccès à des données structurées :
de l
open access à lopen science

Si la complexité de la donnée est une épreuve a priori nécessaire au processus de savoir, la question de laccessibilité des données et des documents apparaît, donc, comme la seconde épreuve des humanités digitales13. Laccès à ces données pose des limites matérielles qui sont autant de révélateurs de la reconfiguration des jeux dacteurs dans léconomie des savoirs. Le caractère globalement privé de la propriété des données est le premier frein à la production du savoir. La confidentialité, le respect de la vie privée et la nécessaire anonymisation apparaissent comme le second frein à leur utilisation. Enfin, la question encore délicate de lusage de ces données a posteriori à des fins de recherche et du consentement du sujet pose un troisième frein non pas tant juridique quéthique14. Alors même que la signifiance de la data dans un processus de recherche simpose comme une question délicate, il faut aussi construire les conditions daccessibilité des données pour fabriquer des corpus constitués à des fins de recherche15.

160

Plusieurs possibilités soffrent au chercheur qui voudrait sengager dans les études digitales. La première voie que peut prendre le chercheur est dactualiser les pratiques denquête en se dotant des nouveaux outils numériques de captation. Si lenquête en ligne est dores et déjà devenue un classique, lexpérience récente de lANR Algopol16, visant à construire un capteur des données des profils Facebook des utilisateurs, a montré la capacité dinnovation des nouvelles méthodes digitales en matière denquête sur les réseaux sociaux. Le Projet My Web Intelligence17 qui vise à développer un outil dabsorption et de gestion dun corpus web ouvert et hétérogène élargit la logique de la démarche à lensemble de léditorialité publique en ligne en captant les expressions hétérogènes du web en un corpus centralisé directement utile à la recherche.

La seconde voie daccès des données vise à contractualiser (de façon pécuniaire ou pas) avec les détenteurs de ces ressources leur usage au service de problématiques de recherche. Lenjeu ici étant de connaître la nature et la structure de ces données comme condition de réalisation des projets de recherche et de pouvoir formaliser les contrats de collaboration public-privé dans un champ peu habitué à voir les entreprises devenir des acteurs de la connaissance18. Facebook, à linstar de tous les géants du web, a développé un programme académique de collaboration avec la recherche au sein de sa division Facebook Research qui a tout dune politique de recherche19. Mais doit-on laisser aux seuls géants du web linitiative dune telle ouverture aux données et aux traitements ? Ny-at-il pas en la matière une véritable politique publique dans le soutien à louverture des données au service de la recherche qui serait appuyé par le cadre législatif ? Où en est-on des projets darchivage public du web20 ?

161

La troisième voie enfin, initiée par le mouvement de lOpen Data search21, est celle dun partage ouvert des données de la recherche en SHS afin de constituer des corpus communs et réutilisables22. Les enjeux de normalisation et de développement en cours ouvrent peut-être un nouveau moment pour laccessibilité des données à des fins scientifiques. Cette voie déboucherait alors sur une rencontre des disciplines23. LInstitut pour les Sciences Sociales Quantitatives (IQSS) de lUniversité de Harvard, à lorigine du projet Dataverse auquel participent déjà de nombreux laboratoires européens, est un des pionniers en la matière24.

Lenjeu dune interconnexion
des données vers des archives ouvertes

Une des questions majeures de laccessibilité des données pour la recherche repose sur linterconnexion25. En effet, au-delà des banques de données de la recherche, une accumulation de la connaissance est possible si des corpus répartis ont la possibilité de sinterconnecter par des architectures et des nomenclatures communes. La TEI est aujourdhui un des projets les plus aboutis dans la réflexion dun (ré)encodage commun à des corpus dhumanités numériques26. Dans ce cas, ce qui relie les enquêtes singulières serait une même définition de lindividu. Une sorte de métacodage dun comportement (léditorialisation numérique 162par exemple) permettrait de normaliser collaborativement les corpus de recherche et leur constitution dans le but dune mise en commun. Une autre piste sappuie sur les corpus partagés permettant des collaborations qui permettent à plusieurs projets de recherche de travailler sur une population dindividus (au sens statistique) commune, mais en variant les protocoles de recherche. Cette voie « additive » consisterait à cumuler, deux ou plusieurs études ayant en commun les individus de lenquête (lactant ou les phénomènes). Sur le modèle des études en cohorte, cette approche multiplierait les regards sur un actant ou sur des phénomènes. Enfin, une troisième piste, encore plus intégrative, vise à étudier plusieurs itérations dun même protocole de recherche faite sur des populations aux définitions plus ou moins similaires (avec au minimum une constante différenciante) dans une approche comparative. Cette conduite considère que chaque enquête forme une variation à lintérieur dune enquête globale reposant sur des objets communs. En tout état de cause, ces formes dinterconnexions nécessitent une volonté de normalisation et des standards favorisant linteropérabilité des données.

Dans les mondes du digital, linteropérabilité est la question fondamentale depuis lorigine. Sur ce modèle, linteropérabilité des recherches en SHS pourrait vite devenir un enjeu crucial. Dans le cadre du projet My Web intelligence, la possibilité de partager un même corpus de pages web caractérisées par une nomenclature centrale, mais ouverte à la construction de formulaires de qualifications spécifiques à chaque recherche est un enjeu majeur des développements à venir. Une même population de pages peut être sujette à des qualifications, des analyses et des interprétations diverses, voire concurrentes. Le problème des dispositifs à venir est bien celui dune invention dun dialogue réglé entre les disciplines autour dun corpus partagé27. Autour de lacte de communication dune part et de son enregistrement, dautre part, des objets communs pourraient permettre détablir les fondements dun travail collectif critique. Le document et larchive normalisée deviendraient alors la plateforme dune science partagée.

163

La signifiance algorithmique
au service de la recherche

Si lon définit la signifiance comme le procès dun travail sur la donnée qui la fait passer de linformation à la connaissance, force est de constater la nécessité dun cadre théorique qui repose sur le lien entre supports, signes, et information28. Toute lalgorithmisation à la source du document numérique29 subit des recadrages multiples dans le processus de recherche en humanités digitales. Les activités denrichissement, de modélisation et de contextualisation par les algorithmes sont une nouvelle série dépreuves nécessaires au développement du « tournant digital » qui doit fonder les nouvelles compétences du chercheur en SHS.

Lenrichissement des données ou le recodage

Lactivité de recherche traditionnelle traite très rarement des données premières ; elles lui sont souvent fournies. Aussi, il faut un long travail de nettoyage et de recodage de ces données en formes secondes pour pouvoir répondre à une problématique. Et cest précisément dans ce champ que le traitement algorithmique a connu ses innovations les plus remarquées. Extraire des données complexes des items utiles, par un processus de requalification des données grâce à des outils numériques, nest pas un phénomène récent. Mais nous constatons un flux dinnovation (plus par diffusion que par invention) rendu nécessaire par lépreuve de gérer de grandes masses de données. Ces innovations par la multiplication doutils de recherche ne cessent dinterpeller le chercheur en humanités digitales au point de remettre en cause son portefeuille de compétences. Lopération dannotation repose sur une grande diversité de méthodes pouvant fonder une science de lécrit autour dune herméneutique révisée. Lanalyse stylistique des textes, la classification thématique automatique, la lemmatisation des paragraphes, la détection des noms propres, des lieux et places, la classification affective… ne sont 164que les prémices dun traitement automatique du texte (ou de la langue) en vue dune problématique de classification assistée par ordinateur30.

Le traitement des corpus dimages ou de vidéos numérisées connaît également des évolutions significatives. Les recherches avancées en analyse dimage, notamment sous limpulsion de Google (Google Vision Analysis) et Amazon (Amazon rekognition), permettent la reconnaissance faciale, la localisation géographique, lanalyse des pratiques (comme dans la recherche dimages pornographiques), la présence dobjets grâce à des algorithmes didentification issus de la recherche en intelligence artificielle31. Enfin, la détection des empreintes audio permet aujourdhui une transcription en texte, une identification de la voix, des contenus similaires, etc. Dans les sciences historiques, la transcription des manuscrits scripturaires en textes numérisés a été un des moteurs de linnovation dans le mouvement de la reconnaissance dimage en SHS32.

Cette activité de recodage forme lactivité essentielle dune science de lécriture. Nous avons ici les bases dune ingénierie des connaissances dont les orientations peuvent être mises au service dun renouveau du programme de formation en humanités digitales33 en permettant effectivement de travailler sur de très grands corpus à faible coût. Il ne sagit pas ici de plonger dans une « passion algorithmique », mais bien de sengager dans un processus dinnovation mesuré et prudent remettant en cause les frontières entre qualitatifs et quantitatifs34. Les nouvelles formes dopérationnalité des hypothèses, difficiles à mettre en œuvre jusque-là, ouvriront par là même de nouvelles formes de problématisation dans un cercle dynamique et créatif.

165

La modélisation des algorithmes :
régression, classification et clusterisation

La fonction des algorithmes laide à linterprétation des données par un principe dautomatisation en étudiant les corrélations statistiques entre les variables. Cette activité forme un des éléments avantageux de la recherche. Limplémentation récente des logiciels prédictifs (que nous préférons appeler « interprétatifs ») en briques logicielles permet lanalyse des relations entre plusieurs variables afin de les classer et de les lier en des catégories. Dans ce foisonnement dinnovation, il existe trois groupes dalgorithmes qui sont présentés dans le tableau suivant :

objectif

Algorithme de régression

modéliser en équation la relation dune variable avec plusieurs variables sur la base de leur variabilité concomitante

Algorithme de classification

établir une relation statistique sur la base des coprésences de modalités de variables entre les réponses à certaines questions et la réponse à une question précise en analysant le poids de chacune des relations explicatives

Algorithmes de clustering

Ranger les réponses à une série de variables en structures récurrentes afin de faire apparaître des régularités entre les réponses dune enquête sous forme de typologie formelle ou « profil »

Tab. 1 – « Typologie des algorithmes interprétatifs ».

Le progrès de la recherche en intelligence artificielle dans le traitement des variables permet aujourdhui de travailler avec une immense quantité de réponses sur de nombreuses dimensions (nombre de variables très grand). Les langages open source comme R ou Python en facilitent lusage à condition que la communauté des chercheurs puisse accéder à des formations adéquates. Il ne sagit pas ici de transformer chaque chercheur en SHS en informaticien, mais de le doter dune culture suffisamment solide pour en faire un utilisateur plus ou moins engagé dans lusage de ces algorithmes. Les critiques se sont basées plus sur les 166limites dune idéologie messianique que sur une véritable évaluation de leurs usages35. Mais lémergence des chercheurs en humanités digitales permet de pouvoir appréhender leur emploi dune façon plus constructive. Les recherches récentes en SIC et en sociologie du web ont montré la pertinence de ces algorithmes. Dans létude de lANR Algopol, citée précédemment, lutilisation du K-Mean, un algorithme de clusterisation, a permis de dégager une typologie comportementale de léditorialité sur Facebook très riche en informations36. Plus généralement, la massification des données numériques rend nécessaire ces outils pour en tirer une classification préalable à lexploration assistée.

La contextualisation structurale des documents :
des relations réelles aux relations logiques

Avec lapparition des études digitales, lhypertexte fut mis à lhonneur dans la littérature grise de SHS. La nature interreliée des documents renvoyait à la tradition bibliologique détude de la citation qui puise ses sources dans la scientométrie. Le document est contextualisé, tant en matière sémiotique quau niveau sémantique, par des relations qui le « situent » à lintérieur dun corpus. Au tournant des années 90, le réseau est devenu une figure à la fois paradigmatique et heuristique de la société37. Lexplosion du web a nourri limpérieuse nécessité de le mettre au goût du jour. Depuis 2009, des logiciels comme Gephi des frères Jacomy ont fait sortir de la confidentialité, en France, les méthodes en analyse structurale des réseaux. Ce logiciel lui-même est le résultat dun engouement majeur, outre-Atlantique, pour des méthodes opérationnelles danalyse des réseaux.

Si les cartographies de liens ont régulièrement impacté les démarches scientifiques, cest souvent au détriment dune véritable analyse de réseaux. À la base, il sagit dune structure en double enquête sur, dune part, une population dindividus et dautre part sur un relevé de leurs relations (des pages et leurs hyperliens, des entreprises et leurs transactions, des individus et leurs interactions). Lanalyse dun réseau est une méthode statistique qui développe des algorithmes pour traiter les liens de chaque nœud, afin 167de décrire sa structure. Ces algorithmes sont de deux natures : ceux qui informent sur le réseau dans une perspective holiste et comparatiste, ceux qui informent sur la place du nœud dans un réseau donné. Les sciences de linformation et de la communication utilisent ces méthodes notamment dans la réflexion quelles portent sur lhypertextualité38. En étudiant les pages web traitant des humanités numériques et digitales, lanalyse holiste du réseau a permis dappréhender la structure dune communauté savante et les facteurs pesant sur la socialisation des auteurs39. Létude de lANR Algopol est encore plus emblématique, car elle couple lusage dun algorithme interprétatif pour comprendre les comportements et une analyse des réseaux pour situer les acteurs40.

Un horizon des réseaux de chercheurs
est-il possible ?

La tradition des SHS depuis la fin du 19e siècle fut souvent le résultat dune recherche personnelle originale pouvant, seulement ensuite, faire « école » en empruntant des canaux particuliers (revues, sociétés savantes, congrès, etc.). Pour autant, nous avons vu que face à larchitectonique digitale, la somme des compétences et des techniques en jeu ne permettait plus le travail dun seul41. Cette situation est-elle en passe de changer ? Sommes-nous, face aux enjeux de la donnée et de la méthode digitale, en présence dune injonction du collectif de recherche en SHS, seul garant dun développement « contrôlé42 ».

168

Mathématiques, Informatique
et SHS autour d
un enjeu partagé : comprendre lhumain

La dernière épreuve des humanités digitales est dordre social. Si les informaticiens et les statisticiens ont leurs propres préoccupations, ces trois dernières décennies, les sciences (et les écoles) de lingénieur ont su faire émerger une approche hybride orientée vers la résolution de problèmes. Comprendre lhumain a toujours été une préoccupation dune partie des chercheurs en sciences informatiques et mathématiques. De la cybernétique au cognitivisme, ces chercheurs nous ont montré la capacité des mathématiques et de linformatique à penser lhumain et la société. Franck Rebillard43 nous rappelle quencore récemment, avant même lémergence des digital methods, ce sont bien les informaticiens et les mathématiciens qui se sont engagés à transformer les champs détudes des SHS. Avons-nous encore les moyens de retarder cette alliance des compétences aux risques de léchec de nos projets dhumanités numériques44 ? Sans une incitation majeure dune politique de la science engageant les ressources et les formations, a-t-on une chance dassurer le passage des débats a priori à une série de projets construisant des sciences en action ?

Pourtant comme le souligne Jean-Guy Meunier45, la modélisation scientifique révèle une très grande proximité entre les sciences quelles soient humaines ou des matériaux et du vivant. Le processus de modélisation formelle, matérielle et conceptuelle quil propose pour les humanités digitales souligne le lien entre les différentes disciplines. Lengagement du chercheur en SHS dans les processus de traduction numérique pose la question de la « distance informationnelle » médiatisée46 que le chercheur ne manquera pas davoir avec la gestion informatique de son corpus numérique. Franck Rebillard, dans la critique quil porte sur la recherche des mêmes dans un grand corpus, montre bien la limite 169dune vision purement informatique de la traduction en SHS. Le simple usage de Google dans la constitution dun corpus numérique place le chercheur dans la nécessité dinventer, voire de bricoler des voies daccès aux données qui sont autant de négociations avec une modélisation informatique dune pratique non destinée à lapproche scientifique. Une fois passés les évidents appels à la prudence scientifique, il faut bien nous engager dans la rénovation des sciences sociales47 par une pratique innovante de nouveaux agencements scientifiques.

Des formations au service du nouveau lettré du digital

La formation au code informatique connaît une longue histoire dans les institutions scolaires. Au cœur de cette politique publique, une tension très forte existe entre un discours dautonomisation des élèves et une politique déquipement et de soutien aux industriels du secteur numérique. Entre une vision de formation des citoyens à la puissance du code produisant, au cœur doutils modulables et open sources, des œuvres collaboratives et celle dun étudiant compétent dans lusage des boîtes noires des solutions ergonomiques du marché au service de son insertion professionnelle, la question de la littératie numérique48 est au cœur dune problématisation conflictuelle du rôle de la formation dans les sociétés numériques. Du Plan Informatique Pour Tous (IPT) en 1985 au C2I des universités en 2002, on a vu émerger le mythe du digital native qui na besoin que dun accompagnement professionnalisant dans une supposée maitrise des usages numériques quil aurait acquis spontanément dans une maison fortement dotée. Pourtant cette logique, entièrement soumise à la compétence professionnelle et à lemployabilité, a fait le deuil, si ce nest a enterré, la figure du lettré numérique capable de passer de la lecture à la production du sens, de lusage à la critique, de la compétence à la programmation dans un nouvel environnement de production de sens où il serait apte à interroger sa place. Compréhension, déconstruction, programmation, production des nouveaux schèmes de connaissances à lheure des dispositifs numériques nont guère avancé alors même que lon fête joyeusement la révolution internet qui a, en 2019, 30 ans.

170

Que ce soit par une approche de vulgarisation mutuelle ou dans une approche projet, nous faisons le pari que les conditions dune véritable hybridation disciplinaire se fonderont sur linnovation des programmes de formations interdisciplinaires au cœur des écoles dingénieurs et des écoles doctorales en SHS49. En relation avec la formation dun « lettré du digital50 », il est possible de décliner limportance de la formation des chercheurs en SHS autour de trois recommandations qui pourraient bien former un cadre pour les sciences de lécrit.

Recommandation no 1 : Appuyer une approche conceptuelle (interprétative et dialogique) en rapport avec une approche fonctionnelle évite le danger dun primat du « code informatique » sur le langage naturel. Linsertion du numérique au cœur des projets SHS doit être loccasion dinterroger le code informatique dans ce quil fait au processus de véridicité.

Recommandation no 2 : Favoriser les rencontres matérielles autour des algorithmes interprétatifs. Des avancées sont possibles avec des réseaux qui associent, dans lexpérimentation, les chercheurs de différentes disciplines. Larchitecture distribuée open source incarne une démarche de coopération et dalternative critique qui marche. Le développement, et le financement de prototype ouvert peuvent servir de base à cette approche critique pragmatique.

Recommandation no 3 : Passer des emplois « occultes » des technologies dans la recherche, sur un modèle de sous-traitance, à un emploi réfléchi par une maîtrise de pratiques intégrées dans un projet pensé avant tout comme un collectif basé sur des transferts de compétences et du co-apprentissage.

Au sein de luniversité, les URFIST51 peuvent jouer un rôle fondamental dans la montée en compétence des chercheurs en SHS par un travail dadaptation de leur programme de formations aux enjeux des humanités numériques. Les humanités digitales ne peuvent simaginer sans la formation de chercheurs capables de naviguer dune formalisation 171mathématique à une formalisation conceptuelle en passant par une formalisation informatique52.

Lécrit comme base dun discours commun à-venir

Nous proposons alors de chercher un langage commun à partir de lécriture qui est un objet transversal à toutes les démarches scientifiques. Les sciences de lécrit possèdent un passé qui consistait à repositionner lécriture dans la perspective de la communication : « Lécrit, mémoire objective de lécrivant est perçu, décodé, compris par lacte de lecture. La transformation de lobjet écrit en document réel, subjectivise à nouveau le message. Lacte de communication, de mise en commun se réalise. Mais cette transformation de lécrit en document introduit une nouvelle notion : linformation. Linformation, cest le contenu, le sens, la connaissance mise à lintérieur dune forme. On comprend mieux pourquoi la mémoire fixée dans le médium, devenant document, fournit une information53. » Aujourdhui, une nouvelle synthèse est nécessaire, dès lors que lacte de lecture se fait en fonction dun stock énorme de formes et de connaissances mémorisées sur les supports que sont les serveurs et les bases de données. Le processus initié par le « tournant digital » dans la communication écrite associe un circuit informationnel auquel viennent se superposer un circuit interprétatif et un circuit dialogique.

Les sciences de lécrit partent du document pour comprendre les conditions de possibilités de son existence. Production, édition, distribution et usages, les sciences de lécrit ont toujours développé un art exégétique pour reconstruire le processus complet de la communication. Avec lémergence du document électronique, de nombreux chercheurs en SHS ont su dépasser la stupéfaction sociotechnique pour réinterroger lobjet des humanités digitales à laune de ce nous appelons comme science de lécrit. De la documentarisation54 à lextension progressive du 172concept déditorialisation55, la recherche sur le document électronique montre la nécessité dappréhender le document dans toute lépaisseur de son existence56. Il sagit alors de comprendre que pour chaque document électronique il faut, sur un premier axe, interroger tout le processus de production de document tout en déclinant cette description sur un second axe, au regard dune contextualisation technologique, sémiotique, économique, sociologique et politique. Or notre thèse consiste à rappeler que cette approche est le fondement même des sciences de lécrit à lorigine de la création des Sciences de lInformation et de la Communication. Les humanités digitales seraient alors comprises comme un nouveau moment des sciences de lécrit.

Dès lorigine, cette « position » a favorisé de nouvelles alliances entre les démarches quantitatives et qualitatives. Elle permet de sorienter vers une « archi-écriture » qui rassemblerait les dimensions suivantes : paléographique, grammatologique, philologique, informatologique. Cette approche suppose un dialogue entre des méthodologies endogènes et exogènes. Cest dans ce croisement des méthodes que se trouve remis en question le blocage épistémologique suivant : « Lintroduction de la statistique dans les sciences humaines a été lune des conditions de leur essor aux 19e et 20e siècles. Néanmoins la statistique nélimine pas totalement, la subjectivité. Celle-ci intervient au départ dans les présuppositions et les hypothèses, et à larrivée, après lobservation, au niveau des interprétations57. » La différence entre sciences humaines et lapproche statistique, sans demeurer invalide, se rétrécit lorsque lalliance du logiciel et du matériel permet une plus grande facilité de la calculabilité manipulatoire. Cest de la synthèse entre une imagination créatrice et un solide usage de la statistique que 173peut naître une transdisciplinarité qui, si elle demeure à lordre du jour, est assez difficile à réaliser, car peu perméable aux habitudes institutionnelles universitaires.

Conclusion

Les sciences de linformation et de la communication connaissent, depuis 20 ans, un « digital turn » qui sexprime avec intensité dans la problématisation des humanités digitales. Face à la numérisation généralisée du quotidien, le chercheur en SHS se retrouve devant un océan de « données » qui forment un potentiel immense dans la compréhension du fait social par la communication. Pour autant, cet océan de données est tout sauf donné. Il existe des limites techniques à linteropérabilité, des limites économiques daccès à ces données, souvent propriétés privées jalousement gardées, limite symbolique du mythe de la data sans linformation. La question dune véritable politique publique de la donnée au cœur de la recherche en SHS et en SIC est à un tournant avec les initiatives dopen datas et de dataverse. Notre réflexion se veut dans un premier temps une recommandation pour embrasser la problématique de laccès aux données au service de la recherche. Doter les chercheurs doutils de récoltes et de production de la data, faciliter la contractualisation public-privé daccès aux corpus, ouvrir un vaste chantier daccès aux données publiques de la recherche interopérable. La promesse des humanités de demain passe avant tout par la question politique du statut de la donnée. La figure du « lettré digital » relève le défi, face à lépreuve quantitative, de laccès à la méthodologie algorithmique en environnement big data et à loutillage qui le rend accessible aux chercheurs en SHS. Ce lettré dun nouveau type interroge le sens assisté par ordinateur et se donne les moyens daccéder à des processus interprétatifs actuels, de les critiquer voire de les améliorer en participant à la construction de nouveaux dispositifs de véridicité dans lépistémé des humanités numériques. Enfin, nous affirmons que la dernière épreuve, qui permettra aux humanités numériques de dépasser les discours métascientifiques, consiste à faire tomber les frontières entre disciplines mathématiques, informatiques et sciences du vivant, dune part, 174et sciences humaines et sociales, dautre part. Autour de problématiques et de projets communs, des chercheurs de différents horizons sont en capacité déchanger leurs objets et leurs méthodes par un transfert de compétences. En fait, les plus grands tournants épistémologiques des SHS ne sont-ils pas souvent le fruit dune hybridation davec les sciences « dures » ? Au début du siècle, les mathématiques rencontraient les humanités pour fonder les sciences sociales (sociologie, économie et psychologie). Dans laprès-guerre, linformatique rencontrait les humanités pour fonder la systémique et le connexionnisme. Aux fondements des sciences de linformation et de la communication, on retrouve cette interdisciplinarité entre science de la quantification et science de linterprétation58. Robert Escarpit et Robert Estival, dans une « École de Bordeaux », trop vite oubliée, nous avaient enjoint dopérer la grande jonction autour des sciences de lécrit. Passé leffet de surprises, nous gageons que les humanités digitales vont [se sont déjà] sengager dans le « digital turn » en multipliant les projets pragmatiques. Cette profusion dexpérimentation est une période nécessaire à linnovation scientifique. Certains y voient lémergence dune « zone déchange » favorable à la créativité scientifique59. Les défis sont immenses, mais ils sont à léchelle des épreuves qui sannoncent pour les humanités et pour les institutions universitaires qui les défendent.

Franck Cormerais

Université Bordeaux-Montaigne

MICA (EA 4426) – Équipe E3D

Amar Lakel

Université Bordeaux-Montaigne

MICA (EA 4426) – Équipe E3D

175

Bibliographie

Akrich, M., Callon, M., & Latour, B. Sociologie de la traduction : Textes fondateurs (1re éd.). Paris : Transvalor – Presses des mines, 2006.

Bachimont B., « Nouvelles tendances applicatives. De lindexation à léditorialisation », dans Patrick Gros (dir.), Lindexation multimédia : description et recherche automatiques, Paris, Hermès Sciences., 2007.

Bachimont B., Poupeau, G., Vatant, B., Troncy, R., Gandon, F., Pouyllau, S., Zacklad, M. « Enjeux et technologies : des données au sens. » Documentaliste-Sciences de lInformation, 48(4), 24-41, 2011.

Bastard, I., Cardon, D., Charbey, R., Cointet, J. & Prieur, C. « Facebook, pour quoi faire : Configurations dactivités et structures relationnelles ». Sociologie, vol. 8,(1), 57-82, 2017.

Ben Henda, M. Adaptation normative des Big Data et du Learning Analytics. Dans : Évelyne Broudoux éd., Big Data – Open Data : Quelles valeurs ? Quels enjeux : Actes du colloque « Document numérique et société », Rabat, 2015 (p. 197-212). Louvain-la-Neuve, Belgique : De Boeck Supérieur., 2015, doi:10.3917/dbu.chron.2015.01.0197.

Ben Henda, M. & Hudrisier, H. Penser, classer, apprendre et communiquer. Normalisation et nouveaux modes de classification du savoir. Hermès, La Revue, 66(2), 2013, 160-166. https://www-cairn-info.ezproxy.u-bordeaux-montaigne.fr/revue-hermes-la-revue-2013-2-page-160.htm.

Bouchardon, S., Cailleau, I., Crozat, S., Bachimont, B., & Thibaud, H. « Explorer les possibles de lécriture multimédia », Les Enjeux de linformation et de la communication, (12/2), 2011, p. 11-24.

Boullier, D. « Les sciences sociales face aux traces du big data, Big Data traces and social sciences ». Revue française de science politique, 65(5), 2015, 805-828.

Bourdeloie, H. « Ce que le numérique fait aux sciences humaines et sociales. épistémologie, méthodes et outils en questions ». tic&société, (Vol. 7, No 2) 2014.

Boure, R. Les origines des sciences de linformation et de la communication. Regards croisés. Villeneuve-dAscq : Presses Universitaires du Septentrion 2002.

Camps, J.-B. « Homemade manuscript OCR (1) : OCRopy [Billet] », 2017. Consulté 10 septembre 2018, à ladresse https://graal.hypotheses.org/786

Cardon, D. « Dans lesprit du PageRank » Réseaux, (177), 2013, p. 63-95.

Cardon, D. À quoi rêvent les algorithmes, Paris : Le Seuil, 2015.

176

Carmes, M., & Noyer, J.-M. « Lirrésistible montée de lalgorithmique », Les Cahiers du numérique, 10(4), 2014, p. 63-102.

Cormerais Franck, « Humanités digitales et Ré/orgnanisation du savoir », in Le Deuff Olivier (sous la dir. de), Le temps des Humanités digitales, Limoges, fyp éditions, 2015.

Cormerais Franck, « Humanités digitales, transdisciplinarité et entretrextualité. Éléments pour une organisation des corpus partagés », in Carayol Valérie et Morandi Franck (sous la dir. de), Le tournant numérique des sciences humaines et sociales, Bordeaux, Maison des sciences dAquitaine, 2015, p. 55-65.

Cormerais, F., Le Deuff, O., Lakel, A., & Pucheu, D., « Les SIC à lépreuve du digital et des Humanités : des origines, des concepts, des méthodes et des outils ». Revue française des sciences de linformation et de la communication, (8), 2016.

Cormerais, F., Le Deuff, O., Lakel, A. & Pucheu, D. (). « Lécole et lavenir de la culture digitale ». Hermès, La Revue, 78,(2), 2017, 87-95.

Cormerais, Franck, & Le Deuff, Olivier., « Robert Estivals, entre bibliométrie et bibliologie, quel apport pour les SIC dans la recomposition des savoirs », dans Fondements épistémologiques et théoriques de la science de linformation-documentation (ISTE Éditions, p. 311), 2018.

Dacos, M., & Mounier, P., Humanités numériques. Institut français, 2015. Rapport consulté à ladresse https://hal.archives-ouvertes.fr/hal-01228945/document

Escarpit, R., Linformation et la communication. Théorie générale, Paris, Hachette, 1995.

Estivals, R., La Bibliologie, Presses Universitaires de France, 1987.

Estivals, R., & Meyriat, J. (Éd.),. Les sciences de lécrit : encyclopédie internationale de bibliologie. Paris, Retz, 1993.

Ferraris, M., Documentality : Why It Is Necessary to Leave Traces, New York : Fordham University Press, 2012.

Genette, G., Fiction et diction, précédé de Introduction à larchitexte. Paris, Seuil, 2004.

Hartog, F., Régimes dhistoricité : Présentisme et expériences du temps, Paris, Seuil, 2003.

Jeanneret, Y., & Souchier, E., « Lénonciation éditoriale dans les écrits décran », Communication et langages, 145(1), 2005, 3-15.

Koszowska-Nowakowska, P., & Renucci, F., « Lhypertexte : approches expérimentale et herméneutique », Les Cahiers du numérique, Vol. 7(3), 2012, 71-91.

Lakel, Amar, « Interconnexion et identités électroniques : le pouvoir denquête 177à lheure des systèmes de fichiers répartis » in Terminal, dossier spécial « Administration électronique », 2007.

Lakel, Amar, « Enjeux de la recherche digitalisée dans les humanités numériques », My Web Intelligence, 2014a. Consulté à ladresse http://mywebintelligence.net/enjeux-de-la-recherche-digitalisee-dans-les-humanites-numeriques/

Lakel, Amar, « My Web Intelligence : Un projet doutils open source au service des humanités numériques. » My Web Intelligence, 2014b. Consulté à ladresse http://mywebintelligence.net/outils-open-source-humanites-numeriques/

Lakel, A., & Le Deuff, O., « À quoi peut bien servir lanalyse du web ? », Les Cahiers du numérique, 13(3), 2016, 39-62.

Le Deuff, O., “Humanisme numérique et littératies.” Semen – Revue de sémio-linguistique des textes et discours, (34), 2012, 117-134.

Leskovec, J., Backstrom, L., & Kleinberg, J., « Meme-tracking and the dynamics of the news cycle ». In Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining – KDD 09 (p. 497). Paris, France, ACM Press, 2009.

Lucas, J.-F., « Le projet Magic Ring : expérimentation dune méthode de recueil de données quali-quantitatives dans Second Life », Tictic&société, (Vol. 7, No 2), 2014.

Massot, M.-L., Sforzini, A., & Ventresque, V., « Transcribing Michel Foucaults reading notes with the Transkribus software : test report », 2018. Consulté à ladresse https://hal.archives-ouvertes.fr/hal-01794139

Merzeau Louise, « Entre événement et document : vers lenvironnement-support », Les Cahiers de la SFSIC, Société française des sciences de linformation et de la communication, 2014, p. 230-233.

Meunier, J.-G., « Humanités numériques et modélisation scientifique », Questions de communication, (31), 2017, 19-48.

Meyriat J., « Document, documentation, documentologie ». Schéma et schématisation, 2e trimestre, no 14, 1981, p. 51-63.

Meyriat J., Miège B., « Le projet des sic : de lémergent à lirréversible (milieu des années 60-milieu des années 80 », 2002, p. 45-70, in : Boure R., Les origines des sciences de linformation et de la communication. Regards croisés, Lille, Presses universitaires du Septentrion.

Monnoyer-Smith, L. & Plantin, J.-C., « Ouvrir la boîte à outils de la recherche numérique. Trois cas de redistribution de méthodes », tic&société, 2014, (Vol. 7, No 2).

Musiani, F. et al., Quest-ce quune archive du web ? Marseille : OpenEdition Press, 2019. Consulté à ladresse http://books.openedition.org/oep/8713

Musso, P., Critique des réseaux. Paris, Presses Universitaires de France – PUF, 2003a.

178

Musso, P., Réseaux et société. Paris : Presses Universitaires de France – PUF, 2003b.

Paloque-Berges, C. & Schafer, V., « Quand la communication devient patrimoine ». Hermès, La Revue, (71), 2015, 255-261.

Poibeau, T., « Le traitement automatique des langues pour les sciences sociales, Automatic language processing for the social sciences », Réseaux, (188), 2014, 25-51.

Proulx, S., & Rueff, J., Actualité des méthodes de recherche en sciences sociales sur les pratiques informationnelles, 2018. Consulté à ladresse http://epe.lac-bac.gc.ca/100/200/300/univ_laval/centre_etudes_medias/CEM-ActualiteMethode.pdf

Pucheu, D., « Effacer linterface : Une trajectoire du design de linteraction hommemachine » Interfaces numériques, 5(2), 2016, 257-276.

Rebillard, F., « Létude des médias est-elle soluble dans linformatique et la physique ? À propos du recours aux digital methods dans lanalyse de linformation en ligne » Questions de communication, (20), 2011, 353-376.

Rebillard, F., Fackler, D., & Marty, E., « Loffre dinformations est-elle plus diversifiée sur le web quà la télévision ? », Réseaux, (176), 2012, 141-172.

Rieder, B., « Pratiques informationnelles et analyse des traces numériques : de la représentation à lintervention », Études de communication. langages, information, médiations, (35), 2010, 91-104.

Saemmer, A., « Hypertexte et narrativité ». Critique, no 819-820(8), 2015, 637-652.

Saleh, I., & Hachour, H., « Le numérique comme catalyseur épistémologique ». Revue française des sciences de linformation et de la communication, (1), 2012.

Serres, M., Le gaucher boiteux, – Figures de la pensée, Paris, Le Pommier, 2015.

Severo, M., & Venturini, T., « Enjeux topologiques et topographiques de la cartographie du Web », Réseaux, (195), 2016, 85-105.

Souchier E, Emmanuel, « Limage du texte pour une théorie de lénonciation éditoriale ». Les cahiers de médiologie, 6(2), 1998, 137.

Souchier E, Emmanuël, « Formes et pouvoirs de renonciation éditoriale », Communication et langages, 154(1), 2007, 23-38.

Spitzer, L., Études de style. Paris, Gallimard, 1980.

Svensson P., « The Landscape of Digital Humanities », Digital Humanities Quarterly, 4(1), 2010. Consulté à ladresse http://digitalhumanities.org/dhq/vol/4/1/000080/000080.html

Venturini, T., Jacomy, M., Baneyx, A., & Girard, P., « Hors champs ». Réseaux, (199), 2016, 11-42.

179

Vitali Rosati, M., « Quest-ce que léditorialisation ? » Sens Public, 2016. Consulté à ladresse http://sens-public.org/article1184.html

Vitali-Rosati, M., & Sinatra, M. E. (Éd.), Pratiques de lédition numérique. Montréal, Presses de lUniversité de Montréal, 2014. Consulté à ladresse http://books.openedition.org/pum/306

Wolff, É., « Cheminement sur les terres inconnues des humanités numériques. À la recherche de la e-diaspora réunionnaise » tic&société, (Vol. 7, No 2), 2014.

Zacklad M., « Espace documentaire participatif et gouvernance » Congress of the European Regional Science Association (47th Congress) and ASRDLF (Association de Science Régionale de Langue Française, 44th Congress) PARIS – August 29th – September 2d, 2007, Aug 2007, France, 2007.

Zacklad, M.,. « Organisation et architecture des connaissances dans un contexte de transmédia documentaire : les enjeux de la pervasivité », Études de communication. langages, information, médiations, (39), 2012, 41-63.

1 Bastard, I. Et al. (2017). « Facebook, pour quoi faire : Configurations dactivités et structures relationnelles ». Sociologie, vol. 8,(1), 57-82. ; Lakel, Amar. (2014a). « Enjeux de la recherche digitalisée dans les humanités numériques », My Web Intelligence. Consulté à ladresse http://mywebintelligence.net/enjeux-de-la-recherche-digitalisee-dans-les-humanites-numeriques/ ; Lakel, A., & Le Deuff, O. (2016). « À quoi peut bien servir lanalyse du web ? », Les Cahiers du numérique, 13(3), 39-62.

2 Escarpit, R. (1995). Linformation et la communication. Théorie générale, Paris, Hachette.

3 Meyriat J. (1981). « Document, documentation, documentologie ». Schéma et schématisation, 2e trimestre, no 14, p. 51-63.

4 Paloque-Berges, C. & Schafer, V. (2015). « Quand la communication devient patrimoine ». Hermès, La Revue, (71), 255-261.

5 Proulx, S., & Rueff, J. (2018). Actualité des méthodes de recherche en sciences sociales sur les pratiques informationnelles. Consulté à ladresse http://epe.lac-bac.gc.ca/100/200/300/univ_laval/centre_etudes_medias/CEM-ActualiteMethode.pdf

6 Vitali-Rosati, M., & Sinatra, M. E. (Éd.). (2014). Pratiques de lédition numérique, Montréal : Presses de lUniversité de Montréal. Consulté à ladresse http://books.openedition.org/pum/306

7 Pucheu, D. (2016). « Effacer linterface : Une trajectoire du design de linteraction hommemachine », Interfaces numériques, 5(2), 257-276.

8 Rieder, B. (2010),). « Pratiques informationnelles et analyse des traces numériques : de la représentation à lintervention », Études de communication. langages, information, médiations, (35), 91-104.

9 Serres, M. (2015). Le gaucher boiteux, – Figures de la pensée. Paris : LE POMMIER.

10 Boullier, D. (2015). « Les sciences sociales face aux traces du big data, Big Data traces and social sciences ». Revue française de science politique, 65(5), 805-828.

11 Ferraris, M. (2012),). Documentality : Why It Is Necessary to Leave Traces, New York : Fordham University Press.

12 Lucas, J.-F. (2014),). « Le projet Magic Ring : expérimentation dune méthode de recueil de données quali-quantitatives dans Second Life », Tic&société, (Vol. 7, No 2).

13 Dacos, M., & Mounier, P. (2015). Humanités numériques, Institut français. Rapport consulté à ladresse https://hal.archives-ouvertes.fr/hal-01228945/document

14 La controverse sur létude de EU Desinfolab qui avait usé de tweets pourtant publics à des fins de recherche politique dans le contexte « daffaire Benalla » en août 2018 est, à elle seule, paradigmatique de notre propos.

15 Cardon, D. (2013b). « Dans lesprit du PageRank », Réseaux, (177), 63-95 ; Lakel, A., & Le Deuff, O. (2016). « À quoi peut bien servir lanalyse du web ? », op. cit.

16 Bastard, I. et al. (2017). « Facebook, pour quoi faire : Configurations dactivités et structures relationnelles ». op. cit.

17 Lakel, Amar. (2014b). « My Web Intelligence : Un projet doutils open source au service des humanités numériques. » My Web Intelligence. Consulté à ladresse http://mywebintelligence.net/outils-open-source-humanites-numeriques/

18 Monnoyer-Smith, L. & Plantin, J.-C. (2014). « Ouvrir la boîte à outils de la recherche numérique. Trois cas de redistribution de méthodes », Tic&société, (Vol. 7, No 2).

19 https://research.fb.com/programs/

20 Paloque-Berges, C. & Schafer, V. (2015). « Quand la communication devient patrimoine ». Hermès, La Revue, (71), 255-261. ; Musiani, F. et al. (2019). Quest-ce quune archive du web ? Marseille : OpenEdition Press. Consulté à ladresse http://books.openedition.org/oep/8713

21 Lire le rapport de Elsevier(2016), Open Data : the researcher perspective, https://www.elsevier.com/__data/assets/pdf_file/0004/281920/Open-data-report.pdf

22 À titre dexemple, nous renvoyons le lecteur au projet PROGEDO (http://www.progedo.fr) cité in (Boulier, 2015)

23 Cormerais Franck (2015b), « Humanités digitales, transdisciplinarité et entretrextualité. Éléments pour une organisation des corpus partagés », in Carayol Valérie et Morandi Franck (sous la dir. de), Le tournant numérique des sciences humaines et sociales, Bordeaux, Maison des sciences dAquitaine, p. 55-65.

24 https://dataverse.org/

25 Lakel Amar (2007) « Interconnexion et identités électroniques : le pouvoir denquête à lheure des systèmes de fichiers répartis » in Terminal, dossier spécial « Administration électronique », 2007.

26 Ben Henda, M. (2015). “Adaptation normative des Big Data et du Learning Analytics.” dans : Évelyne Broudoux éd., Big Data – Open Data : Quelles valeurs ? Quels enjeux ?, Actes du colloque « Document numérique et société », Rabat, 2015 (p. 197-212). Louvain-la-Neuve, Belgique : De Boeck Supérieur. doi:10.3917/dbu.chron.2015.01.0197 ; Ben Henda, M. & Hudrisier, H. (2013). “Penser, classer, apprendre et communiquer. Normalisation et nouveaux modes de classification du savoir.”, Hermès, La Revue, 66(2), 160-166. https://www-cairn-info.ezproxy.u-bordeaux-montaigne.fr/revue-hermes-la-revue-2013-2-page-160.htm.

27 Cormerais Franck (2015a), « Humanités digitales et Ré/orgnanisation du savoir », in Le Deuff Olivier (sous la dir. de), Le temps des Humanités digitales, Limoges, fyp éditions.

28 Venturini, T. et al. (2016). « Hors champs ». Réseaux, (199), 11-42.

29 Carmes, M., & Noyer, J.-M. (2014). « Lirrésistible montée de lalgorithmique », Les Cahiers du numérique, 10(4), 63-102.

30 Poibeau, T. (2014). « Le traitement automatique des langues pour les sciences sociales, Automatic language processing for the social sciences », Réseaux, (188), 25-51.

31 Nous renvoyons le lecteur aux travaux de Lev Manovich (Manovich, 2012) et de son Cultural Analytics Lab. http://lab.culturalanalytics.info/ (cité in Monnoyer-Smith et Plantin, 2014)

32 Camps, J.-B. (2017). « Homemade manuscript OCR (1) : OCRopy [Billet] ». Consulté 10 septembre 2018, à ladresse https://graal.hypotheses.org/786 ; Massot, M.-L., Sforzini, A., & Ventresque, V. (2018),). « Transcribing Michel Foucaults reading notes with the Transkribus software : test report », Consulté à ladresse https://hal.archives-ouvertes.fr/hal-01794139

33 Cormerais, F., Le Deuff, O., Lakel, A. & Pucheu, D. (2017). « Lécole et lavenir de la culture digitale ». Hermès, La Revue, 78,(2), 87-95.

34 Rebillard, F. (2011),). « Létude des médias est-elle soluble dans linformatique et la physique ? À propos du recours aux digital methods dans lanalyse de linformation en ligne », Questions de communication, (20), 353-376.

35 Cardon, D. (2015). À quoi rêvent les algorithmes, Paris : Le Seuil.

36 Bastard, I., Cardon, D., Charbey, R., Cointet, J. & Prieur, C. (2017). « Facebook, pour quoi faire : Configurations dactivités et structures relationnelles ». op. cit.

37 Musso, P. (2003b). Réseaux et société. Paris : Presses Universitaires de France – PUF.

38 Koszowska-Nowakowska, P., & Renucci, F. (2012),). « Lhypertexte : approches expérimentale et herméneutique », Les Cahiers du numérique, Vol. 7(3), 71-91 ; Saemmer, A. (2015). « Hypertexte et narrativité ». Critique, no 819-820(8), 637-652.

39 Lakel, A., & Le Deuff, O. (2016). « À quoi peut bien servir lanalyse du web ? », op. cit.

40 Bastard, I., Cardon, D., Charbey, R., Cointet, J. & Prieur, C. (2017). « Facebook, pour quoi faire : Configurations dactivités et structures relationnelles ». op. cit.

41 Imad Saleh et Hakim Hachour, « Le numérique comme catalyseur épistémologique », Revue française des sciences de linformation et de la communication [En ligne], 1 | 2012, mis en ligne le 25 juillet 2012, consulté le 24 mars 2019. URL : http://journals.openedition.org.ezproxy.u-bordeaux-montaigne.fr/rfsic/168;

42 Rebillard, F. (2011),). « Létude des médias est-elle soluble dans linformatique et la physique ? À propos du recours aux digital methods dans lanalyse de linformation en ligne », Questions de communication, (20), 353-376.

43 Ibid.

44 Bourdeloie, H. (2014). « Ce que le numérique fait aux sciences humaines et sociales. épistémologie, méthodes et outils en questions ». Tic&société, (Vol. 7, No 2).

45 Meunier, J.-G. (2017). « Humanités numériques et modélisation scientifique », Questions de communication, (31), 19-48.

46 Rieder, B. (2010),). « Pratiques informationnelles et analyse des traces numériques : de la représentation à lintervention », Études de communication. langages, information, médiations, (35), 91-104.

47 Boullier, D. (2015). « Les sciences sociales face aux traces du big data, Big Data traces and social sciences ». Revue française de science politique, 65(5), 805-828.

48 Deuff, O. L. (2012). “Humanisme numérique et littératies.” Semen – Revue de sémio-linguistique des textes et discours, (34), 117-134.

49 Wolff, É. (2014). « Cheminement sur les terres inconnues des humanités numériques. À la recherche de la e-diaspora réunionnaise » Tic&société, (Vol. 7, No 2).

50 Cormerais, F. et al. (2017). « Lécole et lavenir de la culture digitale ». Hermès, La Revue, 78,(2), 87-95.

51 Unités Régionales de Formation à lInformation Scientifique et Techniques.

52 Meunier, J.-G. (2017). « Humanités numériques et modélisation scientifique », Questions de communication, (31), 19-48.

53 Estivals, R. (1987). La Bibliologie, Presses Universitaires de France.

54 Zacklad M. (2007), « Espace documentaire participatif et gouvernance » Congress of the European Regional Science Association (47th Congress) and ASRDLF (Association de Science Régionale de Langue Française, 44th Congress) PARIS – August 29th – September 2d, 2007, Aug 2007, France. 2007 ; Zacklad, M. (2012). « Organisation et architecture des connaissances dans un contexte de transmédia documentaire : les enjeux de la pervasivité », Études de communication. langages, information, médiations, (39), 41-63.

55 Pour une plongée dans ce concept, lire : Souchier E, Emmanuel. (1998). « Limage du texte pour une théorie de lénonciation éditoriale ». Les cahiers de médiologie, 6(2), 137 ; Souchier E, Emmanuël. (2007),). « Formes et pouvoirs de renonciation éditoriale », Communication et langages, 154(1), 23--38. Jeanneret, Y. & Souchier, E. (2005). « Lénonciation éditoriale dans les écrits décran », Communication et langages, 145(1), 3-15 ; Bachimont, B. et al. (2011),). « Enjeux et technologies : des données au sens. » Documentaliste-Sciences de lInformation, 48(4), 24-41 ; Merzeau Louise, (2014). « Entre événement et document : vers lenvironnement-support », Les Cahiers de la SFSIC, Société française des sciences de linformation et de la communication, 2014, p. 230-233 ; Vitali Rosati, M. (2016). « Quest-ce que léditorialisation ? », Sens Public. Consulté à ladresse http://sens-public.org/article1184.html

56 Pour une bibliographie assez exhaustive de la problématique en français voir le travail de Jérôme Valluy : Valluy, Jérôme. (2015, mai 18). Editorialisation – Terra-HN. Consulté 10 septembre 2018, à ladresse http://www.reseau-terra.eu/article1333.html

57 Estivals, R. (1987). La Bibliologie, op. cit., p. 116.

58 Meyriat J., Miège B., 2002, « Le projet des sic : de lémergent à lirréversible (milieu des années 60-milieu des années 80 », p. 45-70, in : Boure R., Les origines des sciences de linformation et de la communication. Regards croisés, Lille, Presses universitaires du Septentrion.

59 Svensson P. (2010). « The Landscape of Digital Humanities », Digital Humanities Quarterly, 4(1). Consulté à ladresse http://digitalhumanities.org/dhq/vol/4/1/000080/000080.html