L’intelligence artificielle en Lettres

Foire aux questions

Pourquoi s’y intéresser ? De quoi parle-t-on ? Comment travailler en Lettres à l’ère de l’I.A. ?

Écrire Lire Étude de la langue Oral Collège

vendredi 13 décembre 2024 , par GEP Lettres

1) Pourquoi s’intéresser à l’intelligence artificielle en cours de Lettres ?

Les Intelligences Artificielles sont partout dans le quotidien des élèves. L’émergence récente des IA génératives, en particulier dans le domaine textuel, doivent pousser les enseignants de Lettres que nous sommes à nous y intéresser pour en comprendre le fonctionnement et les enjeux. En effet, en tant que spécialistes du texte, nous y serons immanquablement confrontés dans le cadre de notre relation pédagogique avec les élèves, sous différentes formes :

  • questions des élèves sur la qualité des textes produits par la machine,
  • questions des élèves sur les contenus fournis par la machine,
  • usage des élèves dans l’élaboration de travaux, etc.

En outre, intégrer l’IA à nos pratiques entre en cohérence avec la nécessité de travailler les compétences numériques conformément au cadre de référence des compétences numériques (CRCN) élaboré par les ministères de l’éducation nationale et de l’enseignement supérieur.

Si l’on prend appui sur les nouveaux référentiels de compétences en IA de l’UNESCO pour les élèves et les enseignants [1], on retiendra ces éléments clefs.



Ces pistes nous invitent à aller plus loin et à mettre à profit l’IA dans le cadre du cours de Lettres, que ce soit du côté du professeur ou du côté de l’élève.

Exemples du côté du professeur :

  • L’IA peut faciliter le travail de préparation du professeur, par exemple, en l’aidant à trouver des corpus,
  • L’IA peut constituer un support pour exercer l’esprit critique des élèves.

Exemples du côté des élèves :

  • L’IA peut aider les élèves à trouver des idées pour un travail de rédaction,
  • L’IA peut produire des aides à la compréhension de textes difficiles d’accès.



2) IA : de quoi parle-t-on ?

Il existe plusieurs formes d’intelligence artificielle (IA). Depuis le lancement de ChatGPT par OpenAI le 30 novembre 2022, l’intelligence artificielle générative occupe le devant de la scène. Cependant, il existe d’autres types d’intelligence artificielle, chacune ayant des caractéristiques et des applications spécifiques.

L’IA étroite ou faible (abrégée en IAE ou IAF) est conçue pour accomplir des tâches spécifiques, comme la reconnaissance vocale, la recommandation de produits ou le diagnostic médical. Ces systèmes sont très performants dans leurs domaines respectifs mais n’ont pas la capacité de généraliser leurs compétences à d’autres domaines.

L’IA générative, comme celle utilisée par les modèles de langage de type GPT, est capable de créer du contenu original, qu’il s’agisse de texte, d’images, de sons ou de vidéos, en se basant sur des exemples d’entraînement. Elle est largement utilisée pour l’automatisation de la création de contenu, les agents conversationnels (chatbots), et plus encore.

Enfin, l’IA générale représente une forme hypothétique d’IA, qui posséderait des capacités cognitives humaines complètes lui permettant de comprendre, apprendre et appliquer des connaissances, de manière flexible et autonome, à n’importe quelle tâche intellectuelle. Bien que l’IA générale soit souvent évoquée dans la science-fiction et les discussions théoriques, elle reste un objectif lointain et hors de portée de la technologie actuelle.

L’IA générative, de quoi s’agit-il ?

L’intelligence artificielle générative fonctionne en utilisant des modèles d’apprentissage profond, notamment des réseaux de neurones, pour créer du contenu original à partir de vastes ensembles de données d’entraînement. Ces modèles, comme ceux basés sur les transformateurs (par exemple, GPT-3 et GPT-4, BERT…), apprennent à identifier et à reproduire les structures et les relations présentes dans les données : une IA destinée à générer du texte va ainsi « apprendre », d’après son corpus d’entraînement, quel est l’ordre des mots dans une phrase déclarative ou interrogative, quels sont les champs lexicaux à mobiliser en fonction de tel ou tel contexte, quelles sont les caractéristiques d’un écrit « professionnel » ou au contraire d’un énoncé plus familier… Pendant l’apprentissage, le modèle ajuste ses paramètres pour minimiser l’erreur entre ses prédictions et les exemples réels, ce qui lui permet de générer des textes, des images, ou d’autres types de contenus de manière cohérente et appropriée au contexte.

Une fois formée, l’IA générative peut générer du contenu en partant d’une consigne initiale (le prompt ) et en calculant la suite par probabilités. Bien que puissante, l’IA générative repose sur des statistiques et non sur une compréhension consciente du contenu généré. Les applications de cette technologie sont vastes, incluant la rédaction assistée, la création artistique, la génération de code, et la composition musicale. En ajustant ces modèles pour des tâches spécifiques, il est possible d’améliorer la pertinence et la qualité des productions, rendant l’IA générative utile dans des contextes variés : jeux vidéo, personnages virtuels, simulations de conversations…

En lien avec l’IA générative, il est fréquent de rencontrer l’expression « grands modèles de langage » (Large Language Models ou LLM en anglais). Il s’agit de systèmes d’intelligence artificielle conçus pour analyser et générer spécifiquement du texte. Les grands modèles de langage constituent donc un sous-ensemble de l’IA générative, focalisé sur le langage.

Ressources
 Intelligence artificielle et éducation : apports de la recherche et enjeux pour les politiques publiques (janvier 2024), réalisé par la Direction du Numérique pour l’Éducation (ministère de l’Éducation nationale et de la Jeunesse), p. 6 à 12.
 Comment intégrer l’IA générative dans sa pédagogie ? Enseigner à l’ère de l’IA (mars 2024), article issu d’une réflexion menée au sein du groupe d’appui IA DANE, DRANE-Versailles



3) Comment l’IA génère-t-elle du langage ?

Les textes produits par une IA générative peuvent de prime abord donner l’impression d’être parfaits : du point de vue linguistique, ils ne comportent ni erreur orthographique ni erreur syntaxique et le propos est généralement fluide ; du point de vue de l’organisation des idées, ils sont rédigés sous la forme de paragraphes structurés de façon logique. L’IA générative fonctionne en effet principalement grâce à des modèles de traitement du langage naturel : cela signifie qu’elle utilise des techniques et des algorithmes spécifiques pour analyser, générer et interagir avec le langage humain de manière cohérente et pertinente. Elle possède une capacité à accomplir des tâches nécessitant des fonctions cognitives similaires à celles des humains (le raisonnement, la résolution de problèmes, la planification…) et produit du langage en générant des phrases et des textes basés sur des modèles mathématiques. Elle utilise des données pour assembler des phrases correctes, tant sur le plan syntaxique que sémantique.

C’est ainsi que les productions textuelles générées peuvent laisser penser que l’IA est intelligente – plus intelligente que l’humain, que le professeur, que l’élève – et qu’elle produit une pensée.

Pourtant, l’intelligence artificielle générative ne pense pas, ne raisonne pas, ne produit pas de pensée au sens humain du terme. Elle n’a pas de conscience, de compréhension approfondie ou d’intentionnalité. Elle prédit le mot suivant dans une séquence de mots en se basant sur les probabilités calculées à partir des données qui lui ont été fournies pendant une phase d’entraînement. L’article « Réponses générées par IA en Lettres » décrit ce fonctionnement de façon détaillée. L’IA générative ne peut ainsi pas produire de pensée originale ou critique, elle se contente de répliquer les schémas appris à partir des données d’entraînement, lesquels peuvent présenter des biais et des stéréotypes. La correction de ces derniers nécessite une phase d’entraînement supplémentaire, qui génère elle-même des coûts supplémentaires.

En tant que professeur de lettres, il est nécessaire d’avoir à l’esprit cet enjeu à aborder avec les élèves pour engager une réflexion sur les usages de l’IA, en lien avec les grands champs de la discipline des lettres : l’IA générative produit moins une pensée qu’un langage, généré par probabilité, et non par assemblage d’idées ou réflexions personnelles.

Ressources
 « L’IA est-elle capable d’interpréter ce qu’on lui demande ? », Rémy Demichelis, The Conversation, juin 2024.


4) L’IA générative est-elle aussi performante avec le français qu’avec les autres langues ? Pourquoi ?

De nos jours, les IA génératives les plus utilisées par le grand public, comme ChatGPT ou Copilot, peuvent donner l’impression qu’elles sont aussi performantes avec le français qu’avec les autres langues.

Cependant, la performance peut varier en fonction de plusieurs facteurs :

  • Les données d’entraînement : les modèles d’IA générative sont entraînés sur de grandes quantités de texte. Si le modèle a été entraîné sur une grande quantité de textes en français, il sera très performant pour générer du texte en français ; si ce n’est pas le cas, il sera moins performant et contiendra des erreurs ou des approximations, sur le plan du lexique comme sur celui de la syntaxe.
  • La complexité de la langue : certaines langues sont plus difficiles à modéliser que d’autres en raison de leur complexité syntaxique ou lexicale. Le français a une structure grammaticale plus complexe que l’anglais, du point de vue du genre et de l’accord des groupes nominaux par exemple, ou bien de la conjugaison des verbes, ce qui peut rendre le modèle moins performant en français qu’en anglais. L’ordre des mots en français est également plus flexible qu’en anglais, et nécessite donc un apprentissage plus poussé. Mais surtout, le français est une langue beaucoup plus polysémique que l’anglais. En français, manche peut ainsi désigner indifféremment le manche d’une poêle, la manche d’un pull, ou une manche dans un jeu. En anglais, ces concepts sont exprimés par trois mots différents : handle, sleeve, et round. De même, le mot vol peut renvoyer en français au vol à la tire ou au vol d’oiseau, désignés en anglais par deux mots différents : theft et flight. Pour choisir le sens d’un mot en français, l’IA a donc besoin de davantage d’éléments contextuels qu’en anglais : elle fonctionne généralement, en français, sur des groupes de quatre mots (alors que des groupes de deux suffisent en anglais).
  • La disponibilité des ressources : la disponibilité des ressources linguistiques, comme les corpus de textes et les outils de traitement du langage naturel, peut également affecter la performance du modèle. Si plus de ressources sont disponibles pour une langue, le modèle sera probablement plus performant dans cette langue.

Ces facteurs sont généraux et peuvent varier en fonction du modèle spécifique d’IA générative utilisé. En fin de compte, la performance d’un modèle d’IA générative dans une langue spécifique dépend de la qualité et de la quantité des données d’entraînement disponibles dans cette langue.

De nos jours, la plupart des grands modèles de langage sont capables de fonctionner directement en français. Ils ont toutefois été alimentés, paramétrés, conçus en anglais, et traduisent souvent la requête du français à l’anglais, puis la réponse de l’anglais au français.

Les générateurs d’images, de musiques, de vidéos fonctionnent encore pour la plupart d’entre eux en anglais.

Ressources
 Sur les limites de la traduction automatique par IA, on consultera avec profit l’article de François Yvon « Traduire comme on joue au go ? » (CNRS | Le Journal).
 Cette interview de l’un des concepteurs de CroissantLLM, un grand modèle de langage bilingue français-anglais, permet quant à elle de se faire une idée de l’influence de la distribution des langues dans les corpus d’apprentissage.



5) À quoi doit-on être vigilant dans l’utilisation de l’IA générative en Lettres ?

Les points de vigilance dans l’utilisation de l’IA générative en Lettres peuvent être répartis en trois catégories : précautions juridiques, précautions éthiques, et précautions sur le plan pédagogique.

Au niveau juridique, il n’existe à l’heure actuelle aucune intelligence artificielle générative spécialement mise en place pour l’Éducation Nationale [2]. Cela signifie qu’il n’existe pas de plateforme d’IA générative permettant un usage totalement sécurisé pour les élèves, notamment sur le plan du traitement et de la confidentialité des données. Pour toute utilisation d’une IA  générative par les élèves dans le cadre scolaire, il est nécessaire d’obtenir l’accord du chef d’établissement. Le délégué à la protection des données (DPD) académique est la personne de référence pour déterminer si un usage est juridiquement acceptable ou non.

Sur le plan éthique, il est nécessaire de prendre en compte, lors du travail avec l’IA générative, les nombreux biais liés à son corpus d’entraînement. Une étude de l’UNESCO publiée le 7 mars 2024 portant sur les versions de l’époque des grands modèles de langage souligne ainsi la présence de plusieurs stéréotypes dans les grands modèles de langage :

  • Des stéréotypes de genre, mettant en œuvre une vision réductrice des femmes, les associant par exemple plus fréquemment à des tâches domestiques ;
  • Des stéréotypes culturels, comme l’assignation de professions différentes en fonction de l’origine ethnique ;
  • Des stéréotypes homophobes, les termes associés aux personnes LGBTQIA+ étant souvent négativement connotés.
    Le travail sur les productions des IA génératives doit donc nécessairement inclure un travail sur l’esprit critique, avec une sensibilisation à la présence de ces stéréotypes.

D’un point de vue pédagogique, il est important de bien faire comprendre aux élèves que l’IA  fonctionne par probabilités et peut donc générer des énoncés en apparence très bien écrits, mais totalement erronés sur le plan du contenu ou du raisonnement [3]. C’est notamment le cas si l’on demande à une IA de générer le résumé d’un livre quelle ne « connaît » pas [4], ou de parler de ses personnages. Fonctionnant par probabilités, l’IA va partir des éléments qu’elle a en sa possession : titre, auteur, éventuels éléments de contexte proposés par l’élève, puis « halluciner » [5] une réponse qui sera sans doute formulée de façon convaincante, mais erronée sur le fond. La typologie des réponses colle souvent davantage à des modèles anglo-saxons que français : lorsqu’on lui demande de produire le commentaire d’un texte, ChatGPT s’appuie par exemple beaucoup moins sur l’analyse des citations qu’on ne le fait habituellement en France. Ces éléments doivent être soulignés auprès des élèves, pour qu’ils aient conscience que l’énoncé produit par l’IA, quel qu’il soit, doit systématiquement être vérifié et retravaillé.

Ressources
 Charline Zeitoun « Peut-on faire confiance à l’IA ? » (CNRS | Le Journal)
 IA pour les enseignants : un manuel ouvert, chapitre 19 « Problèmes liés aux données : biais et équité »



6) Comment travailler en Lettres à l’ère de l’IA ?

Nous ne saurions ignorer l’usage que les élèves − à l’image du reste de la société − font des IA génératives, utilisation dont nous faisons le constat au quotidien dans nos classes.
Cela suppose que nous analysions l’usage possible de l’IA en Lettres dans les différents cas de figures :

  • dans le travail de préparation en amont de la séance et de la séquence ;
  • en classe devant les élèves qui restent en position d’observateurs ;
  • en classe dans des dispositifs où les élèves ont un usage réfléchi de l’IA.

Nous sommes ainsi conduits à interroger nos pratiques, à réfléchir à la manière dont tenir compte de l’IA dans l’enseignement des Lettres, à repenser dans nos dispositifs d’enseignement les objectifs, les tâches et les productions demandées, les critères d’évaluation,...

La gradation des utilisations de l’IA par les élèves, proposée par le site « École branchée, enseigner à l’ère du numérique », offre un point d’appui intéressant pour travailler à repenser nos pratiques.

D’après « L’IA à l’école : qu’est-ce qui est de la triche, qu’est-ce qui est correct ? », L’École branchée, novembre 2023

Il n’est pas inutile de rappeler que les IA peuvent générer du texte, de l’image, du son etc., comme l’atteste le tableau de bord de Vittascience, en développement constant.

Tableau de bord Vittascience

Les IA proposent souvent, désormais, une sorte de catalogue des actions possibles qui sont autant de pistes d’utilisation de l’IA.

Instructions possibles Vittasciences

Sont proposées ci-dessous, sous forme de carte mentale, différentes pistes d’expérimentation pour exploiter l’IA en Lettres dans le travail des compétences disciplinaires et transversales.

Cliquer sur l’image pour afficher l’infographie.
Ressources
 Page « Intelligence artificielle » sur le site de la DRANE de l’académie de Versailles : https://drane-versailles.region-academique-idf.fr/spip.php?rubrique169
 Site du GT IA : https://ia.ac-versailles.fr/
 IA sans création de compte :
Accessible aux élèves Vittascience
Possible pour les professeurs Perplexity, Bing Copilot
 Glossaire de l’intelligence artificielle (IA), CNIL

[1Disponibles pour le moment seulement en anglais

[2En juin 2024, le Consortium OpenLLM France a été retenu pour créer un grand modèle de langage entièrement ouvert, et dédié à l’éducation ; cependant, il ne s’agit encore que d’un projet.

[3Pour aller plus loin sur le fonctionnement par probabilités de l’IA, on peut recommander la lecture de l’article « Comment une IA générative crée-t-elle du texte ? » (Délégation régionale au numérique éducatif, site de l’académie de Versailles).

[4Le verbe connaître , appliqué à l’IA générative, ne possède pas le même sens qu’appliqué à un être humain. Une IA ne « lit » pas à proprement parler les livres. Cependant, ces derniers, ou leurs résumés détaillés, peuvent faire partie de son corpus d’entraînement. Lorsque c’est le cas, les IA génératives sont actuellement à même de mobiliser les données de ces corpus pour générer, par calculs de probabilité, des réponses relativement cohérentes avec l’ouvrage considéré.

[5Dans le domaine de l’IA générative, on appelle hallucination une réponse erronée produite par l’IA. L’IA étant conçue pour générer une réponse quelle que soit la question, elle en produit une même lorsqu’elle n’est pas en possession d’éléments suffisants pour répondre, ou lorsque l’instruction donnée rend la réponse impossible (par exemple, si l’on demande de générer la recette d’un plat faisant intervenir des œufs de vache) : c’est l’hallucination, extrapolation à partir des données de la question. Pour plus d’informations et une présentation plus poussée de ce processus, se reporter à l’article « Réponses générées par IA  en Lettres ».

Dans la même rubrique