Le modèle informatique du MIT excelle dans la prédiction des émotions

Qu\'avez vous pensé de cet article ?

Concept de gamme d'émotions

Des neuroscientifiques du MIT ont créé un modèle informatique qui prédit avec succès les émotions humaines dans des scénarios sociaux, en utilisant le jeu du dilemme du prisonnier comme base. Le modèle prend en compte les désirs et les attentes des individus, ainsi que l’influence des observateurs, déduisant les motivations, comparant les résultats aux attentes et prédisant les émotions en fonction de ces facteurs. Ce modèle, qui imite l’intelligence sociale humaine, a surpassé d’autres modèles de prédiction des émotions, et les chercheurs ont l’intention de l’adapter à des applications plus larges.

En s’appuyant sur les connaissances acquises sur la manière dont les gens perçoivent les émotions des autres, les chercheurs ont conçu un modèle qui se rapproche de cet aspect de l’intelligence sociale humaine.

Lorsque vous interagissez avec une autre personne, vous passez probablement une partie de votre temps à essayer d’anticiper ce qu’elle va ressentir par rapport à ce que vous dites ou faites. Cette tâche requiert une compétence cognitive appelée théorie de l’esprit, qui nous aide à déduire les croyances, les désirs, les intentions et les émotions des autres.

Des neuroscientifiques du MIT ont conçu un modèle informatique capable de prédire les émotions d’autrui – notamment la joie, la gratitude, la confusion, le regret et l’embarras – en se rapprochant de l’intelligence sociale des observateurs humains. Le modèle a été conçu pour prédire les émotions des personnes impliquées dans une situation basée sur le dilemme du prisonnier, un scénario classique de la théorie des jeux dans lequel deux personnes doivent décider de coopérer avec leur partenaire ou de le trahir.

Bien que de nombreuses recherches aient été menées pour former des modèles informatiques capables de déduire l’état émotionnel d’une personne à partir de l’expression de son visage, ce n’est pas l’aspect le plus important de l’intelligence émotionnelle humaine, explique Rebecca Saxe, professeur au MIT. La capacité à prédire la réaction émotionnelle d’une personne à un événement avant qu’il ne se produise est bien plus importante. Crédit : Christine Daniloff, MIT

Pour construire le modèle, les chercheurs ont intégré plusieurs facteurs dont on a supposé qu’ils influençaient les réactions émotionnelles des gens, notamment les désirs de la personne, ses attentes dans une situation donnée et le fait que quelqu’un observe ou non ses actions.

« Il s’agit d’intuitions de base très courantes, et ce que nous avons dit, c’est que nous pouvons prendre cette grammaire de base et créer un modèle qui apprendra à prédire les émotions à partir de ces caractéristiques », explique Rebecca Saxe, professeur de sciences cérébrales et cognitives John W. Jarve, membre de l’Institut McGovern pour la recherche sur le cerveau du MIT et auteur principal de l’étude.

Sean Dae Houlihan PhD ’22, postdoc au Neukom Institute for Computational Science au Dartmouth College, est l’auteur principal de l’article, qui a été publié le 5 juin dans Philosophical Transactions A. Les autres auteurs sont Max Kleiman-Weiner PhD ’18, postdoc au MIT et à l’université de Harvard ; Luke Hewitt PhD ’22, chercheur invité à l’université de Stanford ; et Joshua Tenenbaum, professeur de sciences cognitives computationnelles au MIT et membre du Center for Brains, Minds, and Machines et du Computer Science and Artificial Intelligence Laboratory (CSAIL) du MIT.

Prédire les émotions

Bien que de nombreuses recherches aient été menées pour former des modèles informatiques capables de déduire l’état émotionnel d’une personne à partir de son expression faciale, ce n’est pas l’aspect le plus important de l’intelligence émotionnelle humaine, affirme M. Saxe. La capacité à prédire la réaction émotionnelle d’une personne à un événement avant qu’il ne se produise est bien plus importante.

« L’aspect le plus important de la compréhension des émotions d’autrui est l’anticipation des sentiments d’autrui avant que l’événement ne se produise », explique-t-elle. « Si toute notre intelligence émotionnelle était réactive, ce serait une catastrophe.

Pour tenter de modéliser la manière dont les observateurs humains font ces prédictions, les chercheurs ont utilisé des scénarios tirés d’un jeu télévisé britannique appelé « Golden Balls ». Dans ce jeu, les participants sont mis en binôme et une cagnotte de 100 000 dollars est en jeu. Après avoir négocié avec son partenaire, chaque concurrent décide, en secret, de partager la cagnotte ou d’essayer de la voler. Si les deux décident de partager, ils reçoivent chacun 50 000 dollars. Si l’un partage et l’autre vole, le voleur reçoit la totalité de la cagnotte. Si les deux tentent de voler, personne ne reçoit rien.

En fonction du résultat, les concurrents peuvent ressentir toute une gamme d’émotions : joie et soulagement si les deux concurrents se séparent, surprise et fureur si l’adversaire vole le pot, et peut-être culpabilité mêlée d’excitation si l’un d’entre eux réussit à voler.

Pour créer un modèle informatique capable de prédire ces émotions, les chercheurs ont conçu trois modules distincts. Le premier module est entraîné à déduire les préférences et les croyances d’une personne en fonction de ses actions, grâce à un processus appelé planification inverse.

« Il s’agit d’une idée qui dit que si vous voyez juste un peu le comportement de quelqu’un, vous pouvez déduire de manière probabiliste des choses sur ce qu’il voulait et attendait dans cette situation », explique M. Saxe.

Grâce à cette approche, le premier module peut prédire les motivations des participants en fonction de leurs actions dans le jeu. Par exemple, si quelqu’un décide de partager le pot, on peut en déduire qu’il s’attendait également à ce que l’autre personne partage le pot. Si quelqu’un décide de voler, il s’attendait peut-être à ce que l’autre personne vole et ne voulait pas être trompé. Il se peut aussi qu’il se soit attendu à ce que l’autre personne partage et qu’il ait décidé d’essayer d’en tirer profit.

Le modèle peut également intégrer des connaissances sur des joueurs spécifiques, telles que la profession du concurrent, pour l’aider à déduire les motivations les plus probables des joueurs.

Le deuxième module compare le résultat du jeu avec ce que chaque joueur voulait et attendait. Ensuite, un troisième module prédit les émotions que les participants peuvent ressentir, en fonction du résultat et de ce que l’on sait de leurs attentes. Ce troisième module a été entraîné à prédire les émotions sur la base des prédictions d’observateurs humains sur la façon dont les participants se sentiraient après un résultat particulier. Les auteurs soulignent qu’il s’agit d’un modèle d’intelligence sociale humaine, conçu pour imiter la façon dont les observateurs raisonnent de manière causale sur les émotions des autres, et non d’un modèle de ce que les gens ressentent réellement.

« À partir des données, le modèle apprend que ce qui signifie, par exemple, ressentir beaucoup de joie dans cette situation, c’est d’obtenir ce que l’on voulait, de le faire en étant juste et de le faire sans prendre l’avantage », explique M. Saxe.

Intuitions fondamentales

Une fois les trois modules opérationnels, les chercheurs les ont utilisés sur un nouvel ensemble de données provenant du jeu télévisé afin de déterminer comment les prédictions d’émotions des modèles se comparaient aux prédictions faites par les observateurs humains. Ce modèle a obtenu de bien meilleurs résultats que n’importe quel autre modèle antérieur de prédiction des émotions.

Le succès du modèle tient à l’intégration de facteurs clés que le cerveau humain utilise également pour prédire la réaction d’une autre personne à une situation donnée, explique M. Saxe. Il s’agit notamment du calcul de la manière dont une personne évaluera et réagira émotionnellement à une situation, en fonction de ses désirs et de ses attentes, qui concernent non seulement les gains matériels, mais aussi la manière dont elle est perçue par les autres.

« Notre modèle repose sur ces intuitions fondamentales, à savoir que les états mentaux qui sous-tendent les émotions sont liés à ce que vous vouliez, à ce que vous attendiez, à ce qui s’est passé et à qui l’a vu. Et ce que les gens veulent, ce n’est pas seulement des choses. Ils ne veulent pas seulement de l’argent ; ils veulent être justes, mais aussi ne pas être les dindons de la farce, ne pas être trompés », dit-elle.

« Les chercheurs ont aidé à mieux comprendre comment les émotions contribuent à déterminer nos actions ; puis, en retournant leur modèle, ils expliquent comment nous pouvons utiliser les actions des gens pour déduire leurs émotions sous-jacentes. Cette ligne de travail nous aide à voir les émotions non seulement comme des « sentiments », mais aussi comme jouant un rôle crucial et subtil dans le comportement social humain », déclare Nick Chater, professeur de sciences du comportement à l’université de Warwick, qui n’a pas participé à l’étude.

Dans leurs travaux futurs, les chercheurs espèrent adapter le modèle afin qu’il puisse effectuer des prédictions plus générales basées sur des situations autres que le scénario du jeu télévisé utilisé dans cette étude. Ils travaillent également à la création de modèles capables de prédire ce qui s’est passé dans le jeu en se basant uniquement sur l’expression des visages des participants après l’annonce des résultats.

Référence : « Emotion prediction as computation over a generative theory of mind » par Sean Dae Houlihan, Max Kleiman-Weiner, Luke B. Hewitt, Joshua B. Tenenbaum et Rebecca Saxe, 5 juin 2023, Philosophical Transactions A.
DOI : 10.1098/rsta.2022.0047

Cette recherche a été financée par l’Institut McGovern, le Paul E. and Lilah Newton Brain Science Award, le Center for Brains, Minds, and Machines, le MIT-IBM Watson AI Lab et le Multidisciplinary University Research Initiative.