L'IA peut détecter le sarcasme avec l'aide de « amis » ? : Oui, n'est-ce pas
- Un outil de détection du sarcasme alimenté par l'IA a été développé par des scientifiques de l'Université de Groningue aux Pays-Bas.
- L'outil combine l'analyse de texte et la voix pour déterminer si un discours est honnête et sérieux ou sarcastique et humoristique.
- Cette technologie pourrait avoir des implications importantes pour améliorer les interactions avec les chatbots IA et faciliter les relations interpersonnelles.
Dans le cadre d'une avancée majeure qui pourrait potentiellement sauver des mariages, des amitiés et d'innombrables malentendus, les scientifiques affirment avoir construit un outil de détection des sarcasmes alimenté par l'IA.
Un groupe de chercheurs de l'Université de Groningue aux Pays-Bas affirme avoir développé un système d'IA capable de déterminer si vous êtes honnête et sérieux, ou si vous faites preuve d'un esprit sournois et humoristique.
Leur travail a été présenté aujourd'hui lors d'une réunion de l'Acoustical Society of America à Ottawa et combine l'analyse de texte et de voix.
L'équipe est dirigée par Xiyuan Gao, étudiante diplômée, qui « relève le défi du langage figuratif » dans le cadre de ses recherches universitaires.
Gao n'a pas immédiatement répondu à une demande de commentaires de Decrypt.
Un document de recherche décrit l'approche de l'équipe en matière de détection du sarcasme.
Tout d’abord, ils ont formé un réseau neuronal sur des données multimodales (clips audio, textes transcrits et contenu émotionnel annoté) provenant de scènes chargées de sarcasme dans des sitcoms comme « Friends » et « The Big Bang Theory » obtenues à partir de la base de données MUStARD.
Ils ont ensuite développé un algorithme pour cartographier les signaux émotionnels de l'audio et du texte, et attribué des émoticônes appropriées sur la base d'une analyse des sentiments. Cela a rendu l'IA plus puissante pour détecter le sarcasme sur la base d'une approche à multiples facettes, battant d'autres outils qui reposent uniquement sur les changements de hauteur de texte et de voix.
« Notre méthodologie exploite les atouts de chaque modalité : les algorithmes de reconnaissance des émotions analysent les données audio à la recherche d'indices affectifs, tandis que l'analyse des sentiments traite le texte », explique le document de recherche. « L'intégration de ces modalités vise à compenser les limitations de la perception de la hauteur. »
L'IA a détecté le sarcasme dans les nouvelles scènes de sitcom avec une précision d'environ 75 %.
Les chercheurs admettent cependant que les humains devancent toujours les machines dans ce test de perception particulier.
« Lorsque vous commencez à étudier le sarcasme, vous devenez hyper-conscient de la mesure dans laquelle nous l'utilisons dans le cadre de notre mode de communication normal », a déclaré au Guardian Matt Coler, un autre chercheur travaillant sur le projet. nos appareils d'une manière très littérale, comme si nous parlions à un robot, parce que nous le sommes.
« Il n'est pas nécessaire que ce soit ainsi », a-t-il ajouté.
Cet outil de détection du sarcasme n'est que la dernière tentative visant à trouver le sentiment ou le sens caché du langage humain, et devient de plus en plus important à mesure que l'adoption explosive des chatbots IA signifie des millions de conversations quotidiennes avec de grands modèles de langage (LLM).
Par exemple, Hume AI affirme avoir développé un système d’IA pour détecter différentes inflexions dans la voix afin d’identifier une gamme d’émotions, et pas seulement un changement de ton ou d’humeur.
Hume est conçu pour comprendre et répondre aux émotions humaines de manière plus nuancée et empathique, rendant les interactions avec l'IA plus naturelles et plus engageantes, explique la société.
Pendant ce temps, une équipe de l’Université des sciences appliquées Haaga-Helia et de l’Université d’Oulu en Finlande a publié le mois dernier un document de recherche explorant les techniques sans contact dans la reconnaissance multimodale des émotions.
L’équipe a également découvert que le moyen le plus précis d’analyser les émotions consiste à fusionner des signaux visuels, audio et textuels.
Cependant, ils ont souligné que ce type de compréhension est encore limité par les variables culturelles, les biais inhérents au modèle, les interprétations erronées et le manque de compréhension du contexte passé.
D’autres chercheurs ont tenté d’analyser l’utilisation des emojis pour bien détecter l’état émotionnel des personnes qui les utilisent. Après tout, un message texte suivi d’un emoji faisant un clin d’œil peut avoir une signification très différente d’un message sans illustration ou avec un emoji différent.
Même si la capacité de s’adapter à des nuances plus riches dans les conversations aidera les chatbots IA à mieux répondre aux demandes des humains, cela pourrait avoir des implications considérables pour la société en général. En plus de détecter les tons négatifs non écrits dans le langage ou d'identifier les discours de haine, cela pourrait également faciliter les relations interpersonnelles, offrant une plus grande clarté dans les moments de confusion, en particulier pour les personnes communiquant dans plusieurs langues ou souffrant de maladies neurodivergentes.
Edité par Ryan Ozawa.
Newsletter généralement intelligente
Un voyage hebdomadaire en IA raconté par Gen, un modèle d'IA générative.