OpenAI présente un chatbot vocal et présente le nouveau modèle d'IA GPT-4o

Le développeur de ChatGPT, OpenAI, a annoncé aujourd'hui son dernier modèle d'IA, GPT-4o (le « O » signifie « omnimodel »), lors d'une diffusion en direct de mise à jour de produit au printemps, ainsi qu'une multitude de mises à jour de produits, y compris un chatbot vocal.
OpenAI a mis à jour ses applications mobiles immédiatement après ses annonces et a également lancé une application de bureau pour ChatGPT. La société a mis l'accent sur les améliorations apportées à son expérience utilisateur, qui, selon elle, permet aux utilisateurs de mieux se concentrer sur les conversations qu'ils ont avec ChatGPT.
"Au cours des deux dernières années, nous nous sommes concentrés sur l'amélioration de l'intelligence de ces modèles, et ils sont devenus plutôt bons", a-t-elle poursuivi, directrice de la technologie d'OpenAI. "Mais c'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation."
Le livestream a mis l’accent sur une approche simplifiée et plus holistique de l’IA générative. Un système « omnimodèle » – ou multimodal natif – fait tout dans son application principale au lieu de coordonner GPT pour le texte, GPT Vision pour les images, etc.
"Nous pensons qu'il est très, très important que les gens aient une idée intuitive de ce que la technologie peut faire, c'est pourquoi nous voulons vraiment l'associer à cette compréhension plus large", a déclaré Murati.
Elle a noté que GPT-4o sera disponible pour les utilisateurs ChatGPT payants et gratuits, ainsi que pour les utilisateurs de l'API de ChatGPT. Les abonnés ChatGPT payants, a ajouté Murati, continueront d'avoir accès à une capacité système jusqu'à cinq fois supérieure aux utilisateurs gratuits. Tout le monde, a déclaré Murati, devrait pouvoir accéder aux outils OpenAI.
"Nous trouvons toujours des moyens de réduire ces frictions, et récemment, nous avons rendu ChatGPT disponible sans le flux d'inscription", a-t-elle noté. En avril, OpenAI a permis aux utilisateurs d'accéder à ChatGPT 3.5 sans créer de compte.
OpenAI a ensuite présenté la capacité de ChatGPT à tenir une conversation informelle en temps réel avec les utilisateurs, démontrant une variété de tons et d'émotions. La démo comprenait ChatGPT chantant, riant et plaisantant avec les ingénieurs OpenAI. La société a également affirmé que ChatGPT peut désormais déterminer l'état émotionnel d'un utilisateur à l'aide de la caméra frontale du téléphone mobile.
Un nouveau billet de blog décrit les développements majeurs annoncés aujourd’hui, avec en tête « une interaction homme-machine beaucoup plus naturelle ».
"Il accepte comme entrée n'importe quelle combinaison de texte, d'audio et d'image et génère n'importe quelle combinaison de sorties de texte, d'audio et d'image", a écrit la société. "Il peut répondre aux entrées audio en aussi peu que 232 millisecondes, avec une moyenne de 320 millisecondes, ce qui est similaire au temps de réponse humain dans une conversation."
Même avant les annonces d'aujourd'hui, les passionnés d'IA et de technologie suggéraient qu'un chatbot vocal alimenté par un modèle d'IA de nouvelle génération ferait des compagnons personnels représentés dans le film de science-fiction "Her" une réalité - y compris le PDG d'OpenAI, Sam Altman, dans un langage énigmatique, un Message Twitter en 3 mots.
À l'aide de l'application de bureau ChatGPT, les ingénieurs d'OpenAI ont montré que le code du logiciel pouvait être copié dans ChatGPT, permettant à l'ingénieur d'en discuter avec ChatGPT. Dans la démo, OpenAI a également présenté la capacité de ChatGPT à effectuer des traductions en temps réel. ChatGPT a également été montré expliquant un problème mathématique après qu'une photo de l'équation ait été soumise à l'application.
OpenAI et l’industrie plus large de l’IA générative se sont publiquement engagés à lutter contre l’utilisation de leur technologie dans la création de deepfakes générés par l’IA. OpenAI a reconnu aujourd'hui que GPT-4o présente de nouveaux défis en matière de sécurité compte tenu de ses capacités audio et visuelles en temps réel.
"Notre équipe a travaillé dur pour trouver comment mettre en place des mesures d'atténuation contre les abus", a déclaré Murati. « Nous continuons à travailler avec différentes parties prenantes – du gouvernement, des médias, du divertissement, des équipes rouges et de la société civile – pour trouver la meilleure façon de mettre ces technologies au monde. »
Des rumeurs circulaient depuis le début du mois concernant la grande annonce d'OpenAI, allant de la sortie de GPT-5, ChatGPT équipant la nouvelle version de Siri d'Apple, et la recherche basée sur l'IA avant l'annonce prévue de Google le 14 mai. Vendredi, Bloomberg a rapporté qu'OpenAI et Apple avaient conclu un accord qui apporterait la technologie OpenAI à l'iPhone.

NOUVEAU : Apple et OpenAI devraient annoncer aujourd'hui un partenariat iPhone avec un nouvel assistant vocal alimenté par l'IA.

Vous avez tous des copines... 😅 pic.twitter.com/6dx9SxdcWE

– Radar🚨 (@RadarHits) 13 mai 2024

Le PDG d'OpenAI, Sam Altman, s'est adressé à Twitter pour calmer les eaux vendredi, en tweetant : « Pas GPT-5, pas un moteur de recherche, mais nous avons travaillé dur sur de nouvelles choses que nous pensons que les gens vont adorer ! Pour moi, c’est comme de la magie.

pas gpt-5, pas un moteur de recherche, mais nous avons travaillé dur sur de nouvelles choses que nous pensons que les gens vont adorer ! c'est comme de la magie pour moi.

lundi 10h00 HP. https://t.co/nqftf6lRL1

– Sam Altman (@sama) 10 mai 2024

Lancé en 2015 par Sam Altman, Elon Musk, Ilya Sutskever, Greg Brockman, Trevor Blackwell, Vicki Cheung, Andrej Karpathy, Durk Kingma, Jessica Livingston, John Schulman, Pamela Vagata et Wojciech Zaremba, OpenAI et son très populaire ChatGPT sont sortis en novembre. L’année 2022 a dominé les débats autour de l’IA générative.
Grâce aux liens étroits et aux investissements de Microsoft, ChatGPT et Dall-E 3 d'OpenAI ont été intégrés à la suite d'outils Office 365 de Microsoft et au nouvel assistant Copilot AI.
En mars, Musk a poursuivi OpenAI et Altman, affirmant que le développeur d'IA avait donné la priorité aux intérêts commerciaux de Microsoft plutôt qu'au bien public.

Restez au courant de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte de réception.

Tags: Twitter