OpenAI dévoile un chatbot vocal, saluant les capacités conversationnelles du nouveau modèle d'IA GPT-4o

OpenAI, dirigé par Sam Altman, a dévoilé des illustrations en direct du modèle d'IA GPT-40 démontrant ses capacités conversationnelles. Le développeur ChatGPT a annoncé le modèle d'IA GPT-40 identifié comme GPT Omni qui a rapidement établi des comparaisons avec le compagnon virtuel du film "Her".

OpenAI publie le modèle GPT-4o

OpenAI a publié le GPT Omni où O représente Omnimodel dans une mise à jour en direct aux côtés d'autres mises à niveau de produit comportant un chatbot vocal.

Les capacités du GPT-4o à traiter plusieurs entrées simultanément illustrent des progrès considérables que les premiers outils d'IA d'OpenAI avaient du mal à maintenir sans perdre beaucoup d'informations lors du multitâche.

L'OpenAI a confirmé la mise à jour immédiate de son application mobile après le dévoilement des applications de bureau GPT-4o et ChatGPT. La société a assuré que les mises à niveau visent à améliorer l'expérience utilisateur, car elles permettent aux individus de se concentrer sur les conversations tenues avec ChatGPT.

Mira Murati, directrice de la technologie d'OpenAI, a révélé que l'équipe s'était concentrée ces dernières années sur l'amélioration de l'intelligence des modèles existants. L'exécutif a salué ces mises à niveau comme étant la première fois qu'OpenAI a réalisé un grand pas en avant pour faciliter son utilisation.

Le livestream a réitéré l’approche simplifiée et holistique de l’IA générative. L'omnimodèle, généralement identifié comme multimodal, implique un système qui exécute tout dans l'application principale plutôt que de coordonner GPT pour le texte et GPT Visions pour les images.

Murati a noté que la mise à niveau donnera une sensation intuitive lors de l'expérience des capacités technologiques. En tant que telle, l’équipe souhaitait associer le GPT-4o à une compréhension plus large.

Murati a assuré la disponibilité de GPT-4o à tous les utilisateurs de ChatGPT et de l'API de ChatGPT. L'exécutif a précisé que les abonnés ChatGPT payants accéderont au système avec une capacité cinq fois supérieure à celle des utilisateurs gratuits.

Murati a affirmé la détermination d'OpenAI à trouver des moyens de réduire les frictions, comme cela a été observé lors de l'utilisation de ChatGPT sans obliger le flux d'inscription. Elle a ajouté que depuis avril, ChatGPT 3.5 est disponible sans inscription au compte.

Capacités du chatbot vocal OpenAI

OpenAI a démontré la mise à niveau des capacités améliorées de ChatGPT pour effectuer des conservations en temps réel. La démo présentait le chatbot échangeant des tons, des émotions, des chants, des blagues et des rires avec les ingénieurs d'OpenAI.

OpenAI a ajouté que ChatGPT est capable de déterminer l'état émotionnel de l'utilisateur via la caméra frontale. Le billet de blog de l'entreprise détaille une série de développements majeurs visant à une interaction naturelle entre l'homme et la machine.

Les annonces du produit Spring indiquaient que le modèle GPT-4o acceptait les entrées de texte, d'audio et d'image tout en générant des sorties similaires. Il s'est avéré capable de répondre à des entrées audio de 232 millisecondes et d'une moyenne de 320 millisecondes, ce qui correspond au temps de réponse humain lors d'une conversation.

Avant ces annonces, les passionnés de technologie et d'IA avaient indiqué qu'un chatbot vocal piloté par le modèle d'IA de nouvelle génération attirerait des compagnons personnels illustrés dans le film de science-fiction Her.

Les ingénieurs d'OpenAI ont illustré la copie du code du logiciel à l'aide de l'application de bureau ChatGPT. L'équipe a facilité la discussion avec ChatGPT sur la discussion du code et l'exécution de traductions en temps réel dans 20 langues.

La démo présentait ChatGPT expliquant un problème mathématique suite à la soumission de l'équation à l'application.

Controverse sur les Deepfakes générés par l’IA

OpenAI a réfléchi à son engagement à lutter contre l'exploitation de ses outils dans la création de deepfakes générés par l'IA. La société a admis que le GPT-4o apporte de nouveaux défis en matière de sécurité grâce à ses capacités audio et visuelles améliorées en temps réel.

Murati a souligné l'engagement de l'équipe OpenAI à mettre en place des mesures d'atténuation contre l'utilisation abusive des outils. L'exécutif a confirmé avoir engagé plusieurs parties prenantes sur la manière de mettre les technologies au monde de manière responsable.

L'annonce d'OpenAI a mis fin à une circulation d'un mois de rumeurs prédisant la sortie de GPT-5, la recherche Google basée sur l'IA et le fonctionnement de Siri d'Apple. Une publication de Bloomberg du vendredi 10 mai indique qu'OpenAI se rapproche d'un accord portant les outils de la société dirigée par Altman sur l'iPhone.

Le directeur général d'OpenAI a minimisé les rumeurs en excluant le moteur de recherche et la version GPT-5. Au lieu de cela, il a promis un nouveau produit interne qui offrira une expérience magique aux utilisateurs.

Tokenhell produit une exposition de contenu pour plus de 5 000 sociétés de cryptographie et vous pouvez également en faire partie ! Contactez à [email protected] si vous avez des questions. Les crypto-monnaies sont très volatiles, effectuez vos propres recherches avant de prendre une décision d'investissement. Certaines des publications sur ce site Web sont des publications d'invités ou des publications payantes qui ne sont pas écrites par des auteurs de Tokenhell (à savoir Crypto Cable, articles sponsorisés et contenu des communiqués de presse) et les opinions exprimées dans ces types de publications ne reflètent pas les vues de ce site Web. Tokenhell n'est pas responsable du contenu, de l'exactitude, de la qualité, de la publicité, des produits ou de tout autre contenu ou bannières (espace publicitaire) affichés sur le site. Lisez l'intégralité des termes et conditions / clause de non-responsabilité.

Tags: cryptographie, niveau