« Strawberry » d'OpenAI pour améliorer le raisonnement de l'IA pour la résolution de problèmes complexes
Idées clés:
- « Strawberry » d’OpenAI vise à révolutionner l’IA en améliorant les capacités de raisonnement pour la résolution autonome de problèmes complexes
- « Strawberry » implique une post-formation spécialisée pour améliorer les performances du modèle d’IA dans les applications du monde réel
- Le projet vise à permettre à l’IA d’effectuer des tâches à long terme et de planifier et d’exécuter des actions sur des périodes prolongées
OpenAI, soutenu par Microsoft, développerait une nouvelle approche de l’intelligence artificielle sous le nom de code « Strawberry ». Selon des documents internes consultés par Reuters, ce projet vise à améliorer considérablement les capacités de raisonnement des modèles d’IA. Cette technologie devrait permettre à l’IA de générer des réponses à des requêtes et de planifier et de mener des recherches autonomes et fiables sur Internet.
Strawberry est en cours de développement pour répondre à un défi crucial de l’IA : la capacité à effectuer des « recherches approfondies ». Les documents décrivent cette capacité comme permettant à l’IA de résoudre des problèmes complexes à plusieurs étapes et de refléter le fonctionnement du monde physique. Les modèles d’IA actuels sont souvent insuffisants dans les domaines nécessitant du bon sens et un raisonnement logique, produisant parfois des informations incorrectes ou absurdes.
Développements internes et secret
Le projet Strawberry est étroitement surveillé au sein d’OpenAI, et les informations disponibles sont limitées, même pour les personnes travaillant au sein de l’entreprise. Une personne familière du sujet et de la documentation interne a indiqué que le projet implique un processus post-formation spécialisé. Ce processus, connu sous le nom de réglage fin, adapte les modèles de base pour améliorer les performances de manière spécifique après une formation initiale sur de grands ensembles de données.
Strawberry était auparavant connu sous le nom de Q*, ce qui était considéré comme une avancée majeure au sein de l’entreprise. Plus tôt cette année, des démonstrations de Q* ont montré la capacité du modèle à résoudre des questions scientifiques et mathématiques complexes, suggérant des progrès significatifs dans les capacités de raisonnement. Une réunion interne à OpenAI a récemment présenté une démonstration d’un projet de recherche doté de nouvelles capacités de raisonnement de type humain, bien qu’il ne soit pas encore clair s’il s’agissait de Strawberry.
Strawberry présente des similitudes avec une méthode développée à l’université de Stanford en 2022, appelée « Self-Taught Reasoner » (STaR). STaR permet aux modèles d’IA de créer de manière itérative leurs données d’entraînement, ce qui leur permet potentiellement d’atteindre des niveaux d’intelligence plus élevés. Le professeur de Stanford Noah Goodman, l’un des créateurs de STaR, a exprimé son enthousiasme et son inquiétude quant à l’orientation du développement de l’IA, soulignant les profondes implications pour la société humaine.
L’accent mis par OpenAI sur l’amélioration des capacités de raisonnement s’inscrit dans les tendances plus larges de la recherche en IA. Des entreprises comme Google, Meta et Microsoft expérimentent également des techniques pour améliorer le raisonnement de l’IA. Cependant, les avis divergent quant à savoir si les grands modèles linguistiques (LLM) peuvent efficacement intégrer des idées et une planification à long terme dans leurs prévisions. Yann LeCun de Meta a souvent déclaré que les LLM sont incapables de raisonner comme un humain.
Tâches à long terme et ensemble de données de recherche approfondie
Strawberry vise à permettre aux modèles d’IA d’effectuer des tâches à long terme (LHT), qui nécessitent la planification et l’exécution d’une série d’actions sur une période prolongée. OpenAI entraîne et évalue les modèles à l’aide d’un ensemble de données de « recherche approfondie », bien que les détails sur cet ensemble de données restent inconnus. L’objectif est que l’IA effectue des recherches Web autonomes et effectue des tâches généralement effectuées par des ingénieurs en logiciels et en apprentissage automatique.
L’accent mis par le projet sur le LHT est essentiel pour faire progresser la capacité de l’IA à gérer des processus complexes en plusieurs étapes. Ces tâches impliquent souvent de parcourir différentes étapes et de prendre des décisions basées sur des résultats intermédiaires, une capacité avec laquelle les modèles d’IA actuels ont du mal. En améliorant cet aspect, OpenAI vise à repousser les limites de ce que l’IA peut réaliser dans des applications du monde réel.
Vision et perspectives d’avenir d’OpenAI
Un porte-parole d’OpenAI a déclaré que l’entreprise souhaitait que les modèles d’IA perçoivent et comprennent le monde de la même manière que les humains. Cette recherche continue sur de nouvelles capacités d’IA est considérée comme essentielle pour les progrès de l’industrie en matière de capacités de raisonnement. Bien que le porte-parole n’ait pas directement répondu aux questions sur Strawberry, le projet représente une étape importante vers des systèmes d’IA plus avancés.
Sam Altman, PDG d’OpenAI, a souligné l’importance de la capacité de raisonnement dans l’IA, suggérant qu’il s’agira d’un domaine de progrès essentiel. Le développement de Strawberry reflète l’engagement d’OpenAI à repousser les frontières de la recherche en IA et à résoudre certains des problèmes les plus difficiles du domaine.
Crédit éditorial : Vitor Miranda / Shutterstock.com
Tokenhell produit du contenu pour plus de 5 000 sociétés de crypto-monnaies et vous pouvez également en faire partie ! Contactez-nous à [email protected] si vous avez des questions. Les crypto-monnaies sont très volatiles, effectuez vos propres recherches avant de prendre des décisions d’investissement. Certains des articles de ce site Web sont des articles invités ou des articles payants qui ne sont pas écrits par les auteurs de Tokenhell (à savoir Crypto Cable, les articles sponsorisés et le contenu des communiqués de presse) et les opinions exprimées dans ces types d’articles ne reflètent pas les opinions de ce site Web. Tokenhell n’est pas responsable du contenu, de l’exactitude, de la qualité, de la publicité, des produits ou de tout autre contenu ou bannières (espace publicitaire) publiés sur le site. Lisez les conditions générales complètes / la clause de non-responsabilité.