Ce que nous savons jusqu'à présent sur Sora d'OpenAI

  • Sora est le nouveau modèle d'IA d'OpenAI pour générer des vidéos à partir d'invites textuelles.
  • Il peut créer des scènes réalistes et imaginatives, mais présente encore quelques défauts dans sa simulation de physique et de détails spatiaux.
  • Pour l'instant, Sora n'est pas accessible au grand public et n'est utilisé que par un nombre limité de créateurs sélectionnés par OpenAI.

Hier, OpenAI – le créateur de ChatGPT – a annoncé Sora, et il a pris d'assaut Internet. Sora est le nouveau modèle d'IA de l'entreprise visant à générer des vidéos à partir d'invites textuelles.

C'est probablement la raison pour laquelle vous avez vu un grand nombre de vidéos de haute qualité sur Twitter au cours des dernières 24 heures.

co/CDr4DdCrh1

accès à un nombre limité de créateurs travail incroyable de leur part et de l'équipe.

Ce que nous savons jusqu'à présent sur Sora d'OpenAI

moment remarquable.

La publication a vu certaines des personnalités Internet les plus populaires s'engager, notamment, mais sans s'y limiter, Marques Brownlee, MrBeast, Elon Musk et bien d'autres.

est Sora et ce que nous savons jusqu'à présent.

Qu’est-ce que Sora ?

Si ChatGPT est le modèle basé sur le chat d'OpenAI, Sora est le « modèle d'IA de l'entreprise qui peut créer des scènes réalistes et imaginatives à partir d'instructions textuelles ».

Essentiellement, il s'agit d'un texte vers une vidéo. Vous lui donnez des instructions et il produit une vidéo censée être de haute qualité et durer jusqu'à une minute.

Il y a déjà eu de nombreux exemples. Par exemple, MrBeast a répondu au tweet d'introduction de Sam Altman, lui demandant de créer une vidéo d'un « singe jouant aux échecs dans un parc ».

Voici à quoi ressemblait la vidéo de fin  :

la vidéo semble bien réalisée.

Le site officiel donne l'explication suivante du modèle et des intentions d'OpenAI pour celui-ci  :

Nous apprenons à l'IA à comprendre et à simuler le monde physique en mouvement, dans le but de former des modèles qui aident les gens à résoudre des problèmes nécessitant une interaction dans le monde réel.

Un rapport technique détaillé est également publié sur le site Web. Les utilisateurs peuvent trouver plus d’informations ici.

Et après?

OpenAI admet que Sora, dans sa version actuelle, n'est pas sans défauts  :

Il peut avoir du mal à simuler avec précision la physique d’une scène complexe et ne pas comprendre des cas spécifiques de cause à effet. Par exemple, une personne peut mordre dans un cookie, mais par la suite, le cookie peut ne pas avoir de marque de morsure.

De plus, les détails spatiaux d’une invite peuvent également être confondus – il peut mélanger gauche et droite et trouver des complications avec d’autres descriptions précises.

L'équipe a également déclaré qu'elle était en train de créer un ensemble d'outils pour aider à détecter les contenus trompeurs.

Sora est-il accessible au public ?

Nous commençons par la première et principale question que se posent peut-être la plupart des utilisateurs de ChatGPT.

Pour être le plus précis possible – non, Sora n’est pas encore accessible au grand public. Altman a expliqué que l'outil de génération de texte en vidéo n'est actuellement entre les mains que d'un certain nombre de créateurs.

Il n’y a pas de calendrier précis quant à la date à laquelle le modèle sera déployé auprès du grand public.

OFFRE SPÉCIALE (Sponsorisée)