La mise à niveau du générateur d'images Ideogram AI résiste à mi-parcours et à une diffusion stable

  • Ideogram AI a publié une mise à niveau de sa plateforme pour améliorer ses capacités.
  • Ces mises à niveau incluent des fonctionnalités telles que "décrire" pour le sous-titrage d'image, l'invite négative et le contrôle de la vitesse et de la qualité d'image.
  • Ces améliorations ne sont disponibles que pour les abonnés payants, mais Ideogram reste un concurrent solide et rentable dans le domaine des générateurs d'images IA.
  • D'autres plateformes similaires existent également, mais Ideogram offre des fonctionnalités plus avancées à un prix compétitif comparé aux autres offres sur le marché.

Ideogram, un générateur d'images IA créé par d'anciens ingénieurs de Google, a publié sa première série de mises à niveau destinées à rendre la plateforme plus fonctionnelle et utilisable. Les mises à niveau ajoutent des capacités pour mieux correspondre aux offres de Stable Diffusion et Midjourney à un prix attractif.

La première version publique d'Ideogram en février a rapidement gagné en popularité parmi les passionnés d'IA en tant qu'alternative solide et performante à Midjourney, Dall-E 3 et Stable Diffusion. Les tests effectués par Decrypt ont révélé qu'il excellait en termes de compréhension rapide, de capacités de génération de texte, de conscience spatiale, d'adhésion rapide, de variété de styles, de génération de personnes et de marques et de qualité globale par rapport à d'autres générateurs d'images populaires.

« Nous sommes ravis de publier une mise à niveau majeure d'Ideogram 1.0, notre modèle texte-image le plus avancé, ainsi que plusieurs nouvelles fonctionnalités, notamment « décrire » pour le sous-titrage d'image, l'invite négative, ainsi que la qualité du rendu et le contrôle de la vitesse de l'image, » le lit-on dans l’annonce officielle.

La mise à niveau du générateur d'images Ideogram AI résiste à mi-parcours et à une diffusion stable

« Décrire » analyse une image et aide au sous-titrage ; « invite négative » indique au modèle quels éléments éviter de générer, et le rendu d'image et les contrôles de vitesse équilibrent la qualité de sortie et l'efficacité pour ceux qui préfèrent les générations rapides aux générations détaillées. Cette dernière fonctionnalité imite les modèles Turbo et LCM de Stable Difussion.

Ces mises à niveau ont cependant un problème  : elles ne sont disponibles que pour les clients payants. Les utilisateurs gratuits auront accès au modèle mais seront limités à générer jusqu'à 25 lots de 4 images chacun.

Ceux qui souhaitent essayer ces fonctionnalités peuvent passer au forfait « Basic » pour 7 $ par mois ou à l'option « Plus » pour 16 $. Les forfaits payants donnent également aux utilisateurs accès à d'autres avantages tels que les générations privées, le contrôle des semences, les capacités d'inpainting et les générations illimitées en mode lent.

La fonctionnalité « décrire » est un ajout important, en particulier pour les utilisateurs basiques. Cet assistant donne des descriptions détaillées de toute image téléchargée, qui peuvent ensuite être utilisées pour générer des invites plus précises ou plus descriptives afin de mieux correspondre à la référence dans les itérations suivantes. Les utilisateurs peuvent demander des descriptions pour n'importe quelle image du flux Ideogram ou pour leurs propres images téléchargées à partir d'un appareil local.

Ideogram permet désormais également aux utilisateurs de basculer entre trois options de rendu : rapide, par défaut et qualité. Le mode rapide donne la priorité à la vitesse et génère des images en cinq secondes environ, tandis que le mode qualité donne la priorité aux détails plus fins et génère des images en 20 secondes environ.

La fonction d'invite négative, quant à elle, étend les capacités d'édition d'Ideogram. Cet outil permet aux utilisateurs de spécifier ce qu'ils ne veulent pas voir dans leurs images générées, offrant ainsi plus de contrôle sur la sortie. Il s'agit d'une fonctionnalité particulièrement utile pour affiner les résultats de la génération texte-image, permettant ainsi des images plus précises et pertinentes dès la première prise de vue.

L'équipe affirme que la mise à niveau réduit les taux d'erreur de texte de 15 % supplémentaires par rapport à son modèle d'origine. Ideogram affirme que les critiques ont préféré les images générées par le modèle mis à niveau de 30 à 50 % de plus que la version initiale originale.

L'équipe Ideogram a annoncé pour la première fois les améliorations le mois dernier lors d'une session Discord, qui a suscité un buzz positif au sein de sa communauté d'utilisateurs.

Avec ces améliorations et les niveaux payants mensuels de 7 $ à 16 $, Ideogram est un concurrent solide et rentable pour un outil d'IA de génération d'images. À titre de comparaison, un abonnement MidJourney coûte entre 96 $ et 1 152 $ par an, un abonnement ChatGPT Plus, qui donne accès à Dall-E 3, coûte 20 $ par mois, et d'autres générateurs d'images d'IA comme Leonardo AI et Maze Guru ont des niveaux d'abonnement compris entre 10 $ et 25 $.

Pour ceux qui ne sont pas prêts à payer pour des fonctionnalités premium, le logiciel open source Stable Diffusion est gratuit et offre des fonctionnalités similaires, du moins pour les utilisateurs disposant d'ordinateurs plus puissants.