Amazon renforce son arsenal d'IA avec un générateur d'images pour prendre en charge Adobe et une diffusion stable


Amazon a augmenté sa mise dans le domaine de l’IA générative avec l’annonce aujourd’hui de son nouveau générateur d’images faisant partie d’Amazon Titan, le nom de la suite complète de modèles de base multimodaux (FM) désormais disponibles via Amazon Web Services.

« Les modèles Amazon Titan intègrent 25 ans d’innovation en matière d’intelligence artificielle (IA) et d’apprentissage automatique (ML) chez Amazon », a écrit Antje Bartha, formatrice en IA et ML, dans un article de blog officiel pour Amazon. « AWS a pré-entraîné ces modèles sur de grands ensembles de données, ce qui en fait des modèles puissants et polyvalents conçus pour prendre en charge une variété de cas d’utilisation tout en soutenant également l’utilisation responsable de l’IA. »

Amazon Titan Image Generator permet aux créateurs de contenu de générer des images réalistes et de haute qualité à l’aide de simples invites en anglais, ou même en utilisant d’autres images comme références. Ceci est particulièrement utile dans des secteurs d’activité tels que la publicité, le commerce électronique et les médias. Il semble bien positionné par rapport à la fonctionnalité d’IA générative du concurrent Adobe, peut-être plus granulaire mais moins intuitive.

Amazon renforce son arsenal d'IA avec un générateur d'images pour prendre en charge Adobe et une diffusion stable

La poussée de l’IA d’Amazon vante la personnalisation. Les entreprises peuvent désormais affiner ces modèles avec des données exclusives, affirme la société, ce qui leur permet de générer des images qui correspondent à leur identité de marque ou à leurs préférences stylistiques spécifiques.

En plus de ces nouveaux modèles, Amazon a également annoncé son propre Large Language Model (LLM) nommé « Q », formé aux conversations des clients avec sa gamme d’appareils intelligents Alexa. « Amazon Q fournit des informations et des conseils immédiats et pertinents aux employés pour rationaliser les tâches, accélérer la prise de décision et la résolution de problèmes, et contribuer à stimuler la créativité et l’innovation au travail », a déclaré Amazon dans une annonce rapportée par Decrypt.

Le « Q » d’Amazon n’est pas lié aux concepts « Q* » ou « Q-learning » récemment apparus par les rumeurs de développement de l’IA chez OpenAI.

La sécurité est une préoccupation majeure dans le domaine de l’IA, et Amazon en est conscient. L’équipe AWS a mis en œuvre des fonctionnalités de sécurité d’IA robustes, similaires à celles mises en œuvre par Adobe, pour atténuer les risques associés au contenu généré par l’IA. Il s’agit notamment d’une pré-formation sur des ensembles de données plus sûrs et de filigranes invisibles dans les images générées par l’IA pour lutter contre la désinformation. La prise en charge par Amazon de SDXL démontre en outre son approche globale de la technologie de l’IA et offre à ses clients plus de flexibilité si Titan ne répond pas à leurs besoins.

L’introduction récente par Amazon de modèles d’IA avancés la positionne comme un concurrent redoutable face à d’autres acteurs majeurs de l’industrie technologique qui adoptent également l’IA, générant collectivement une intensité qui rappelle la ruée vers l’or du 21e siècle.

Des tests pratiques révèlent que Amazon Titan Image Generator se distingue par son réalisme, surpassant SDXL dans ce domaine. Ce nouveau modèle offre une multitude de fonctionnalités sous une interface assez similaire à l’utilisation du A1111 pour une diffusion stable, mais il offre un solide mélange de contrôle et de polyvalence, particulièrement attrayant pour les applications professionnelles sérieuses.

Par exemple, Amazon Titan Image Generator peut créer des images sélectionnées adaptées aux besoins spécifiques de l’entreprise, offrant ainsi plus de contrôle que le modèle d’Adobe qui a tendance à être trop simpliste, voire caricatural.