Opera adopte Google Gemini pour alimenter son assistant IA de navigateur et son générateur d'images

Opera, la société à l'origine du cinquième navigateur de bureau le plus populaire, permettra aux utilisateurs de son assistant IA intégré, Aria, de générer facilement des images avec le dernier modèle de génération d'images de Google, Imagen 2.
Le projet de navigateur a annoncé mardi un accord qui alimentera également Aria avec Google Gemini pour son chatbot textuel.
"Nous sommes ravis d'annoncer l'approfondissement de cette collaboration dans le domaine de l'IA générative pour alimenter davantage notre suite de services d'IA pour navigateurs", a déclaré Per Wetterdal, responsable des partenariats chez Opera, dans un communiqué officiel, citant deux décennies de collaborations passées. .
La fonctionnalité a été rendue immédiatement disponible dans Opera Developer, la version préliminaire mais accessible au public d'Opera où les utilisateurs peuvent prévisualiser et tester les fonctionnalités à venir. La version développeur migre généralement vers Opera Beta (anciennement connue sous le nom d'Opera Next) avant de devenir finalement la prochaine version principale et stable.
Générations d'Opera Developer, Opera GX et Opera Browser.De plus, la mise à jour permet à l'IA d'Opera d'exprimer les réponses de manière conversationnelle, grâce au modèle texte-audio de Google.
Bien qu'il soit possible d'accéder à une ancienne version d'Aria sur le navigateur mobile Opera, la mise à jour basée sur Gemini n'est pas encore disponible sur les smartphones. Opera n'a pas répondu à une demande de commentaire de Decrypt.
Aria, l'assistant IA d'Opera introduit pour la première fois en mai 2023, s'appuyait sur ChatGPT d'OpenAI, mais a ensuite intégré une version affinée du mode PaLM 2 de Google. Ce modèle est désormais obsolète car Google a transféré son développement d'IA vers Gemini, un tout nouveau modèle fondamental qui alimente ses propres services d'IA. Aria d'Opera traite les commandes de l'utilisateur et décide quel modèle utiliser pour quelle tâche, Gemini ou Imagen 2.
Avec l'intégration du modèle Gemini de Google, Opera sera désormais en mesure de fournir à ses utilisateurs des réponses de meilleure qualité, comparables à celles obtenues via GPT-4. À l'heure actuelle, GPT-4o et Gemini 1.5 Pro se classent premier et deuxième dans le classement Chatbot Arena, un classement basé sur les évaluations aveugles des utilisateurs.
"Nous pensons que l'avenir de l'IA sera ouvert, c'est pourquoi nous donnons accès au meilleur de l'infrastructure, des produits, des plates-formes et des modèles de base d'IA de Google pour permettre aux organisations de tracer leur voie grâce à l'IA générative", a déclaré Eva Fors, directrice générale. de Google Cloud pour la région nordique. "Nous sommes heureux de renforcer notre coopération de longue date avec Opera en alimentant son innovation en matière d'IA dans l'espace des navigateurs."
Opera a toujours conservé son intégration préexistante avec ChatGPT (maintenant alimenté par GPT-4 et Dall-e 3) d'OpenAI. Les utilisateurs doivent simplement cliquer sur une autre icône affichée juste en dessous du bouton Aria.
Opera exploite le potentiel de l'IA des navigateurs depuis plus d'un an maintenant avec tous ses navigateurs phares, y compris son navigateur de jeu Opera GX. La société a également récemment ouvert en Islande un cluster de données d'IA alimenté par l'énergie verte et alimenté par la technologie NVIDIA DGX pour étendre rapidement son programme d'IA.

La guerre des navigateurs IA

La bataille pour dominer le marché des navigateurs a été considérablement impactée par l’intégration de l’IA. Bien que Chrome de Google reste le leader incontesté, son absence d'intégration par défaut de l'IA intégrée a laissé la possibilité à d'autres acteurs d'innover et de gagner du terrain.
Microsoft, en particulier, a misé gros sur l'IA, en remaniant son navigateur Edge, autrefois décrié, avec de nombreuses fonctionnalités basées sur l'IA. Autrefois sujet de ridicule, les utilisateurs plaisantant en disant que sa meilleure utilisation était de télécharger Chrome, Edge a connu une résurgence remarquable au cours des derniers mois.
En passant à un moteur basé sur Chromium et en intégrant des capacités d'IA, le navigateur de Microsoft a gravi les échelons, dépassant Safari d'Apple pour revendiquer la deuxième place d'ici fin 2023, selon les données de Statcounter. Ce tournant s'aligne avec l'annonce par Microsoft de son expérience Copilot unifiée le 26 septembre 2023.
Cette évolution commerciale d'Opera et de Google Cloud est importante car elle offre une alternative basée sur Google sur le marché des navigateurs basés sur l'IA. Avec l'essor de Microsoft Edge grâce à ses intégrations d'IA, la collaboration entre Opera et Google offre aux utilisateurs une option solide pour tirer parti des modèles avancés de Google au lieu de ceux d'OpenAI.

La joie du choix

Si la commodité d'exploiter les outils d'IA dans un navigateur Web vous séduit, vous avez désormais trois choix solides : Opera avec Aria de Google et Edge avec Copilot de Microsoft et Brave avec Leo, propulsé par Mistral et Anthropic.
Brave, le célèbre navigateur de crypto-monnaie, pourrait plaire aux utilisateurs soucieux de leur vie privée. Brave a intégré son propre assistant IA, Leo, directement dans son navigateur, et il peut répondre aux questions, fournir des résumés, générer du nouveau contenu, et bien plus encore. Cependant, il ne peut pas encore générer d'images.
Leo est alimenté par de grands modèles de langage comme Mixtral 8x7B, Claude Instant et Llama 2 13B. Contrairement à d'autres assistants IA, Brave héberge ces modèles sur ses propres serveurs, garantissant que les entrées des utilisateurs et les conversations avec Leo ne sont pas conservées ou utilisées pour la formation des modèles.
Entre Opera et Edge, Copilot a peut-être un avantage dans les réponses textuelles, mais les capacités Imagen 2 de Google battent Dall-E 3 en termes de réalisme et de cohérence. Lors des tests menés par Decrypt, Aria s'est également révélée plus polyvalente et créative, comprenant des invites plus courtes.
Par exemple, l'interprétation d'Aria d'une simple demande pour qu'un chien mange un hamburger était réaliste. Copilot a demandé une invite plus descriptive, créant une image moins réaliste avec une esthétique de rendu 3D seulement après avoir demandé de créer un chien avec des lunettes de soleil mangeant un hamburger.
Générations d'Aria, Copilot et Copilot après avoir étendu l'inviteSi vous utilisez Copilot dans Edge, Aria dans Opera vaut le détour, et les capacités de génération d'images de l'un ou l'autre peuvent valoir la peine d'essayer quelque chose en dehors de la bulle privée fournie par Leo dans Brave.
Edité par Ryan Ozawa.

Newsletter généralement intelligente

Un voyage hebdomadaire en IA raconté par Gen, un modèle d'IA générative.