Apple lance 8 petits modèles de langage d'IA pour rivaliser avec le Phi-3 de Microsoft

Constatant la force du nombre, Apple a pris une décision stratégique sur le marché compétitif de l’intelligence artificielle en proposant huit petits modèles d’IA. Collectivement appelés OpenELM, ces outils compacts sont conçus pour fonctionner sur des appareils et hors ligne, parfaits pour les smartphones.
Publiés sur la communauté d'IA open source Hugging Face, les modèles sont proposés en versions à 270 millions, 450 millions, 1,1 milliard et 3 milliards de paramètres. Les utilisateurs peuvent également télécharger OpenELM d'Apple dans des versions pré-entraînées ou optimisées pour les instructions.
Les modèles pré-entraînés fournissent une base sur laquelle les utilisateurs peuvent affiner et développer. Les modèles adaptés aux instructions sont déjà programmés pour répondre aux instructions, ce qui les rend plus adaptés aux conversations et aux interactions avec les utilisateurs finaux.
Bien qu'Apple n'ait pas suggéré de cas d'utilisation spécifiques pour ces modèles, ils pourraient être appliqués pour exécuter des assistants capables d'analyser les e-mails et les SMS, ou de fournir des suggestions intelligentes basées sur les données. Il s’agit d’une approche similaire à celle adoptée par Google, qui a déployé son modèle Gemini AI sur sa gamme de smartphones Pixel.
Les modèles ont été formés sur des ensembles de données accessibles au public, et Apple partage à la fois le code de CoreNet (la bibliothèque utilisée pour former OpenELM) et les « recettes » de ses modèles. En d’autres termes, les utilisateurs peuvent inspecter la façon dont Apple les a construits.
La sortie d'Apple intervient peu de temps après que Microsoft a annoncé Phi-3, une famille de petits modèles de langage capables de s'exécuter localement. Phi-3 Mini, un modèle de 3,8 milliards de paramètres formé sur 3,3 billions de jetons, est toujours capable de gérer 128 000 jetons de contexte, ce qui le rend comparable à GPT-4 et battant Llama-3 et Mistral Large en termes de capacité de jetons.
Étant open source et léger, Phi-3 Mini pourrait potentiellement remplacer les assistants traditionnels comme Siri d'Apple ou Gemini de Google pour certaines tâches, et Microsoft a déjà testé Phi-3 sur un iPhone et a rapporté des résultats satisfaisants et des générations rapides de jetons.
Bien qu'Apple n'ait pas encore intégré ces nouvelles capacités de modèle de langage d'IA dans ses appareils grand public, la prochaine mise à jour d'iOS 18 devrait inclure de nouvelles fonctionnalités d'IA qui utilisent le traitement sur l'appareil pour garantir la confidentialité des utilisateurs.
Le matériel Apple présente un avantage dans l'utilisation de l'IA locale, car il combine la RAM de l'appareil avec la RAM vidéo GPU (ou VRAM). Cela signifie qu'un Mac doté de 32 Go de RAM (une configuration courante sur un PC) peut utiliser cette RAM comme s'il s'agissait d'une VRAM GPU pour exécuter des modèles d'IA. En comparaison, les appareils Windows sont paralysés par la RAM et la VRAM GPU distinctes. Les utilisateurs doivent souvent acheter un puissant GPU de 32 Go pour augmenter la RAM afin d'exécuter les modèles d'IA.
Cependant, Apple est à la traîne par rapport à Windows/Linux dans le domaine du développement de l'IA. La plupart des applications d'IA tournent autour du matériel conçu et construit par Nvidia, qu'Apple a progressivement abandonné pour prendre en charge ses propres puces. Cela signifie qu'il y a relativement peu de développement d'IA native d'Apple et, par conséquent, l'utilisation de l'IA sur les produits Apple nécessite des couches de traduction ou d'autres procédures complexes.

Restez au courant de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte de réception.