Microsoft conçoit le Phi-3 mini pour les tâches d'IA légères
La grande entreprise technologique Microsoft (NASDAQ : MSFT) a annoncé la sortie d'un petit modèle de langage (SLM) conçu pour les tâches légères d'intelligence artificielle (IA), mettant fortement l'accent sur la rentabilité.
Dans sa déclaration officielle, Microsoft affirme que le nouveau modèle d'IA offrira aux entreprises et autres utilisateurs finaux une alternative aux grands modèles de langage (LLM) traditionnels qui nécessitent généralement une puissance de calcul importante. Surnommé Phi-3 mini, Microsoft affirme que son modèle d'IA léger démontre des capacités impressionnantes en matière de codage, de langage et de mathématiques lorsqu'il est placé côte à côte avec des modèles plus grands.
Le Phi-3 mini ne contient que 3,8 milliards de paramètres, mais il est néanmoins très performant grâce aux systèmes de formation avancés de Microsoft. En comparaison, les paramètres du GPT-4 d'OpenAI et du Llama 2 de Meta oscillent respectivement autour de 1,76 billion et 70 milliards pour les versions les plus grandes.
Les chercheurs de Microsoft se réjouissent déjà des perspectives d'acceptation généralisée des SLM. Pour commencer, la société affirme que les entreprises disposeront d’options plus larges pour s’orienter vers l’IA, mais précise que toutes les tailles de modèles d’IA peuvent coexister dans le même écosystème.
"Ce que nous allons commencer à voir n'est pas un passage du grand au petit, mais un passage d'une catégorie unique de modèles à un portefeuille de modèles où les clients ont la possibilité de prendre une décision sur le meilleur modèle pour leur scénario », a fait remarquer Sonali Yadav, chef de produit IA générative chez Microsoft.
Un autre cas d’utilisation potentiel des SML est la localisation de modèles d’appareils IA sans nécessiter de connectivité Internet. Les entreprises ou entreprises recherchant des capacités d’IA mais se méfiant des fuites de données peuvent opter pour les SML pour répondre à leurs besoins de « conserver les données dans leurs propres locaux ».
Outre des niveaux de sécurité accrus, le recours aux SML réduira la latence tout en
encourager l’adoption de l’IA dans les zones rurales, en particulier celles sans connexion Internet.
Le SLM léger fera ses débuts sur Hugging Face, Microsoft Azure AI Model Catalog et Ollama, Microsoft faisant allusion à une API interopérable.
Microsoft affirme qu'il doublera sa mise sur les SML en publiant de nouvelles versions de Phi-3 dans les mois à venir. La société envisage de publier des versions de 7 et 14 milliards de paramètres pour augmenter ses capacités sans exiger une puissance de calcul excessive.
À corps perdu dans l’IA
La dernière offre d'IA de Microsoft s'appuie sur ses expériences précédentes avec des modèles d'IA légers, culminant avec la sortie de Phi-1 et Phi-2 en 2023. Impressionnée par la « puissance surprenante » des SML, la grande entreprise technologique a planté ses talons avec des modèles d'IA plus petits. .
La société a conclu des accords de partenariat avec des acteurs de premier plan du secteur, notamment le G42 des Émirats arabes unis, Vodafone et KPMG. D'autres accords très médiatisés voient Microsoft investir dans le secteur des technologies émergentes en Australie, au Royaume-Uni et aux États-Unis pour approfondir le vivier de talents et améliorer les capacités du cloud.
Pour que l'intelligence artificielle (IA) fonctionne dans le respect de la loi et prospère face à des défis croissants, elle doit intégrer un système de blockchain d'entreprise qui garantit la qualité et la propriété de la saisie des données, lui permettant ainsi de protéger les données tout en garantissant également l'immuabilité. de données. Consultez la couverture de CoinGeek sur cette technologie émergente pour savoir pourquoi la blockchain d'entreprise sera l'épine dorsale de l'IA.
Regarder : Comment la blockchain gardera l'IA honnête
Nouveau sur la blockchain ? Consultez la section Blockchain pour les débutants de CoinGeek, le guide de ressources ultime pour en savoir plus sur la technologie blockchain.
