Phi-3 Mini : quel est ce nouvel SLM de Microsoft ?
Microsoft a récemment annoncé un petit modèle de langage d’intelligence artificielle. Dénommé Phi-3 Mini, il s’agit d’un SLM ou petit modèle de langage, capable d’effectuer diverses tâches rédactionnelles. Par exemple, rédiger des publications sur les réseaux sociaux ou encore créer du contenu avec peu d’informations à disposition.
D’après Microsoft, son nouveau modèle léger Phi-3 Mini est capable de surpasser des modèles jusqu’à dix fois plus grands que lui lorsqu’il est testé pour une gamme de critères. Il peut s’agir de capacités de codage, de mathématiques ou encore de langage.
Un modèle de langage d’IA inspiré des livres pour enfants
Dans un document de recherche, Microsoft révèle que Phi-3 Mini est conçu pour fonctionner sur les smartphones et autres appareils locaux. Il s’agit du premier des trois petits modèles de langage Phi-3 que l’entreprise lancera prochainement. Par ailleurs, Phi-3 Mini débarquerait avec 3.8 milliards de paramètres.
Microsoft déclare dans le document de recherche que « l’innovation réside entièrement dans notre ensemble de données pour la formation ». L’ensemble de données en question serait basé sur le modèle Phi-2. Toutefois, il utilise aussi « des données Web et des données synthétiques fortement filtrées ». Selon The Verge, l’équipe de Microsoft aurait été inspirée par des livres pour enfants qui utilisent un langage plus simple pour aborder des sujets complexes.
Phi-3 Mini rivaliserait avec GPT-3.5
Par ailleurs, même si Phi-3 Mini ne peut pas produire les résultats des LLM basés sur le cloud, il surpasserait Phi-2 et d’autres SLM comme Mistral, Gemma et Llama-2-In dans des tâches allant des mathématiques à la programmation et même les tests académiques. Selon Engadget, Phi-3 Mini peut fonctionner sans connexion Internet sur les smartphones.
Eric Boyd, vice-président de Microsoft Azure AI Platform, a souligné que le Phi-3 Mini pouvait rivaliser avec des LLMs comme GPT-3.5. Ce modèle d’IA de Microsoft offrirait une puissance d’IA substantielle dans un « facteur de forme plus petit ». Microsoft se tourne ainsi vers des modèles moins coûteux à exploiter et mieux adaptés aux appareils personnels.
Mis à part Microsoft, d’autres entreprises comme Google et Anthropic se dirigent également vers l’adoption plus large de modèles d’IA plus petits. La raison en est qu’ils sont plus adaptables et plus économiques.