Grok, l’IA générative d’Elon Musk, pourrait bientôt devenir multimodal
La start-up xAI d’Elon Musk, xAI, multiplierait les efforts pour améliorer Grok, sa technologie générative accessible en open source. En effet, des documents destinés aux développeurs ont révélé que l’IA permettra bientôt aux utilisateurs de télécharger des photos et de recevoir des réponses textuelles.
Grok-1.5 Vision tiendrait tête aux autres LLM
La société a déclaré dans un article de blog publié en avril que Grok-1.5V offrirait « des modèles multimodaux dans un certain nombre de domaines ». Grok-1.5V, ou Grok 1.5 Vision, est une version améliorée de Grok, avec des capacités de traitement optimisées. Cela lui permettrait de résoudre des tâches plus complexes.
Apparemment, ce modèle peut travailler des photos, des diagrammes, des schémas et des images. D’ailleurs, Grok 1.5 Vision disposerait de meilleures performances par rapport aux modèles de langage multimodal développés par d’autres entreprises.
Les documents destinés aux développeurs montrent un exemple de script montrant comment les développeurs peuvent utiliser la bibliothèque de kit du développement logiciel xAI pour générer une réponse basée à la fois sur du texte et sur des images. Ce script lit un fichier image, configure une invite de texte et utilise le SDK xAI pour générer une réponse.
Que sait-on sur Grok et la start-up xAI ?
Pour rappel, xAI a présenté Grok pour la première fois en novembre 2023 et ce chatbot est actuellement disponible pour les abonnés au service Premium Plus du réseau social X. La dernière mise à jour de cette IA s’est faite en mars et portait le nom de « Grok 1.5 », avec des capacités de raisonnement améliorées.
Un article de blog sur X indique que le modèle est formé « sur une variété de données textuelles provenant de sources accessibles au public sur Internet jusqu’au troisième trimestre 2023 et sur des ensembles de données examinés et organisés par des évaluateurs humains ». Le blog ajoute également que Grok-1 n’a pas été formé sur les données du réseau social X. Toutefois, cette IA possèderait une « connaissance du monde en temps réel », y compris sur les publications du réseau social.
Rappelons également que xAI est une start-up fondée par Elon Musk en mars 2023. Etant relativement nouvelle dans le domaine de l’intelligence artificielle, elle n’est pas encore pressentie comme une rivale d’OpenAI. Cependant, l’entreprise d’Elon Musk a déclaré dans un article de blog que Grok 1.5 a déjà réduit l’écart avec GPT-4 sur divers critères. En tout cas, les chatbots conversationnels multimodaux semblent être la prochaine frontière de l’IA, avec Gemini, GPT-4o pour OpenAI et Grok-1.5V pour xAI.