Nvidia : Ses nouveaux GPU seraient les plus rapides pour DeepSeek AI
Cette semaine, la capitalisation boursière de Nvidia a subi la plus grosse perte de capitalisation boursière en une journée. Une perte qui serait largement attribuée à l’entreprise DeepSeek. Cette dernière a déclaré que son nouveau modèle de raisonnement R1 ne nécessitait pas de matériel Nvidia puissant pour atteindre des performances comparables au modèle o1 d’OpenAI. Ce qui permettrait à l’entreprise chinoise de former son modèle R1 à un coût nettement inférieur.
Nvidia présente ses nouveaux GPU RTX série 50
Cependant, Nvidia a récemment vanté les performances des modèles d’IA open source de DeepSeek sur ses nouveaux GPU RTX série 50. Selon l’entreprise américaine, ils peuvent « exécuter la famille des modèles distillés DeepSeek plus rapidement que tout ce qui existe sur le marché des PC ».
Néanmoins, DeepSeek a entraîné ses modèles à l’aide des GPU les plus faibles (H800) de Nvidia. De ce fait, l’entreprise chinoise semble montrer que les meilleures puces de Nvidia ne sont pas nécessaires pour faire des progrès dans l’IA.
Pour Nvidia, ses nouveaux GPU seraient mieux pour DeepSeek R1
Dans son billet de blog, Nvidia affirme que ses nouveaux GPU RTX de la série 50 peuvent être utiles pour l’inférence R1. Autrement dit, ce qu’un modèle d’IA génère réellement. Les GPU bénéficieraient de la « même architecture GPU Nvidia Blackwell qui alimente l’innovation de pointe en matière d’IA dans les centres de données ». Elle ajoute également que « RTX accélère pleinement DeepSeek, offrant des performances d’inférence maximales sur les PC ».
Quoi qu’il en soit, d’autres entreprises technologiques essaient également de surfer sur le succès de DeepSeek. Actuellement, R1 est disponible sur AWS. De plus, Microsoft l’a rendu disponible sur sa plateforme Azure AI Foundry et GitHub cette semaine. Bloomberg rapporte néanmoins que Microsoft et OpenAI mènent une enquête pour savoir si DeepSeek a volé ou non des données d’OpenAI.