DeepSeek défie ChatGPT avec une IA aussi puissante et 96 % moins chère

by La Rédaction

Dans le monde compétitif de l’intelligence artificielle, DeepSeek, une start-up chinoise, se positionne comme un rival sérieux de ChatGPT. Avec ses modèles open source DeepSeek-R1 et R1-Zero, l’entreprise propose des performances comparables à celles des modèles d’OpenAI, mais à un coût défiant toute concurrence.

Le secret de DeepSeek réside dans une approche innovante et minimaliste. La start-up, filiale de High-Flyer Capital Management, a développé ses modèles en exploitant des GPU inutilisés, limitant ainsi les coûts d’entraînement à moins de 6 millions de dollars. Comparativement, les investissements massifs d’OpenAI pour développer ses modèles se chiffrent en milliards. DeepSeek-R1, publié sous licence MIT, offre une liberté totale de modification et de commercialisation, attirant l’attention des chercheurs et entreprises.

   

Les modèles DeepSeek, basés sur des architectures Qwen et Llama, s’appuient sur un apprentissage par renforcement (RL) à grande échelle, sans ajustement supervisé, rappelant des approches comme AlphaZero. Malgré des ressources limitées, la start-up a réussi à surpasser les benchmarks d’OpenAI avec des modèles denses distillés tels que DeepSeek-R1-Distill-Qwen-32B.

Côté coûts, l’écart est vertigineux : alors que l’API d’OpenAI facture jusqu’à 60 dollars pour un million de jetons en sortie, celle de DeepSeek coûte seulement 2,19 dollars, soit une économie de 96 %. Cette accessibilité, couplée à des performances robustes, fait de DeepSeek une alternative crédible pour démocratiser l’IA générative.

   

Vous aimerez aussi