JustPaste.it

La Chine talonne les Américains dans la course à l’intelligence artificielle

Alors que Donald Trump a annoncé 100 milliards de dollars d’investissements, les start-up chinoises peuvent compter sur la créativité d’ingénieurs bien formés et le soutien des autorités.

Par Simon Leplâtre

 

Lors de la conférence mondiale de l’intelligence artificielle, à Shanghaï, en Chine, le 6 juillet 2023.

Lors de la conférence mondiale de l’intelligence artificielle, à Shanghaï, en Chine, le 6 juillet 2023. WANG ZHAO / AFP

 

Dans la course à l’intelligence artificielle (IA) générative, les entreprises américaines ont pris de l’avance, mais la Chine réalise un retour remarqué : fin décembre 2024, DeepSeek, une petite start-up chinoise, a publié un modèle qui rivalise avec les meilleurs du secteur. Et pour une fraction du coût : alors que l’américain OpenAI aurait dépensé 3 milliards de dollars (2,85 milliards d’euros) pour entraîner ses différents modèles en 2024, DeepSeek affirme avoir développé le sien pour seulement 6 millions de dollars. Une prouesse en termes d’efficacité qui pose la question des limites des sanctions américaines censées empêcher les Chinois d’accéder aux puces électroniques les plus avancées pour l’IA.

Le secteur est entraîné dans une fuite en avant des moyens : dès le lendemain de son investiture, le 20 janvier, le nouveau président américain, Donald Trump, a annoncé le projet « Stargate », prévoyant 100 milliards de dollars d’investissements – et jusqu’à 500 milliards sur quatre ans – pour bâtir l’infrastructure nécessaire au développement d’OpenAI. La Chine n’est pas en reste : les gouvernements locaux rivalisent de subventions de plusieurs milliards de dollars pour tenter d’attirer les start-up de l’IA.

Un modèle capable de « raisonner »

Ces derniers mois, ByteDance, maison mère de TikTok, et Alibaba, géant du commerce en ligne, ont aussi dévoilé des modèles performants. Mais c’est DeepSeek qui continue de marquer les esprits : le 20 janvier, la start-up détenue par High-Flyer, une société de gestion de fortune, lançait un nouveau programme, encore plus performant, DeepSeek-R1, rivalisant avec le récent modèle d’Open AI, o1 (sorti début septembre 2024), censé être capable de « raisonner », pour résoudre des tâches plus complexes. « Le simple fait que ce modèle, très compétitif, ait coûté seulement 6 millions de dollars est incroyable », commente Jeffrey Ding, spécialiste des politiques d’innovation chinoises à l’université Georgetown, à Washington.

 

Un beau retournement de situation pour des chercheurs chinois qui, lors de la sortie de ChatGPT en 2022, se posaient des questions existentielles : pourquoi le pays, qui paraissait si avancé dans d’autres domaines de l’IA comme la reconnaissance faciale ou la conduite autonome, était-il en retard sur les modèles de langage comme celui d’OpenAI ? Les géants chinois du secteur, Alibaba, Tencent, Baidu et ByteDance, semblaient en retrait. Et ce malgré un ambitieux plan du gouvernement lancé dès 2017, et qui visait à faire de la Chine le premier centre d’innovation en la matière d’ici à 2030.

 

Quand ces géants de la tech ont publié leurs premières applications concurrentes à ChatGPT, les autorités chinoises se sont empressées de réguler le secteur, imposant aux modèles chinois « d’incarner les valeurs fondamentales du socialisme » dans leurs réponses. De fait, DeepSeek ne répond pas aux questions sensibles touchant à la Chine. Parfois, on peut même assister à la censure en acte : le robot conversationnel propose une réponse, éventuellement critique des autorités chinoises, qui disparaît pour être remplacée par le message : « Parlons plutôt d’autre chose. »

« Contrôle de l’information »

« On sait que les modèles chinois ont été entraînés pour éviter de répondre à certaines questions, sur [le massacre de 1989 de la place] Tiananmen ou sur la répression des Ouïgours. Et dans la mesure où les gens sont amenés à utiliser de plus en plus fréquemment ces modèles, cela peut devenir une véritable opération de désinformation », met en garde Ritwik Gupta, spécialiste des questions de régulation de l’IA à l’université de Californie, à Berkeley.

 

Qu’importe, pour les informaticiens qui demandent simplement à DeepSeek de leur écrire du code. Aujourd’hui, le programme le plus utilisé par les développeurs dans le monde est déjà chinois, il s’appelle Qwen 2.5, création d’Alibaba. Comme celui de DeepSeek, il est en « sources ouvertes », permettant à tous les développeurs de réutiliser son code librement. « Les grands groupes ne vont pas se ruer sur l’IA générative chinoise car cela pose un problème de protection des données, nuance Jean-Dominique Séval, fondateur de Topos, un cabinet qui conseille les entreprises sur l’adoption des nouvelles technologies. Mais les petites entreprises, et les pays en développement, peuvent s’en emparer », estime-t-il.

 

Pour Ritwik Gupta, le retour en force de jeunes pousses chinoises n’a rien d’étonnant, tant le pays a produit d’excellents spécialistes. Nombre d’entre eux, installés aux Etats-Unis, ont d’ailleurs contribué aux réussites américaines dans ce domaine. « C’était une question de temps avant qu’ils rassemblent les ressources et collectent les données pour entraîner un modèle performant, estime le chercheur. Je pense qu’ils ont la meilleure réserve de développeurs, ce qui les place en position favorable sur le long terme. »

Un pied de nez aux sanctions américaines

Car ce que DeepSeek a montré, c’est que, dans la course à l’IA, les logiciels sont largement aussi importants que la puissance de calcul. Un pied de nez aux sanctions américaines visant à empêcher le régime chinois de rivaliser dans un secteur qui peut avoir des applications militaires. Depuis 2022, les Etats-Unis interdisent l’exportation vers la Chine des meilleures puces électroniques, développées par Nvidia, les A100. L’entreprise californienne s’est adaptée en proposant des puces un peu moins puissantes au marché chinois, les A800, sur lesquelles DeepSeek affirme avoir entraîné son modèle. Depuis, Washington n’a cessé d’étendre les sanctions, qui touchent désormais aussi les A800, et les équipements qui permettraient à la Chine de fabriquer ses propres puces. « Je pense qu’en réponse à ces sanctions, les entreprises chinoises ont été forcées d’optimiser leurs logiciels et de trouver des solutions innovantes », commente le spécialiste des politiques d’innovation chinoises Jeffrey Ding.

Malgré ces innovations, la puissance reste un facteur-clé, de l’aveu même du patron de High- Flyer, propriétaire de DeepSeek, Liang Wenfeng : « Pour nous, le problème n’est pas l’argent, le problème, c’est l’interdiction de l’accès aux puces avancées », déclarait-il au média chinois 36Kr, en juillet 2024. De quoi valider l’approche de l’administration américaine. « Je pense que, du point de vue des Etats-Unis, les succès chinois sont un argument en faveur de contrôles stricts des exportations, car c’est le seul moyen de pression dont ils disposent », estime encore Jeffrey Ding. Autrement dit, sans les sanctions, les Chinois feraient encore mieux.

 

Lire aussi :
Lire aussi : Article réservé à nos abonnés En Chine, le robot conversationnel ChatGPT fait des envieux
Lire plus tard
Article réservé à nos abonnés En Chine, les robots conversationnels au diapason des « valeurs socialistes »
Lire plus tard