DeepSeek met l'IA générative "open source" au coeur de la course technologique

L'agent conversationnel R1 de la start-up chinoise DeepSeek, qui a stupéfié le secteur par sa capacité à égaler ses concurrents américains à un coût, selon l'entreprise, très inférieur, met en lumière le choix de modèles ouverts, face aux modèles alternatifs fermés d'OpenAI (ChatGPT) et google.

Le point sur cette philosophie loin d'être nouvelle dans la tech.

C'est quoi l'"open source" ou code source ouvert?

Quand un logiciel est en "open source", l'accès à son code de programmation est libre: les développeurs doivent avoir "tous les éléments pour pouvoir le reproduire, le modifier, le reconstruire et l'adapter", détaille Michel-Marie Maudet, directeur général de Linagora, un éditeur de logiciels libres français.

Les promoteurs de l'"open source" s'opposent historiquement aux entreprises qui veulent protéger leur propriété intellectuelle et source de revenus.

Certaines technologies fondamentales d'internet, comme le système d'exploitation Linux, le navigateur internet Firefox et le serveur web Apache, sont ouvertes.

Mais ces programmes à code source ouvert peuvent être plus difficiles à manier pour les non initiés, nécessitent une communauté d'utilisateurs investie pour être maintenus et sont peu viables financièrement.

DeepSeek... et les autres

Le chinois R1 offre de nombreuses fonctionnalités: écrire des paroles de chansons ou proposer une recette en fonction de ce qu'il y a au réfrigérateur.

Comme ses concurrents occidentaux, à l'instar de ChatGPT, Llama ou Claude, DeepSeek s'appuie sur un grand modèle de langage (LLM), formé à partir d'immenses quantités de textes.

Mais à l'inverse des produits d'OpenAI ou d'Anthropic, des sociétés comme le géant américain Meta, la Française Mistral AI et le chinois DeepSeek laissent les développeurs télécharger et utiliser gratuitement leurs modèles.

Ils permettent également à d'autres start-up de s'en servir pour développer leurs propres modèles... une opportunité dont s'est saisi R1.

"DeepSeek a bénéficié de la recherche en source ouverte", a écrit sur Threads Yann LeCun, directeur scientifique pour l'IA chez Meta.

"Ils ont trouvé de nouvelles idées et les ont développées en s'appuyant sur le travail d'autres personnes".

Vraiment ouverts ?

Appliqué à l'IA, le terme "open source" est "très mal utilisé", tempère Michel-Marie Maudet.

La plupart des modèles qui se réclament de cette philosophie donnent "un accès plus ou moins restreint au code source et à la recette de construction du modèle".

Thomas Wolf, cofondateur de la plateforme d'IA en accès libre franco-américaine Hugging Face, souligne à l'AFP que si "la sortie de DeepSeek-R1 est une formidable opportunité pour la communauté +open source+, tout n'a pas été publié", à commencer par "les jeux de données et le code utilisés pour l'entraîner".

Des plateformes totalement ouvertes existent, mais sont plus confidentielles, comme Bloom, née de l'initiative BigScience, ou plus récemment l'agent conversationnel Lucie, IA française développée par Linagora qui a connu des déboires à son lancement.

"Outil géopolitique"

"En mettant ses modèles de langage à la disposition du public, DeepSeek permet à d'autres chercheurs de créer des applications d'IA et de réaliser des innovations qui n'étaient auparavant possibles que dans les laboratoires de grandes entreprises", s'enthousiasme Wolfgang Meyer, professeur associé en science et technologies à l'Université d'Australie du sud.

"Le fait qu'il y ait cette communauté mondiale qui coopère permet d'être plus rapide, plus nombreux et plus fort", abonde Michel-Marie Maudet, qui entend bien s'inspirer des "quelques bonnes recettes très intelligentes" appliquées par DeepSeek pour "la future génération" des modèles de Linagora.

DeepSeek représente "la puissance de l'open source en action", observe Thomas Wolf, qui dénombre déjà près de 700 modèles dérivés du modèle chinois sur sa plateforme et "une multitude d'entreprises, de chercheurs et d'utilisateurs qui s'approprient ce modèle (...) l'adaptent et le testent sur de nouveaux cas d'usage".

Pour Michel-Marie Maudet, l'arrivée tonitruante de la Chine dans la course à l'IA générative via un modèle ouvert montre aussi "une volonté de réponse aux grands modèles fermés" américains.

De plus, "l'open source est un outil parmi d'autres d'influence géopolitique et géostratégique", fait-il valoir, et ouvrir son utilisation permet de "créer le buzz" et d'assurer une publicité mondiale.

Surtout, il place DeepSeek "parmi les éléments fondamentaux dont il faut disposer" pour créer de la valeur puisque "l'économie de l'IA générative" se trouve dans "les applications qui vont tirer parti de cette technologie-là".

kf-tgb/jub/may/LyS