ESTHÉTIQUE
SIMPLICITÉ
EFFICACITÉ

Aneartiste sur deviantartAneartiste sur bluesky Aneartiste sur scoop-it

La guerre des IA

Silicon Panic

Tout le monde a entendu parler du phénomène "Deepseek", l'équivalent chinois de ChatGPT. Il fut assez cocasse d'entendre Sam Altman, le patron d'OpenAI s'offusquer hypocritement du fait qu'un fonds spéculatif chinois ait pu faire un usage non autorisé de ses propres modèles de chatbot, dont ChatGPT, pour entraîner un nouveau petit projet annexe, moins cher, plus ouvert et sans doute plus rentable. Un reproche pas si éloigné des accusations adressées en 2023 à OpenAI par l'équivalent italien de la CNIL pour avoir exploité les données personnelles des utilisateurs du chatbot sans base légale, ni responsable identifié, et hors de toute charte de respect du droit à la vie privée des personnes…

Sam Altman,Sam Altman/CaptureSam Altman/Capture

Une bacchanale de dépenses…

Une pratique courante dans ce domaine puisque les IA ont besoin de données pour s'entraîner, et ne sont guère disposées à débourser un centime pour accéder aux milliers de gigaoctets de data nécessaires à leur entraînement. Dans cette affaire, OpenAI a été condamné le mois précédent, mais le voleur accepte mal d'être volé à son tour par un concurrent plus malin. L’accusation d’OpenAI contre DeepSeek relève d’une catégorie quelque peu différente. Elle implique un processus courant dans le monde de l’IA connu sous le nom de "distillation", soit utiliser les résultats générés par une IA pour en entraîner une autre. Quant à savoir si piller les ressources d'un voleur plutôt que de s'emparer directement des données personnelles sans accord préalable des intéressés présente un aspect plus éthique reste à débattre. Pour se défendre, les entreprises misent en cause s'appuient d'ailleurs sur la notion d'usage équitable, une exception à la loi sur le droit d'auteur qui autorise l'utilisation de matériel protégé à des fins « telles que la critique, le commentaire, le reportage d'actualité, l'enseignement, les études et la recherche ». Une définition si vague qu'elle reste ouverte à toutes les interprétations.

Ce qui s'est joué en réalité — et ce que la bigtech tente de camoufler derrière ses protestations faussement outrées — c'est la victoire de l'ingéniosité face à la puissance brute et orgueuilleuse de l'argent facile. Les pontes de l'IA, comme à leur habitude, plus prompts à donner des leçons qu'à les suivre, gonflés de supériorité vantarde, pensaient avoir suffisamment pénalisé la Chine en décrétant, dés 2023, un embargo sur les puces informatiques dernière génération. Ils auraient pourtant pu s'appliquer la devise martelée à longueur de TED talks par les entrepreneurs stars : « La contrainte peut être une opportunité ». Tandis que Trump, fidèle à sa mégalomanie galopante, décidait d’investir plus de 500 milliards de dollars dans « le plus grand projet d’infrastructure d’IA de l’histoire », cofinancé avec le concours des trois grandes entreprises technologiques (OpenAI, SoftBank et Oracle) sur fond de dérégulation et de capitaux illimités afin d’ouvrir l’ « âge d’or numérique », une poignée de salariés d'une société de gestion de fonds, High-Flyer Capital Management, décident de mettre à profit les cartes graphiques inutilisées de leur entreprise, et se lancent dans l'aventure… Le résultat est probant. D'un coté, la suffisance a accouché d'un mammouth coûteux en ressources de calcul et en investissement, de l'autre, Deepseek fait tout aussi bien avec 1/10ème du coût global du premier et moitié moins de puissance de calcul.

DeepSeek,DeepSeek/CaptureDeepSeek/Capture

« ...diviser chacune des difficultés que j'examinerais, en autant de parcelles qu'il se pourrait, et qu'il serait requis pour les mieux résoudre. »
—Discours de la méthode, René Descartes


La contrainte peut être une opportunité

Aux États-Unis, le modèle économique de l'IA dépend du battage médiatique. C’est ce battage médiatique qui motive les investissements de plusieurs milliards de dollars et achète l’influence politique, y compris un siège à l’investiture présidentielle. Dans cette optique, il s'agit moins de progresser par avancées scientifiques majeures que par une stratégie de "mise à l’échelle" brutale en développant des systèmes plus grands, des ensembles de données plus volumineux et une puissance de calcul plus importante. « Les entreprises technologiques les plus puissantes des États-Unis se sont assises sur des modèles plus grands et plus désordonnés, alimentés par des centres de données tentaculaires et des milliards de dollars, une bacchanale de dépenses mettant à rude épreuve l'environnement et le réseau énergétique », écrit le critique de l'IA Edward Zitron, « sans, semble-t-il, vraiment se demander si une alternative était possible. » La petite entreprise chinoise a démontré que ce modèle de fonctionnement était désormais caduc.

Qu’est-ce qui rend DeepSeek-R1 si efficace ? Une réduction drastique des calculs redondants, une économie des ressources (comme un mécanicien utilisant uniquement les outils indispensables pour accomplir sa tâche), une décomposition précise de la chaîne de raisonnement par fragments d'étapes logiques (mode DeepThink), et un code de développement open source (en l'espace de 2 mois, 20.000 développeurs y ont contribué.) Avantage de la logique rationalisée sur la puissance de calcul brute, avantage de l'économie des moyens et des ressources, et victoire donc, d’un modèle ouvert, open source, à l'opposé des modèles propriétaire de Google ou OpenAI. DeepSeek a finalement révolutionné l'architecture des systèmes d'IA en créant des algorithmes qui communiquent comme un orchestre de jazz : peu d'instruments, un maximum d'harmonie.

publié le 04/02/2025, à 17h10 par Frédéric Schäfer

Précédentsuivant