Je vaiscommencer là où la plupart des articles s’arrêtent, car je ne veux pas que vous vous demandiez de quoi il s’agit. Voici la conclusion : toute entreprise sérieuse exploitera sa propre IA. Elle ne la louera pas. Elle l’exploitera.
Ils utiliseront des modèles à poids ouvert et spécialisés, les déploieront au sein de leur propre infrastructure, les affineront à partir de leurs propres données et répartiront la charge de travail entre eux selon une logique qu’ils concevront et contrôleront eux-mêmes. Les laboratoires de pointe, les OpenAI et les Anthropic de ce monde, resteront exceptionnels. Ils resteront utiles. Mais ils ne seront pas le lieu où l’entreprise évoluera. Ils seront le lieu où l’entreprise se rendra.
Il ne s'agit pas ici de déterminer quel modèle est le plus intelligent. Il s'agit d'une prévision d'ordre économique. Et l'économie l'emporte toujours.
La nouveauté, c'est formidable pour un chef de petite entreprise qui a une conversation agréable avec un chatbot. Mais la nouveauté n'a jamais résisté une seule fois à l'épreuve de la rentabilité unitaire à grande échelle. Ni dans l'industrie manufacturière. Ni dans la production. Ni dans les centres de données. L'histoire de toutes les technologies industrielles suit le même schéma. Une innovation révolutionnaire fait son apparition, coûteuse et magique, puis le marché la transforme en produit de base et la concurrence s'exerce sur ce que l'on construit à partir de celle-ci. L'IA ne fera pas exception. Elle ne peut pas faire exception.
Voilà donc la thèse. Maintenant, je vais devoir la défendre.
01 · La courbe des coûts
L'économie l'emporte toujours
Regardez ce qu'il a fallu investir pour construire ces modèles, génération après génération : la courbe en dit long.
Prenons l'exemple de GPT-2, le modèle développé par OpenAI en 2019. C'est le premier que la plupart des gens reconnaîtraient comme un véritable modèle linguistique. Son apprentissage a coûté environ 43 000 dollars.1 Le GPT-3, un an plus tard, a coûté entre plusieurs centaines de milliers de dollars et quelques millions.1 C’est avec le GPT-4, en 2023, que le projet a cessé d’être une simple expérience scientifique pour devenir une véritable entreprise industrielle : environ 25 000 GPU haut de gamme fonctionnant pendant trois mois, de l’ordre de 2 × 10²⁵ opérations en virgule flottante, des dizaines de gigawattheures d’électricité, et un coût d’entraînement estimé entre 80 et 100 millions de dollars.2 Chaque avancée a nécessité environ quatre à cinq fois plus de puissance de calcul que la précédente.
Figure 1 · Coût d'un cycle d'entraînement « frontier » unique
Du prix d'une voiture d'occasion à celui d'un porte-avions
Notez l'échelle logarithmique. Chaque ligne sur l'axe correspond à un bond de 10 fois. Nous sommes passés d’environ 43 000 dollars à une prévision de 10 milliards de dollars en moins d’une décennie. * Les chiffres pour 2027–2028 sont des prévisions ; le seuil du milliard de dollars d’ici 2027 est prévu par Epoch AI, et le chiffre de 10 milliards de dollars d’ici 2028 est celui avancé par Dario Amodei, PDG d’Anthropic. Sources 1 à 4.
Cette courbe ne s’est pas ralentie. Elle s’est accélérée. Les cycles d’entraînement de pointe de 2026 se situent dans une fourchette de 200 à 500 millions de dollars pour un modèle haut de gamme. Les chercheurs du secteur prévoient le premier cycle d’entraînement d’un milliard de dollars d’ici 2027,³ et le PDG d’Anthropic lui-même a déclaré que l’entraînement des modèles de pointe pourrait coûter 10 milliards de dollars d’ici 2028.4 En l’espace d’une dizaine d’années, nous sommes passés du prix d’une voiture d’occasion à celui d’un porte-avions.
C'est cette approche « à la force brute », qui repose sur des clusters plus puissants, davantage de gigawatts et des investissements plus importants, que les laboratoires américains ont choisie. Elle permet de produire des modèles époustouflants. Mais elle s'accompagne d'une structure de coûts que quelqu'un devra, tôt ou tard, prendre en charge.
Voici ce que l'analyse passe sous silence. Il existe deux courbes de coûts, et non une seule, et elles évoluent dans des directions opposées. Le plafond ne cesse de s'élever : la construction du modèle le plus performant devient de plus en plus coûteuse. Mais le plancher ne cesse de s'effondrer. Le coût nécessaire pour atteindre un niveau de performance donné chute de manière vertigineuse. En 2023, l'entraînement d'un modèle de type GPT-4 coûtait environ 79 millions de dollars ; d'ici 2026, la même capacité pourra être obtenue pour 5 à 10 millions de dollars.5 Ce qui relevait encore de la « frontière » il y a deux ans fait désormais partie des postes de budget d’une start-up bien financée.
Figure 2 · La divergence
Deux courbes, dans des directions opposées
Les deux courbes partent presque du même point, puis s'écartent en forme de ciseaux. Les besoins réels d'une entreprise suivent la courbe verte vers le bas. * Prévisions. Échelle logarithmique. Sources 3 à 5.
C'est cette deuxième courbe qui devrait intéresser les entreprises. Elle signifie que les capacités dont vous avez réellement besoin pour votre activité ne restent pas confinées derrière la frontière. Elles vous sont accessibles rapidement, et leur coût diminue chaque trimestre.
02 · L'élément de preuve
Le précédent chinois
Si vous voulez la preuve que c'est le prix, et non la nouveauté, qui est le moteur de ce marché, regardez du côté de la Chine.
Privés des meilleures puces de Nvidia en raison des contrôles à l’exportation américains, les laboratoires chinois ont été contraints de s’appuyer sur des puces moins chères, dont les performances étaient délibérément limitées. Incapables de rivaliser avec les Américains en termes de dépenses, ils ont dû surpasser la courbe des coûts par l’ingénierie. L'exemple le plus souvent cité est celui de DeepSeek, dont le modèle de raisonnement R1, selon un article publié dans la revue Nature après évaluation par des pairs, aurait achevé son cycle d'entraînement final sur 512 puces H800 destinées au marché d'exportation en environ 80 heures, pour un coût d'environ 294 000 dollars.6 Son modèle de base V3 a coûté environ 5,6 millions de dollars en ressources de calcul.7
Bon, je vais jouer le rôle de l'intermédiaire impartial. Ces chiffres méritent d'être nuancés : ils reflètent le coût marginal d'une seule exécution, et non le matériel stocké, les recherches préalables ou les expériences infructueuses qui se cachent derrière.7 Des questions légitimes se posent quant à la manière dont les modèles ont été entraînés et sur la base de quoi ils ont appris. La Chine, pour le dire gentiment, joue selon des règles différentes en matière de propriété intellectuelle, et la voie vers une fabrication nationale de pointe est encore loin d’être tracée.
Si l'on fait abstraction de la polémique, le message est indéniable : un modèle de classe « Frontier » a été produit pour une fraction du prix pratiqué en Occident, et offert avec des poids libres.
La réaction des marchés en disait long. Une simple annonce a fait chuter de plusieurs centaines de milliards de dollars la valeur des entreprises du secteur des puces électroniques en une seule journée. Cette contrainte n’a pas tué l’IA chinoise. Elle l’a rendue moins chère. Et « bon marché, ouvert et suffisamment performant » : c’est précisément cette combinaison qui sape de l’intérieur un modèle économique basé sur la prime.
03 · Le seuil
Ce que signifie désormais « assez bien »
Le modèle commercial « premium » repose sur une hypothèse : celle selon laquelle l'écart entre le meilleur modèle fermé et le meilleur modèle ouvert est suffisamment important et durable pour justifier la différence de prix. Cette hypothèse ne tient plus.
Selon l'indice de performance d'Epoch AI, les modèles « open-weight » accusent désormais un retard d'environ trois à quatre mois par rapport à la frontière fermée.8 Pas trois à quatre ans. Des mois. Llama, Qwen, Mistral, DeepSeek et la famille Nemotron de Nvidia égalent ou surpassent ce qui constituait il y a un an les références de la « frontière fermée ». Sur des tests de connaissances généraux comme le MMLU, les modèles ouverts et fermés ont tous deux dépassé les 91 % et l'écart a pratiquement disparu.9
Vous n'êtes pas obligé de le croire sur parole. En juin 2026, un laboratoire chinois appelé Z.ai a publié GLM-5.2, un modèle à poids ouverts que vous pouvez télécharger et exécuter vous-même sous licence MIT. Sur les benchmarks publics de codage et d’agentique, il a égalé ou surpassé GPT-5.5 et s’est approché à quelques points de Claude Opus 4.8, le modèle fermé le plus performant du moment, pour un coût d’exécution qui ne représenterait qu’une fraction de celui de ce dernier.16 Les scores sont communiqués par les fournisseurs et l’API hébergée se trouve en Chine ; il convient donc de le tester sur vos propres charges de travail avant de lui faire confiance. Mais les poids vous appartiennent et vous pouvez les exécuter sur votre propre matériel, et c’est là tout l’intérêt. Un modèle de codage de pointe, ouvert, auto-hébergable et peu coûteux. Il y a un an, cet écart était un gouffre. Cette semaine, il ne s’agit plus que de quelques points.
Figure 3 · L'écart qui se réduit
Quel est le retard de la catégorie « open weight » ? Quelques mois, pas des années.
Tendance, d'après l'indice de capacité d'Epoch AI. Le décalage s'est réduit, passant de plusieurs années à quelques mois, et a parfois même disparu complètement. Source 8.
Pour l’entreprise, c’est là tout l’enjeu. On ne gère pas son activité en se plaçant à la pointe absolue de l’innovation. On la gère en s’appuyant sur ce qui est fiable. Un modèle qui accuse un retard de trois mois par rapport à la pointe absolue, que l’on peut héberger soi-même, affiner à partir de ses propres données et exploiter au coût de la puissance de calcul, l’emporte haut la main sur un modèle à peine plus intelligent que l’on loue à l’unité, sur lequel on n’a aucun contrôle et auquel on doit confier ses informations les plus précieuses. À moins que quelqu’un ne parvienne à créer une véritable superintelligence artificielle mesurable (concept encore indéfini et non quantifié), « trois mois de retard et une exploitation libre » reste la meilleure option pour la quasi-totalité des charges de travail qui comptent.
04 · Sur la piste de l'argent
Les aspects économiques de la location
Suivons maintenant le parcours de l'argent de l'autre côté du grand livre, car c'est là que le modèle par abonnement montre ses limites.
On pourrait penser que la location, c'est très bien. Cela fait vingt-cinq ans que nous louons des logiciels. Le SaaS a démontré qu'il n'est pas nécessaire d'être propriétaire du système. On s'abonne, le fournisseur s'occupe de tout, tout le monde y gagne. Alors pourquoi l'IA serait-elle différente ?
Car la base de coûts n’est absolument pas la même. Le SaaS correspondait à des dépenses de R&D qu’un fournisseur pouvait répartir sur des milliers de clients tout en conservant des marges confortables. L’IA, c’est d’un tout autre ordre de grandeur. En 2026, quatre entreprises – Microsoft, Amazon, Google et Meta – dépenseront près de 700 milliards de dollars en investissements, dont la grande majorité sera consacrée à l’IA.14 Deux ans plus tôt, ces quatre mêmes entreprises avaient dépensé un peu plus de 200 milliards de dollars. À titre de comparaison, l’ensemble du secteur mondial des logiciels consacre , au total, environ 200 milliards de dollars par an à la R&D.15 Ainsi, en une seule année, ces quatre entreprises consacrent plus de trois fois le budget de recherche de l’ensemble du secteur des logiciels au développement de cette seule capacité. Et ces 700 milliards de dollars ne représentent que leurs dépenses d’investissement. Ce chiffre ne tient pas compte des pertes d’OpenAI et d’Anthropic, du programme Stargate (500 milliards de dollars), d’xAI, ni de la Chine.
Quelqu’un devra rentabiliser tout ça. Ce ne seront pas les fournisseurs. Ils sont déjà dans le rouge aujourd’hui. Ce sera vous, le client professionnel, à travers le prix de chaque jeton que vous louez. C’est là toute la différence. Avec le SaaS, on pouvait louer indéfiniment, car le modèle économique sous-jacent tenait la route. Là, c’est vous qui allez financer le tout. Et dès lors que vous financez un coût aussi colossal, l’achat l’emporte sur la location.
Les laboratoires d'avant-garde ne sont pas rentables. Ils en sont loin. Rien qu'au premier trimestre 2026, OpenAI a déclaré un chiffre d'affaires d'environ 5,7 milliards de dollars, contre une perte nette dépassant les 21 milliards de dollars,10 et, selon certaines estimations, perd bien plus d’un dollar pour chaque dollar de chiffre d’affaires qu’elle réalise. Elle ne prévoit pas de rentabilité avant la fin de la décennie. Anthropic, la plus rigoureuse des deux, a affiché une marge brute d’environ 40 % en 2025 et ne prévoit pas d’atteindre le seuil de rentabilité avant 2028.11 À elles deux, ces entreprises sont en passe de dépenser environ 65 milliards de dollars en une seule année pour le calcul, l’entraînement et les opérations.12
On ne peut pas perdre des dizaines de milliards de dollars par an indéfiniment. Les marchés financiers finiront par exiger ce que toute entreprise doit tôt ou tard fournir : des bénéfices. Et lorsque ce jour viendra, le coût sera répercuté sur le client. Il n’y a nulle part ailleurs où le répercuter. Les forfaits à 20 dollars et les prix symboliques artificiellement bas ont toujours été des produits d’appel. Une conquête de marché, financée par les investisseurs, destinée à stimuler l’adoption du service.
Les premières factures commencent déjà à arriver. Les entreprises qui avaient établi leur budget en se basant sur les prix des jetons prévus pour 2024 se rendent compte que les flux de travail automatisés, avec des niveaux d’adoption équivalents à ceux de 2026, consomment plusieurs fois plus que ce qu’elles avaient prévu. Une grande entreprise aurait épuisé l’intégralité de son budget annuel consacré à l’IA en quatre mois. Une grande banque a diffusé une note interne intitulée, en substance, « Les factures liées à l’IA sont hors de contrôle ».13 Même les prévisions les plus optimistes tablent sur une baisse spectaculaire du coût de l’inférence. Or, une inférence moins coûteuse profite à celui qui exploite le modèle, et ce sera de plus en plus souvent l’entreprise elle-même.
Aucun directeur financier d'entreprise ne tolérera un poste de dépenses illimité, facturé à l'utilisation, contrôlé par un fournisseur et assorti d'une clause lui permettant d'augmenter les prix. Il agira comme il l'a toujours fait face à des coûts variables incontrôlables : il les internalisera pour en faire un poste de dépenses fixe, prévisible et maîtrisable.
05 · Le dernier fossé
L'argument « données »
Il existe une deuxième raison pour laquelle les entreprises décident d'internaliser l'IA, et celle-ci pourrait bien être plus importante que l'aspect financier.
Vos données constituent l'un de vos derniers véritables atouts concurrentiels. Ce ne sont pas vos logiciels. Ceux-ci s'achètent. Ce ne sont pas non plus vos processus à eux seuls. Ceux-ci peuvent être copiés. Mais la cartographie exclusive de vos clients, de vos transactions et de vos opérations, constituée au fil des décennies, celle-là vous appartient, et elle est difficile à reproduire.
Lorsque vous acheminez ces données via un modèle public, vous risquez de perdre précisément cet avantage. Le pire scénario possible dans l’ensemble de ce secteur est la convergence des capacités: un monde où toutes les entreprises de votre secteur interrogent le même modèle public, entraîné sur les mêmes données publiques, et obtiennent en retour les mêmes réponses indifférenciées. Dans un tel monde, il n’y a pas de leaders. Tout le monde est dans la moyenne, mais à un coût élevé. Garder vos données en interne et ne les transmettre qu’aux modèles que vous contrôlez, voilà comment vous refusez la convergence.
06 · L'architecture
La pile de modèles privés
À quoi ressemble donc concrètement l'exploitation d'une IA en interne ? Ce n'est pas sorcier. Les éléments nécessaires existent déjà, et la plupart des entreprises en disposent déjà. Il suffit de prendre une plateforme de conteneurs compatible avec l'IA, d'y intégrer des modèles OpenWeight, de les affiner à partir de vos données, puis d'acheminer chaque requête, qu'elle provienne d'un humain ou d'un agent, vers le modèle qui produit le meilleur résultat au moindre coût pour cette tâche.
Et c’est justement ce que les gens oublient lorsqu’ils entendent le mot « privé ». Ce n’est pas tout ou rien. Le routeur envoie toujours une tâche à un modèle « frontier » lorsque celle-ci le justifie réellement : un problème de raisonnement complexe et inédit, ou une capacité dont vous ne disposez pas encore en interne. Vous ne cessez pas d’utiliser les modèles publics. C’est simplement le paramètre par défaut qui s’inverse. Le modèle « privé » devient votre base de fonctionnement. Le modèle « frontier » devient l’exception vers laquelle vous vous tournez délibérément, et pour laquelle vous payez, lorsque la valeur ajoutée est clairement au rendez-vous.
Figure 4 · Structure du nouveau moteur d'entreprise
La recette secrète, rien qu’à vous
Données exclusives · optimisation sur mesure · pondérations ajustées · boucles de rétroaction provenant de vos propres collaborateurs
Routeur intelligent de messages d'invite
Attribue chaque tâche en temps réel au modèle le moins cher qui répond aux critères de qualité ; n'utilise une API publique que lorsque la valeur de la tâche le justifie
Poids ouvert + modèles de domaine
Une machine polyvalente de base, ainsi que des modèles verticaux plus compacts, pouvant fonctionner sans frais supplémentaires au-delà des coûts de calcul
Plateforme de conteneurs optimisée pour l'IA
Kubernetes, ou une solution gérée telle qu’OpenShift AI, sur votre propre cloud ou sur du matériel dédié
Voilà ce qu'est l'architecture. Mais l'architecture n'est qu'un outil. Ce n'est pas elle qui constitue l'avantage, mais ce que vous en faites.
07 · Ce qui fait la différence
La recette secrète
Voici le point sur lequel je tiens à être très clair, car il est au cœur même de tout mon raisonnement.
Si tout le monde peut télécharger le même modèle open-weight, alors ce modèle ne constitue pas un avantage pour vous. C'est impossible. C'est un bien de consommation, comme le processeur, comme la base de données, comme l'électricité. L'avantage, c'est la recette secrète que vous élaborez autour de ce modèle.
Considérez cela comme les treize herbes et épices. Le poulet, ce n’est que du poulet ; n’importe qui peut en acheter. Ce que vous ne pouvez pas acheter, c’est le mélange. Dans une pile d’IA d’entreprise, ce mélange, c’est la combinaison de vos données propriétaires, de vos réglages personnalisés, de vos poids ajustés, de votre logique de routage et des boucles de rétroaction accumulées par vos propres collaborateurs qui effectuent votre travail. Cette combinaison n’existe nulle part ailleurs dans le monde et ne peut être reproduite par un concurrent qui téléchargerait le même modèle de base. Elle est défendable parce qu’elle vous appartient.
Et remarquez ce que les laboratoires de pointe sont structurellement incapables de faire ici. Ils développent un modèle générique brillant destiné à tous. De par leur conception même, ils ne peuvent pas intégrer vos treize herbes et épices dans un produit qu’ils vendraient à votre concurrent d’à côté. Leur métier, c’est la capacité générique. L’avantage spécifique, c’est le vôtre. Plus les modèles de base se banalisent, plus la différenciation se déplace vers la couche que vous seul pouvez construire.
08 · Le précédent
On a déjà monté cette pièce
Si ce schéma vous semble familier, c'est normal. Nous l'avons déjà vécu une fois, et cela s'appelait l'ERP.
Lorsque les entreprises déployaient des systèmes comme SAP, la plateforme de base n’était, en fin de compte, qu’un produit de grande consommation. Tout le monde pouvait acheter les mêmes serveurs. La différenciation, le véritable « secret de la recette », résidait dans la personnalisation : le code ABAP, les workflows sur mesure, les modèles de données, la logique des processus, ainsi que les retours d’expérience durement acquis auprès des personnes qui géraient l’entreprise au quotidien. C’est pourquoi les entreprises sérieuses dépensaient non pas des milliers, ni même des centaines de milliers, mais souvent des millions de dollars pour personnaliser leur ERP. C’est également la raison pour laquelle deux entreprises utilisant une SAP identique pouvaient se retrouver avec des capacités radicalement différentes. La plateforme était la mise de base. La personnalisation constituait le fossé de défense.
L'IA d'entreprise, c'est le même principe, mais à un niveau supérieur. Le modèle à poids ouvert correspond au SAP standard. Le réglage fin, les données propriétaires, le routage, l'intégration des flux de travail, les boucles de rétroaction : voilà ce qu'est le nouvel ABAP.
09 · Conclusion
Le nouveau moteur d'entreprise
Pendant trente ans, l'ERP a été le cœur battant de l'entreprise. C'était le système de référence, le lieu où résidait la vérité de l'entreprise, le moteur sur lequel tout le reste reposait. Cette époque touche à sa fin.
1995-2025
ERP
Le système de référence
- Enregistre ce qui s'est passé
- Différenciation par ABAP et personnalisation
- Système de vérité
- Gère les services administratifs
2026 →
Le moteur d'entreprise
Le système de renseignement
- Décide, agit et s'améliore
- Différenciation par les données, les pondérations et le routage
- Système d'avantages
- Il gère l'ensemble de l'entreprise, à titre privé
Le nouveau cœur battant de l'entreprise ne sera pas un système d'enregistrement. Ce sera un système d'intelligence. Une pile de modèles gérée en interne, optimisée en permanence, alimentée par des données propriétaires, orchestrée par un routage intelligent, et exécutant des tâches à l’échelle de l’entreprise. Elle ne se contente pas de stocker ce qui s’est passé. Elle décide, agit et s’améliore. Et surtout, elle fonctionne en mode privé, au sein même de votre entreprise, sur vos données, sous votre contrôle, pour toutes les raisons liées aux coûts, à la souveraineté des données et à la différenciation exposées ci-dessus.
L'ERP vous indiquait ce que faisait votre entreprise . Le nouveau moteur d'entreprise vous aidera à gérer les prochaines étapes de votre activité .
Ce que je te dis
L'économie l'emporte toujours
Alors laisse-moi te répéter ce que je t'ai déjà dit.
Les laboratoires de pointe sont une véritable merveille, mais ils perdent des dizaines de milliards de dollars par an pour rester à ce niveau. La facture va bientôt arriver, et c’est le client qui devra la payer. Cela signifie que le prix de location des services d’intelligence est sous pression à la hausse, et non à la baisse, alors même que la consommation des entreprises explose. Parallèlement, des modèles « open-weight » font leur apparition avec trois à quatre mois de retard sur les laboratoires de pointe, et leur exploitation est gratuite. La Chine a déjà prouvé qu’il était possible de développer une intelligence artificielle suffisamment performante et de la distribuer gratuitement pour un coût équivalent à une erreur d’arrondi par rapport au prix pratiqué en Occident. Et aucune entreprise ne souhaite voir son actif le plus précieux, ses données, s’écouler vers un modèle public qui les mettrait sur un pied d’égalité avec la concurrence.
Si l'on additionne tous ces facteurs, la conclusion ne relève pas du « peut-être ». C'est une certitude. Les entreprises exploiteront leur propre IA. Elles construiront leur avantage concurrentiel autour de leur « recette secrète » : les données, les réglages fins, les poids, le routage, les boucles de rétroaction. Exactement comme elles le faisaient autrefois avec ABAP. Et cette pile technologique privée, intelligente et en constante amélioration deviendra le nouveau moteur de l'entreprise, détrônant l'ERP de son rôle de cœur battant.
Le choix ne dépendrait jamais du modèle capable de créer les plus belles diapositives. Il dépendrait toujours de la rentabilité unitaire à grande échelle.
Parce que l'économie l'emporte toujours.