L’IA n’est plus gratuite

Depuis 2022, les marchés ont regardé l’IA sous l’angle de la rupture technologique : modèles plus puissants, gains de productivité, capitalisations qui s’envolent. Ce récit n’est pas faux. Mais il est désormais incomplet.

Car l’IA générative n’est pas un logiciel ordinaire. Chaque requête consomme du calcul. Chaque agent mobilise des puces, de la mémoire, de l’électricité, des data centers. Et cette facture commence à remonter jusqu’aux directions financières des entreprises clientes…

Procurez-vous notre module dédié !

Un volume qui multiplie l’équation

Goldman Sachs estime que la consommation mensuelle de tokens par les agents IA pourrait être multipliée par 24 d’ici 2030, tirée en particulier par les agents d’entreprise, les plus gourmands.

Cette projection illustre un changement structurel : on ne parle plus de chatbots qui répondent à des questions, mais d’agents qui lisent, corrigent, testent et recommencent en boucle, avec une consommation de ressources sans commune mesure avec l’usage passé.

Le paradoxe de Jevons à l’ère des tokens 

Une apparente contradiction mérite d’être résolue. Le coût unitaire de l’inférence s’est effondré : ce qui coûtait 20 dollars par million de tokens en 2022 en coûte aujourd’hui environ 0,07, une division par 280 en trois ans ! Pourtant, les factures des entreprises explosent.

La réponse à ce paradoxe remonte à 1865. L’économiste William Stanley Jevons l’avait formulé à propos du charbon : quand une technologie devient plus efficace, elle ne réduit pas forcément la consommation totale – elle peut au contraire l’augmenter, en rendant de nouveaux usages rentables.

Chaque token coûte moins cher, mais on en consomme incomparablement plus. Jensen Huang lui-même l’a explicité : la dépense agrégée grimpe parce que la baisse des prix a déverrouillé des usages qui n’existaient pas avant.

À cela s’ajoute un effet de mix : les entreprises qui faisaient passer toutes leurs requêtes par des modèles basiques à 0,40 dollar par million de tokens font désormais passer leurs cas d’usage complexes par des modèles de pointe à 25 dollars. La frontière se reconstitue à chaque génération, et c’est précisément cette frontière qui intéresse les entreprises.

La fin de la subvention cachée

Pendant deux ans, ce coût réel a été absorbé en silence : côté clients, des forfaits fixes masquaient les écarts de consommation; côté fournisseurs, le capital-risque et les bilans des hyperscalers compensaient les pertes par utilisateur.

Ce modèle se fissure. Microsoft a encadré ses déploiements internes. Uber a consommé son budget IA 2026 en quatre mois avec 95 % d’adoption parmi ses ingénieurs. GitHub, à partir du 1er juin 2026, bascule vers une tarification à la consommation réelle en tokens. Le prix payé commence enfin à rejoindre le coût économique réel…

La chaîne de valeur se fragmente

Ce changement de phase modifie profondément la façon d’investir sur le secteur. Il ne faut plus traiter l’IA comme un bloc homogène.

Les laboratoires purs (Anthropic, OpenAI, xAI) captent la croissance mais supportent des coûts considérables – entraînement, inférence, sécurité, talents. Leur rentabilité reste lointaine. Les hyperscalers possèdent l’infrastructure et la relation client, mais portent un risque de CAPEX massif pouvant atteindre 650 milliards de dollars sur 2026. Les fabricants de puces et d’équipements bénéficient directement de la course à l’infrastructure, mais restent tributaires des budgets des hyperscalers. Les éditeurs logiciels sont les plus délicats : certains réussiront à intégrer l’IA et renforcer leur produit, d’autres verront leurs marges compressées. Enfin, les bénéficiaires indirects – énergie, câbles, cuivre, refroidissement, data centers –  offrent une exposition plus lisible à la thématique.

L’IA devait être l’histoire ultime du logiciel. Elle ramène finalement les marchés vers des sujets beaucoup plus physiques : énergie, métaux, machines, réseaux électriques.

Ce que cela change pour l’investisseur

Le message n’est pas que l’IA est une bulle – ce serait une lecture trop simple. Le message est que l’IA entre dans une phase plus mature, donc plus exigeante. Les marchés ne peuvent plus seulement payer la promesse. Ils vont devoir mesurer la rentabilité, la qualité des revenus, la maîtrise des coûts.

La première phase était celle de la démonstration – les modèles fonctionnent. La deuxième, celle du déploiement – les entreprises adoptent. La troisième, qui commence aujourd’hui, sera celle de la rentabilité : qui gagne vraiment de l’argent quand l’usage devient massif ?

Acheter l’IA en bloc devient moins pertinent. Acheter les grands noms du secteur sans distinction devient plus risqué. La question n’est plus si l’IA s’impose, mais qui dans la chaîne capture réellement la valeur… et à quel prix.


En savoir plus sur Le premier institut de formation économique et financière

Subscribe to get the latest posts sent to your email.