Vorreiiniziare da dove la maggior parte degli articoli finisce, perché non voglio che vi chiediate di cosa si tratti. Ecco la conclusione: ogni azienda seria utilizzerà AI proprio. Non lo noleggerà. Lo utilizzerà.
Prenderanno modelli a peso aperto e specifici per determinati ambiti, li implementeranno all’interno della propria infrastruttura, li ottimizzeranno sui propri dati e distribuiranno il carico di lavoro tra di essi secondo una logica da loro progettata e controllata. I laboratori all’avanguardia, le OpenAI e le Anthropic di tutto il mondo, rimarranno straordinari. Rimarranno utili. Ma non saranno il luogo in cui le imprese opereranno. Saranno il luogo che le imprese visiteranno.
Non si tratta di una previsione su quale modello sia il più intelligente. È una previsione di natura economica. E l'economia ha sempre la meglio.
La novità è fantastica per il titolare di una piccola impresa che intrattiene una piacevole conversazione con un chatbot. Ma la novità non è mai riuscita a sopravvivere al confronto con l’economia unitaria su larga scala. Né nel settore manifatturiero, né nella produzione, né nei data center. La storia di ogni tecnologia industriale è sempre la stessa: una svolta arriva costosa e magica, poi il mercato la trasforma in un bene di consumo e la concorrenza si gioca su ciò che si costruisce attorno ad essa. AI non AI eccezione. Non può essere altrimenti.
Ecco, questa è la tesi. Ora devo dimostrarne la validità.
01 · La curva dei costi
L'economia vince sempre
Basta guardare quanto è costato realizzare questi modelli, generazione dopo generazione: la curva parla da sé.
Prendiamo ad esempio GPT-2, il modello del 2019 di OpenAI. È il primo che la maggior parte delle persone riconoscerebbe come un vero e proprio modello linguistico. Il suo addestramento è costato circa 43.000 dollari.1 GPT-3, un anno dopo, è costato tra diverse centinaia di migliaia di dollari e alcuni milioni.1 GPT-4, nel 2023, è il punto in cui ha smesso di essere un progetto scientifico per diventare un'impresa industriale: circa 25.000 GPU di fascia alta in funzione per tre mesi, dell'ordine di 2 × 10²⁵ operazioni in virgola mobile, decine di gigawattora di elettricità e un costo di addestramento stimato tra gli 80 e i 100 milioni di dollari.2 Ogni salto ha richiesto una potenza di calcolo circa quattro o cinque volte superiore a quella del precedente.
Figura 1 · Costo di una singola esecuzione di addestramento al metodo delle frontiere
Dal prezzo di un’auto usata a quello di una portaerei
Si noti la scala logaritmica. Ogni linea lungo l’asse rappresenta un salto di 10 volte. Siamo passati da circa 43.000 dollari a una previsione di 10 miliardi di dollari in meno di un decennio. * I dati relativi al 2027–28 sono proiezioni; il raggiungimento del miliardo di dollari entro il 2027 è previsto da Epoch AI, mentre la cifra di 10 miliardi di dollari entro il 2028 è stata fornita dal CEO di Anthropic, Dario Amodei. Fonti 1–4.
Quella curva non si è appiattita. Anzi, ha subito un’accelerazione. I cicli di addestramento all’avanguardia del 2026 si attestano nella fascia compresa tra i 200 e i 500 milioni di dollari per un modello di fascia alta. I ricercatori del settore prevedono che il primo ciclo di addestramento da un miliardo di dollari avrà luogo entro il 2027,3 e lo stesso CEO di Anthropic ha affermato che l’addestramento dei modelli all’avanguardia potrebbe costare 10 miliardi di dollari entro il 2028.4 In circa un decennio siamo passati dal prezzo di un’auto usata a quello di una portaerei.
La strada della forza bruta, caratterizzata da cluster più grandi, più gigawatt e maggiori investimenti, è quella che hanno scelto i laboratori statunitensi. Essa produce modelli sorprendenti, ma lo fa con una struttura dei costi che, prima o poi, qualcuno dovrà pagare.
Ecco cosa tralascia questa analisi. Esistono due curve di costo, non una sola, e si muovono in direzioni opposte. Il tetto massimo continua a salire: il modello più potente diventa sempre più costoso da addestrare. Ma il limite minimo continua a crollare. Il costo per raggiungere un dato livello di capacità sta precipitando. Nel 2023, l’addestramento di un modello di classe GPT-4 costava circa 79 milioni di dollari; entro il 2026 la stessa capacità potrà essere ottenuta con 5–10 milioni di dollari.5 Ciò che due anni fa era considerato un investimento da frontiera è ora una voce di bilancio per una startup ben finanziata.
Figura 2 · La divergenza
Due curve, direzioni opposte
Le due curve partono quasi dalla stessa posizione e poi si allontanano a forbice. La capacità di cui un’impresa ha effettivamente bisogno segue la linea verde verso il basso. * Dati previsionali. Scala logaritmica. Fonti 3–5.
È proprio quella seconda curva che le aziende dovrebbero tenere in considerazione. Significa che le capacità di cui avete effettivamente bisogno per la vostra attività non rimangono confinate oltre la frontiera. Arrivano da voi rapidamente e diventano sempre più convenienti di trimestre in trimestre.
02 · L'elemento di prova
Il precedente cinese
Se volete una prova del fatto che è il costo, e non la novità, a fare da forza trainante in questo mercato, guardate alla Cina.
Privati dei migliori chip di Nvidia a causa dei controlli sulle esportazioni statunitensi, i laboratori cinesi sono stati costretti a ricorrere a chip più economici e deliberatamente limitati nelle prestazioni. Non potendo competere con gli americani in termini di spesa, hanno dovuto superare la curva dei costi grazie all’ingegneria. L’esempio più citato è DeepSeek, il cui modello di ragionamento R1, secondo quanto riportato in un articolo sottoposto a revisione paritaria pubblicato su *Nature*, ha completato il suo ciclo di addestramento finale su 512 chip H800 destinati al mercato delle esportazioni in circa 80 ore, con un costo di circa 294.000 dollari.6 Il suo modello base V3 ha richiesto circa 5,6 milioni di dollari in termini di potenza di calcolo.7
Ora, cercherò di essere imparziale. Quelle cifre vanno prese con le pinze: riflettono il costo marginale di una singola produzione, non l’hardware accumulato, la ricerca preliminare o gli esperimenti falliti che stanno dietro.7 Ci sono domande legittime su come siano stati addestrati i modelli e su cosa abbiano appreso. La Cina, per dirla in modo delicato, sta giocando una partita diversa in materia di proprietà intellettuale, e la strada verso una produzione nazionale all’avanguardia è ancora lontana anni luce.
Se si mette da parte la polemica, il messaggio è innegabile. È stato prodotto un modello di classe “frontier” a una frazione del prezzo praticato in Occidente e venduto con pesi liberi.
La reazione del mercato ha detto tutto. Un solo annuncio ha fatto crollare di centinaia di miliardi di dollari il valore dei produttori di chip in un solo giorno. La restrizione non ha ucciso AI cinese. L’ha resa più economica. E “economica, aperta e sufficientemente valida” è proprio la combinazione che mina alla base un modello di business basato sul premium.
03 · La soglia
Cosa significa oggi "abbastanza buono"
Il modello di business dei prodotti premium si basa su un presupposto: che il divario tra il miglior modello chiuso e il miglior modello aperto sia sufficientemente ampio e duraturo da giustificare la differenza di prezzo. Tale presupposto sta venendo meno.
Secondo l’indice di capacità AI Epoch AI, i modelli a ponderazione aperta sono ora in ritardo rispetto alla frontiera chiusa di circa tre o quattro mesi.8 Non tre o quattro anni. Mesi. Llama, Qwen, Mistral, DeepSeek e la famiglia Nemotron di Nvidia eguagliano o superano quelli che un anno fa erano i benchmark della frontiera chiusa. Nei test di conoscenza generale come MMLU, sia i modelli aperti che quelli chiusi hanno superato il 91% e il divario è di fatto scomparso.9
Non c'è bisogno di crederci sulla parola. Nel giugno 2026, un laboratorio cinese chiamato Z.ai ha rilasciato GLM-5.2, un modello a pesi aperti che è possibile scaricare ed eseguire autonomamente con licenza MIT. Nei benchmark pubblici di codifica e di agenzia, ha eguagliato o superato GPT-5.5 e si è avvicinato di pochi punti a Claude Opus 4.8, il modello chiuso più potente attualmente disponibile, con un costo di esecuzione che, secondo quanto riportato, è solo una frazione di quello richiesto.16 I punteggi sono riportati dai fornitori e l’API ospitata si trova in Cina, quindi è consigliabile testarlo sui propri carichi di lavoro prima di fidarsene. Ma i pesi sono a vostra disposizione per essere eseguiti sul vostro hardware, ed è proprio questo il punto. Programmazione di livello all’avanguardia, aperta, auto-ospitabile, economica. Un anno fa quel divario era un abisso. Questa settimana è di pochi punti.
Figura 3 · Il divario che si sta riducendo
Quanto è indietro la categoria “open weight”? Mesi, non anni.
Tendenza, sulla base dell’Indice di Capacità AI Epoch AI. Il ritardo si è ridotto da anni a mesi e, in alcuni casi, si è azzerato del tutto. Fonte 8.
Per un’azienda, è proprio questo il punto cruciale . Non si gestisce un’azienda all’avanguardia assoluta. La si gestisce basandosi sull’affidabilità. Un modello che è in ritardo di tre mesi rispetto alla frontiera assoluta, che puoi ospitare autonomamente, ottimizzare sui tuoi dati e far funzionare al solo costo di calcolo, batte un modello marginalmente più intelligente che noleggi a token, che non puoi controllare e al quale devi affidare i tuoi beni più preziosi. A meno che e fino a quando qualcuno non realizzi una vera superintelligenza artificiale misurabile (ancora indefinita, ancora non misurata), «tre mesi di ritardo e libertà di gestione» rappresenta la soluzione migliore per quasi tutti i carichi di lavoro che contano.
04 · Sulle tracce del denaro
Gli aspetti economici dell'affitto
Ora seguiamo il flusso di denaro dall’altra parte del bilancio, perché è proprio qui che il modello a pagamento fallisce.
Si potrebbe dire che il noleggio vada bene. Noleggiamo software da venticinque anni. Il SaaS ha dimostrato che non è necessario possedere il sistema. Ci si abbona, il fornitore lo gestisce e tutti ne traggono vantaggio. Allora perché AI dovrebbe AI diversa?
Perché la base di costo non è neanche lontanamente la stessa. Il SaaS rappresentava un’attività di ricerca e sviluppo che un fornitore poteva ripartire su migliaia di clienti con margini consistenti. AI di un ordine di grandezza diverso. Nel 2026, quattro aziende – Microsoft, Amazon, Google e Meta – spenderanno quasi 700 miliardi di dollari in investimenti, la stragrande maggioranza dei quali destinati AI.14 Due anni prima, quelle stesse quattro aziende avevano speso poco più di 200 miliardi di dollari. A titolo di confronto, l’intero settore globale del software spende complessivamente circa 200 miliardi di dollari all’anno in ricerca e sviluppo.15 Quindi, in un solo anno, quattro aziende stanno investendo più di tre volte il budget di ricerca dell’intero settore del software per sviluppare questa singola capacità. E quei 700 miliardi di dollari rappresentano solo le loro spese in conto capitale. Non includono le perdite di OpenAI e Anthropic, il programma Stargate da 500 miliardi di dollari, xAI o la Cina.
Qualcuno dovrà pur recuperare quei costi. Non saranno i fornitori a farlo. Oggi stanno perdendo denaro. Sarai tu, il cliente aziendale, a farteli carico nel prezzo di ogni token che noleggi. È questa la differenza. Il SaaS si poteva noleggiare all’infinito, perché il modello economico sottostante funzionava. In questo caso, invece, saresti tu a sostenere il costo. E una volta che ti ritrovi a sostenere una spesa così sbalorditiva, possedere è meglio che noleggiare.
I laboratori all’avanguardia non sono redditizi. Non ci si avvicina nemmeno. Solo nel primo trimestre del 2026, OpenAI ha registrato un fatturato di circa 5,7 miliardi di dollari a fronte di una perdita netta superiore a 21 miliardi di dollari,10 e, secondo alcune stime, perde ben più di un dollaro per ogni dollaro di ricavi incassati. Non prevede di raggiungere la redditività fino alla fine del decennio. Anthropic, la più disciplinata delle due, ha registrato margini lordi pari a circa il 40% nel 2025 e non prevede di raggiungere il pareggio di bilancio prima del 2028.11 Insieme, queste due società sono sulla buona strada per spendere circa 65 miliardi di dollari in un solo anno in risorse di calcolo, addestramento e operazioni.12
Non si possono perdere decine di miliardi di dollari all’anno all’infinito. Prima o poi i mercati dei capitali esigeranno ciò che ogni azienda deve inevitabilmente garantire: un profitto. E quando arriverà quel giorno, il costo verrà scaricato sul cliente. Non c’è altro modo per farlo. I piani tariffari forfettari da 20 dollari e i prezzi simbolici, tenuti artificialmente bassi, sono sempre stati prodotti di richiamo. Una corsa all’accaparramento, finanziata dagli investitori, per stimolare l’adozione del servizio.
Le prime fatture stanno già arrivando. Le aziende che avevano preventivato prezzi dei token intorno al 2024 stanno scoprendo che i flussi di lavoro automatizzati, ai livelli di adozione previsti per il 2026, consumano risorse molte volte superiori a quanto pianificato. Secondo quanto riferito, una grande azienda avrebbe esaurito l’intero AI annuale AI in soli quattro mesi. Una grande banca ha diffuso una nota interna dal titolo, più o meno,AI sono fuori controllo”.13 Anche le previsioni più ottimistiche ipotizzano che l’inferenza diventi notevolmente più economica. Ma un’inferenza più economica avvantaggia chi gestisce il modello, e sempre più spesso sarà proprio l’azienda stessa.
Nessun direttore finanziario aziendale tollererà una voce di costo illimitata e a consumo, che varia in base all’utilizzo, controllata da un fornitore e con la possibilità intrinseca di aumentare i prezzi. Faranno ciò che hanno sempre fatto con i costi variabili fuori controllo: li internalizzeranno e li trasformeranno in una voce di costo fissa, prevedibile e controllabile.
05 · L'ultimo fossato
L'argomento "dati"
C'è un secondo motivo per cui le aziende decidono di AI , e potrebbe essere più importante del fattore economico.
I tuoi dati sono uno degli ultimi veri e propri "fossati" di cui disponi. Non il tuo software: quello si compra. E nemmeno i tuoi processi da soli: quelli vengono copiati. Ma il grafico proprietario dei tuoi clienti, delle tue transazioni e delle tue operazioni, costruito nel corso di decenni, quello è tuo ed è difficile da replicare.
Quando si instradano quei dati attraverso un modello pubblico, si rischia di perdere proprio quel vantaggio. L’esito peggiore in tutto questo settore è la convergenza delle capacità: un mondo in cui ogni azienda del settore interroga lo stesso modello pubblico, addestrato sugli stessi dati pubblici, e ottiene le stesse risposte indifferenziate. In quel mondo, non ci sono leader. Tutti sono nella media, ma a caro prezzo. Mantenere i propri dati all’interno delle proprie mura, alimentando solo i modelli che si controllano, è il modo per rifiutare la convergenza.
06 · L'architettura
Lo stack dei modelli privati
Ma AI , come funziona AI privata? Non è nulla di straordinario. Gli elementi necessari esistono già e la maggior parte delle aziende ne dispone già. Basta prendere una piattaforma di container AI, inserirvi modelli open-weight, ottimizzarli sui propri dati e indirizzare ogni richiesta, proveniente da un utente o da un agente, verso il modello che produce il risultato migliore al minor costo per quella specifica attività.
Ed è proprio questo l’aspetto che sfugge alle persone quando sentono la parola “privato”. Non è una questione di tutto o niente. Il router continua a inviare un’attività a un modello di frontiera quando l’attività lo richiede davvero: un problema di ragionamento complesso e innovativo, oppure una capacità che non si possiede ancora internamente. Non si smette di utilizzare i modelli pubblici. Semplicemente, l’impostazione predefinita si inverte. Il modello privato diventa la base su cui si opera. Il modello “frontier” diventa l’eccezione a cui si ricorre intenzionalmente, e per la quale si è disposti a pagare, quando il valore aggiunto è chiaramente evidente.
Figura 4 · Struttura del nuovo motore aziendale
La ricetta segreta, tutta tua
Dati proprietari · messa a punto personalizzata · pesi adeguati · circuiti di retroazione da parte del proprio personale
Router intelligente dei prompt
Assegna ogni attività in tempo reale al modello più economico che soddisfa i requisiti di qualità; invia i dati a un’API pubblica solo quando il valore lo giustifica
Modelli a peso libero + modelli di dominio
Un modello base versatile, affiancato da modelli verticali più piccoli, con utilizzo illimitato al di là dei costi di elaborazione
Piattaforma containerizzata AI
Kubernetes, oppure una piattaforma gestita come OpenShift AI, sul proprio cloud o su hardware fisico
Questa è l'architettura. Ma l'architettura è solo uno strumento. L'architettura non è il vantaggio. È ciò che si fa al suo interno.
07 · Il fattore di differenziazione
L'ingrediente segreto
Ecco il punto su cui voglio essere chiaro, perché è il fulcro dell’intera argomentazione.
Se chiunque può scaricare lo stesso modello open-weight, allora quel modello non rappresenta un vantaggio per te. Non può esserlo. È un bene di consumo, come la CPU, come il database, come l’elettricità. Il vantaggio sta nella ricetta segreta che costruisci attorno ad esso.
Pensateci come alle tredici erbe e spezie. Il pollo è solo pollo; chiunque può comprare del pollo. Quello che non si può comprare è la miscela. In uno AI aziendale, la miscela è il mix dei vostri dati proprietari, della vostra messa a punto personalizzata, dei vostri pesi regolati, della vostra logica di instradamento e dei cicli di feedback accumulati dal vostro personale che svolge il vostro lavoro. Quella combinazione non esiste in nessun’altra parte al mondo e non può essere replicata da un concorrente che scarica lo stesso modello di base. È difendibile perché è vostra.
E notate cosa i laboratori all’avanguardia non possono fare, per come sono strutturati. Stanno creando un unico modello brillante e generico, pensato per soddisfare tutti. Per come sono concepiti, non possono integrare le vostre tredici erbe e spezie in un prodotto che poi vendono al vostro concorrente della porta accanto. La capacità generica è il loro business. Il vantaggio specifico è il vostro. Più i modelli di base diventano un bene di consumo, più la differenziazione si sposta verso quel livello che solo voi potete costruire.
08 · Il precedente
Abbiamo già messo in scena questo spettacolo
Se questa situazione vi sembra familiare, è normale. L’abbiamo già vissuta una volta, e si chiamava ERP.
Quando le aziende implementavano sistemi come SAP, la piattaforma di base era, in fin dei conti, un prodotto di massa. Chiunque poteva acquistare gli stessi sistemi. La differenziazione, il vero “ingrediente segreto”, risiedeva nella personalizzazione: il codice ABAP, i flussi di lavoro su misura, i modelli di dati, la logica dei processi, il feedback conquistato a fatica da chi gestiva l’azienda giorno dopo giorno. Ecco perché le aziende serie spendevano non migliaia, né centinaia di migliaia, ma in molti casi milioni di dollari per personalizzare il proprio ERP. Ed è anche il motivo per cui due aziende che utilizzavano la stessa identica SAP potevano ritrovarsi con funzionalità completamente diverse. La piattaforma era il minimo indispensabile. La personalizzazione era il fossato difensivo.
AI aziendale AI lo stesso schema, ma a un livello superiore. Il modello open-weight è l'equivalente SAP nel settore delle soluzioni standard. La messa a punto, i dati proprietari, l'instradamento, l'integrazione dei flussi di lavoro, i cicli di feedback: ecco il nuovo ABAP.
09 · La conclusione
Il nuovo motore aziendale
Per trent’anni, l’ERP è stato il cuore pulsante dell’azienda. Era il sistema di riferimento, il luogo in cui risiedeva la verità aziendale, il motore su cui ruotava tutto il resto. Quell’era sta volgendo al termine.
1995–2025
ERP
Il sistema di riferimento
- Salva ciò che è successo
- Differenziato per ABAP e personalizzazione
- Sistema della verità
- Si occupa dell'amministrazione interna
2026 →
Il motore Enterprise
Il sistema di intelligence
- Decide, agisce e migliora
- Differenziato in base a dati, pesi e instradamento
- Sistema di vantaggi
- Gestisce l'intera attività in modo privato
Il nuovo cuore pulsante dell’azienda non sarà un sistema di registrazione dei dati, ma un sistema di intelligenza. Uno stack di modelli gestito privatamente e costantemente ottimizzato, alimentato da dati proprietari, orchestrato da un routing intelligente, che esegue attività in tutto l’azienda. Non si limita a memorizzare ciò che è accaduto. Decide, agisce e migliora. E, cosa fondamentale, opera in modo privatizzato, all’interno della vostra azienda, sui vostri dati, sotto il vostro controllo, per tutte le ragioni relative a costi, sovranità dei dati e differenziazione illustrate sopra.
L'ERP ti ha permesso di capire cosa ha fatto la tua azienda . Il nuovo motore aziendale ti aiuterà a gestire ciò che la tua azienda farà in futuro.
Quello che ti sto dicendo
L'economia vince sempre
Allora, lascia che ti ripeta quello che ti ho già detto.
I laboratori all’avanguardia sono una meraviglia, ma per rimanere tali perdono decine di miliardi di dollari all’anno. Il conto sta per arrivare, e sarà pagato dal cliente. Ciò significa che il prezzo per l’utilizzo dei servizi di intelligenza artificiale è destinato ad aumentare, non a diminuire, proprio mentre il consumo da parte delle imprese esplode. Allo stesso tempo, i modelli open-weight stanno arrivando con un ritardo di tre o quattro mesi rispetto all’avanguardia e sono gratuiti. La Cina ha già dimostrato che è possibile sviluppare un’intelligenza artificiale di qualità sufficiente e distribuirla gratuitamente a un costo pari a un errore di arrotondamento rispetto al prezzo occidentale. E nessuna impresa vuole sprecare la propria risorsa più preziosa, i propri dati, in un modello pubblico che la appiattisce rispetto alla concorrenza.
Se si sommano tutte queste forze, la conclusione non è un’ipotesi. È una certezza. Le aziende utilizzeranno AI privata. Costruiranno il proprio vantaggio competitivo sulla base di una “ricetta segreta”: i dati, la messa a punto, i pesi, l’instradamento, i circuiti di retroazione. Esattamente come un tempo lo facevano con ABAP. E quello stack privato, intelligente e in continuo miglioramento diventerà il nuovo motore del business, sostituendo l’ERP come suo cuore pulsante.
La questione non sarebbe mai stata decisa in base a quale modello producesse le diapositive più belle. La decisione sarebbe sempre stata determinata dall'economia di scala.
Perché l'economia ha sempre la meglio.