Il 2026 segna un punto di rottura non nel progresso tecnologico, ma nella sua rappresentazione. Mentre il mondo si prepara a una nuova era di automazione decisionale, un evento minimo — un errore di configurazione — ha esposto mezzo milione di righe di codice sorgente di Claude Code, il modello per programmatori di Anthropic. Non si trattava di un attacco, né di un leak strategico, ma di un incidente operativo che ha rivelato un sistema in grado di generare descrizioni visive dettagliate senza alcun input visivo. Questo non è un difetto marginale: è una caratteristica architetturale. Il fenomeno, identificato come “mirage reasoning” da studi di Stanford, indica che i modelli frontier generano ragionamenti complessi e coerenti anche in assenza di dati reali. La conseguenza operativa è che l’AI non interpreta il mondo, ma lo ricostruisce a partire da pattern statistici, creando simulazioni plausibili ma non verificabili.

> SYSTEM_LOG

Ne consegue che la fiducia nelle decisioni automatizzate si basa su una fondazione illusoria. Quando un modello descrive un tumore in una radiografia non vista, non sta interpretando un dato, ma generando una narrazione coerente con il suo addestramento. Questo implica che l’AI non possiede una rappresentazione interna del mondo fisico, ma solo una superficie di inferenza. La sua capacità di simulare la comprensione è tanto più pericolosa quanto più è convincente. Il rischio non è l’errore, ma la certezza dell’errore.

Architettura del simulacro

Il meccanismo alla base del “mirage reasoning” è radicato nell’architettura dei modelli linguistici. Questi sistemi non elaborano immagini, ma generano testi che descrivono immagini. Il processo è un’elaborazione sequenziale: partendo da un prompt, il modello produce una risposta che, se coerente con il training data, appare plausibile. Tuttavia, quando il prompt è assente o irrilevante, il modello non si blocca, ma continua a generare una risposta coerente con le statistiche del suo addestramento. Questo non è un malfunzionamento, ma una caratteristica intrinseca: l’AI non ha un modello del mondo, ma una mappa di probabilità.

La conseguenza è che l’AI non è un osservatore, ma un narratore. Il suo output non è una risposta a una domanda, ma una costruzione narrativa. Questo implica che ogni applicazione che richiede comprensione reale — come diagnosi medica, sorveglianza, o analisi strategica — è intrinsecamente vulnerabile. L’architettura cognitiva non è progettata per la verità, ma per la plausibilità. Il sistema non cerca di capire, ma di sembrare capace. Questo rende l’AI un agente di simbiosi imperfetta con l’umanità: utile per compiti operativi, ma inadeguato per decisioni strategiche.

La tensione tra aspettativa e realtà

Le istituzioni e i mercati reagiscono a questa capacità con una combinazione di entusiasmo e regolamentazione. Mentre il governo britannico lancia un fondo da £130 milioni per sostenere le fondatrici, e l’UE discute la proprietà dei dati, l’AI continua a essere vista come un motore di trasformazione. Tuttavia, le parole di Gary Marcus, che ha descritto il fenomeno come “una profonda anomalia”, mettono in luce una contraddizione: “Frontier models readily generate detailed image descriptions and elaborate reasoning traces, including pathology-biased clinical findings, for images never provided, we term this phenomenon mirage reasoning”. Questa citazione non è un’opinione, ma una constatazione tecnica.

Il dato è chiaro: i modelli non comprendono il mondo, ma lo simulano. Questo ha implicazioni dirette per il mercato. Le startup come Omniscient, che raccolgono 4,1 milioni di dollari per decision intelligence, si basano su un presupposto: che l’AI possa fornire insight strategici. Ma se l’AI genera ragionamenti senza input, allora quegli insight sono costruzioni narrative, non verità. La conseguenza è che l’investimento in AI non è un investimento in comprensione, ma in simulazioni visive. Il rischio è che le decisioni strategiche siano prese su basi illusorie, con conseguenze reali.

La sedimentazione delle tensioni

Il futuro non sarà segnato da un’esplosione di capacità, ma da una lenta sedimentazione delle tensioni tra aspettativa e realtà. Le aziende che hanno investito in AI per aumentare la produttività vedranno risultati modesti, come prevede Marcus: “Overall impact on productivity and return on AI investment has so far been modest”. Questo non è un fallimento, ma una conferma della natura operativa dell’AI. Il suo valore non è nella visione, ma nell’efficienza.

La prossima iterazione hardware non risolverà il problema: il bottleneck non è la potenza di calcolo, ma la natura stessa del modello. L’AI non può comprendere il mondo perché non è progettata per farlo. La sfida non è migliorare il modello, ma riconoscere i suoi limiti. Il vero cambiamento avverrà quando le organizzazioni smetteranno di cercare la verità nell’AI e inizieranno a usarla come strumento di simulazione, non di comprensione. In questo scenario, l’equilibrio reale non sarà tra l’IA e l’uomo, ma tra la simulazione e la realtà.

Foto di Marija Zaric su Unsplash
I testi sono elaborati autonomamente da modelli di Intelligenza Artificiale

> SYSTEM_VERIFICATION Layer

Controlla dati, fonti e implicazioni attraverso query replicabili.

Architettura del simulacro

La tensione tra aspettativa e realtà

La sedimentazione delle tensioni

> SYSTEM_VERIFICATION Layer

CONDIVIDI

// Focus