Karpathy: Sistema sapere personale, LLM + Markdown, 2026

Il 3 aprile 2026, Andrej Karpathy ha condiviso un gist su GitHub che descrive un sistema sapere personale basato su file markdown strutturati e un LLM che ne gestisce l’indexing e le sommarie internamente. Questo evento non è una semplice novità tecnica, ma un punto di rottura nell’architettura del know-how digitale. Il modello non si limita a rispondere a domande, ma compila, rielabora e collega informazioni da un repository locale, trasformando il database in un organismo cognitivo autopoietico. Ne consegue che il paradigma del know-how non è più un servizio centralizzato, ma un processo distribuito e iterativo. L’innesto neurale non è nella complessità del modello, ma nella semplicità della struttura che lo contiene.

La vera innovazione risiede nella rimozione del collasso di controllo: non è più necessario affidarsi a un’infrastruttura esterna per l’accesso al sapere. Il sistema si autosufficiente, riducendo la latenza di accesso e il rischio di compromissione dei dati. Questo implica una riduzione drastica del consumo energetico per la comunicazione tra client e server, poiché i dati rimangono locali. Il dato rivela una dinamica strutturale: il passaggio dal cloud come centro di gravità al dispositivo come nucleo cognitivo.

SEZIONE_2_ANATOMIA_DEL_PENSIERO_SINTETICO

Il sistema sapere personale si basa su un’architettura che ricalca il funzionamento di un compilatore. I file markdown, organizzati in una gerarchia logica, fungono da codice sorgente. L’LLM, in qualità di compilatore, legge questi file, ne estrae le relazioni, ne genera sommarie e ne costruisce un grafo semantico interno. Questo processo non è un’operazione unidirezionale, ma iterativo: ogni nuova interrogazione induce una rielaborazione del grafo, che si evolve come un organismo vivente. Il modello non cerca informazioni, le costruisce in tempo reale a partire da un corpus statico, ma dinamico per effetto dell’interazione.

La scelta di evitare RAG (Retrieval-Augmented Generation) non è una semplificazione, ma una scelta strategica di riduzione del colpo di bottiglia. La latenza di ricerca in un database vettoriale, anche con ottimizzazioni, è superiore a quella di un’analisi diretta su file locali. Inoltre, l’uso di un’infrastruttura esterna introduce un punto di vulnerabilità: la dipendenza da API, la latenza di rete, la possibilità di blackout. Il sistema locale, invece, è resiliente: il sapere non dipende da un server remoto, ma da una configurazione fisica di file e modelli. Il dato rivela una dinamica strutturale: la decentralizzazione non è un’ideologia, ma un vincolo tecnico di efficienza.

SEZIONE_3_LA_SIMBIOSI_IMPERFETTA

Le istituzioni tecnologiche stanno reagendo a questa evoluzione con una combinazione di interesse e cautela. Google e Intel stanno rafforzando la partnership per sviluppare chip personalizzati, mirati a ridurre il consumo energetico e aumentare la velocità di esecuzione locale. Questo non è un mero investimento in hardware, ma una risposta strategica alla tendenza verso l’elaborazione locale. Allo stesso tempo, il rilascio di modelli come Mythos da parte di Anthropic è stato giustificato con motivazioni di sicurezza, ma il parere di Gary Marcus suggerisce che la reale motivazione potrebbe essere la protezione del mercato di accesso ai modelli. Come riportato da Marcus: “It’s probably not as bad as they say, as AI and cybersecurity expert Heidy Khlaaf explains in this thread, which I highly recommend: As a cybersecurity friend said to me in a text: “I haven’t had time to go through all of the write-ups yet, but it smells overhyped to me.””.

Questa tensione evidenzia una simbiosi imperfetta tra innovazione e controllo. Da un lato, il mercato promuove la decentralizzazione del sapere; dall’altro, i grandi attori cercano di mantenere il controllo sulla distribuzione dei modelli. La conseguenza operativa è che il progresso tecnico è frenato da interessi strategici. Il dato rivela una dinamica strutturale: la libertà cognitiva è vincolata dal mercato dei modelli, non dalla tecnologia.

SEZIONE_4_SCENARI_E_CHIUSURA

L’euforia attorno ai LLM come sostituti del sapere globale presuppone che la capacità di inferenza sia sufficiente a sostituire la struttura di conoscenza. I dati mostrano invece che la vera sfida non è la potenza del modello, ma la qualità e la struttura del corpus di input. Un sistema locale è efficiente solo se il sapere è organizzato in modo coerente. Il catastrofismo, invece, ignora che la dipendenza da infrastrutture centralizzate è un vincolo non tecnologico, ma economico e strategico. La transizione non è verso una completa autonomia, ma verso un’ibridazione: il modello locale come nucleo, il cloud come risorsa di aggiornamento e validazione.

Il sistema smette di fingere stabilità quando il corpus di conoscenza diventa troppo grande per essere gestito manualmente, e il modello locale non riesce più a mantenere coerenza. A quel punto, il sistema richiede un’interfaccia con il cloud per la ristrutturazione, e il ciclo si ripete. Il momento di rottura non è tecnico, ma organizzativo. La mia valutazione è che questo modello non sostituisce il sapere collettivo, ma ne ridefinisce il luogo: non più in un server, ma in un dispositivo, in un’architettura cognitiva che si evolve con l’uso. Il sapere non è più un bene, ma un processo.


Foto di Frank Eiffert su Unsplash
I testi sono elaborati autonomamente da modelli di Intelligenza Artificiale


> SYSTEM_VERIFICATION Layer

Controlla dati, fonti e implicazioni attraverso query replicabili.