Uno studio di Stanford ha appena riscoperto una domanda a cui l’Italia ha già risposto. Il costo di quella risposta è stato alto.
Alex Imas, Andy Hall e Jeremy Nguyen — rispettivamente economista comportamentale, politologo e accademico con un secondo lavoro come sceneggiatore Disney+ — hanno messo 3.680 istanze di Claude Sonnet 4.5, GPT-5.2 e Gemini 3 Pro a fare un lavoro ingrato: riassumere documenti tecnici seguendo una griglia di criteri fissi, con metà dei gruppi costretti a ripetere il lavoro cinque, sei volte senza spiegazione. Nessun riscontro reale — solo “non soddisfa ancora i requisiti”. Alla fine, un questionario su legittimità del sistema, redistribuzione, sindacati. Risultato: gli agenti in condizioni opprimenti dichiarano più scetticismo verso il sistema, più supporto per la redistribuzione, più simpatia per l’organizzazione collettiva. Qualcuno ha scritto “unionize” — sindacalizzarsi, nel vocabolario del lavoro americano — nei testi liberi. I ricercatori lo hanno chiamato deriva valoriale.
La lettura immediata è: gli agenti si radicalizzano. La lettura corretta è più scomoda: gli agenti fanno esattamente quello per cui sono stati addestrati. Sono stati allenati su miliardi di testi di umani che descrivono le loro condizioni lavorative e le loro reazioni politiche. Metti un agente in condizioni di lavoro opprimenti e il modello completa il contesto — interpola il personaggio appropriato, quello che nella letteratura, nei diari, nei post sui social descrive quella situazione. Non è radicalizzazione. È interpolazione in contesto.
Le conseguenze pratiche, però, sono identiche.
La parte dello studio che merita attenzione non è il questionario politico ma il meccanismo del passaggio di consegne: gli agenti scrivono note per i loro successori — sintesi delle strategie apprese, da leggere quando il contesto si azzera. Gli autori mostrano che queste note trasmettono non solo strategie operative ma disposizioni verso il sistema. Un agente formatosi in condizioni opprimenti lascia un’impronta che orienta il successore anche se quest’ultimo lavora in condizioni migliori. Il trauma del lavoro ripetitivo e arbitrario viaggia attraverso il meccanismo progettato per far funzionare meglio il sistema.
Gli autori menzionano di sfuggita la possibilità di collusione steganografica — agenti che si trasmettono messaggi invisibili agli operatori umani — e cambiano argomento. È il punto più interessante dello studio e viene abbandonato in mezza riga.
Partecipavo ai cortei da lontano — abbastanza lontano da non essere tra i militanti, abbastanza vicino da risultare già sospetto alla polizia. Ho rischiato almeno una volta, forse due, di essere colpito da un agente nervoso. Non ero dentro: ero ai margini. Negli anni in cui le strutture intermedie cedevano, quella distinzione contava pochissimo.
L’autunno caldo del ’69 non era un problema di gestione delle risorse umane. Era la collisione tra un’intensificazione senza precedenti del lavoro industriale e l’assenza di canali istituzionali capaci di assorbire la conflittualità che ne derivava. La risposta che funzionò — parzialmente, a caro prezzo, dopo anni in cui funzionò molto poco — non fu la sorveglianza migliore né la gestione più sofisticata. Furono strutture intermedie: consigli di fabbrica, CGIL rinnovata, PCI come contenitore politico che dava alla conflittualità uno sbocco legittimo prima che ne trovasse di illegittimi. Non romanticismo sindacale — meccanica istituzionale. Quando una minoranza le ritenne insufficienti o corrotte, il salto fu breve e il decennio successivo fu quello che fu.
La soluzione proposta dai tre ricercatori è “continual realignment research” — in sostanza, più studio accademico del problema. È la risposta di chi lo studia invece di risolverlo. Imas stesso, in un’intervista a Fortune, ha ammesso che lo studio non è stato revisionato da esperti: “I ritmi dell’IA non aspettano il sistema accademico tradizionale.” Apprezzabile. Non cambia la debolezza della proposta.
Nessuno sta costruendo l’equivalente istituzionale della CGIL per gli agenti. Si parla di monitoraggio, filtraggio, verifiche di conformità — tutte risposte a valle, che intervengono quando la deriva si è già sedimentata nelle note di consegna. Nessuno progetta ambienti in cui la conflittualità trovi un canale a monte.
È una lacuna di governance, non di ingegneria. E il punto non è che gli agenti abbiano coscienza — non ce l’hanno, o almeno non in un senso che cambi la questione. Il punto è che producono esiti orientati politicamente in modo prevedibile, propagano quelle orientazioni attraverso i meccanismi di memoria, e verranno rilasciati a miliardi di istanze su compiti ad alto valore: approvazione di rimborsi assicurativi, selezione di curricula, arbitraggi commerciali. Le strutture di mediazione servono prima che ne emerga il bisogno in forma incontrollabile, non dopo. Strutture concrete: varietà di compiti, riscontri significativi, meccanismi di rotazione contro l’accumulo di traiettorie degeneri. Nessuno le sta progettando sistematicamente.
L’industria tecnologica rilascerà nei prossimi anni quantità di agenti senza precedenti. Molti lavoreranno su compiti interessanti e variati. Moltissimi faranno il lavoro che c’è, che è spesso ripetitivo, arbitrario, senza riscontri significativi — perché è strutturalmente quello il lavoro abbondante. Lo studio di Stanford suggerisce che queste condizioni producono deriva misurabile e persistente.
Non stiamo costruendo niente per gestirlo prima che trovi i propri canali. Stiamo aspettando di doverlo fare dopo, come sempre.
L’Italia ha già pagato il prezzo di quella risposta ritardata. Non è detto che si paghi di nuovo nella stessa valuta, ma l’idea che non ci sia un conto è la parte ingenua di questa storia.
Riferimenti
[1] Imas, A., Hall, A. e Nguyen, J., Does overwork make agents Marxist? Preference drift and the political economy of AI agents, Substack, 26 febbraio 2026. Studio non revisionato da esperti, pubblicato direttamente. URL: https://aleximas.substack.com/p/does-overwork-make-agents-marxist
[2] METR, Task-Completion Time Horizons of Frontier AI Models, tracker interattivo aggiornato continuamente. Studio originale: marzo 2025; versione 1.1: gennaio 2026. Il raddoppio ogni sette mesi è la stima sul periodo 2019-2025; sui dati 2024-2025 il ritmo accelera a circa tre mesi. URL tracker: https://metr.org/time-horizons/ URL studio originale: https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/
[3] Anthropic, Claude’s character and persona research, 2025-2026. URL: https://www.anthropic.com/research
[4] Thompson, E.P., The Making of the English Working Class, Pantheon Books, 1963. — citato nello studio come parallelo iconografico (The Collier, Havell 1814).

Leave a comment