Cosa Ho Imparato Riscrivendo un Romanzo con Due Generazioni di AI
O: Come in 18 Mesi Claude Ha Imparato a Non Ripetere “Occhi Blu Ghiaccio” Ogni Tre Righe
Ho fatto un esperimento che nessuno mi aveva chiesto ma che, a posteriori, si rivela maledettamente interessante: riscrivere lo stesso romanzo urban fantasy a distanza di un anno, usando prima Sonnet 3.5 (giugno 2024) e poi Sonnet 4.5 (settembre 2025).
Il risultato? Una masterclass non richiesta su come l’intelligenza artificiale stia imparando a scrivere – e su quanto velocemente stia succedendo.
Il Setup: Stesso Canovaccio, Cervelli Diversi
La storia è The Sands of Port Said – urban fantasy ambientato nell’Egitto del 1920, con grammatica temporale, console svedesi impossibilmente eleganti, e assistenti egiziani che sanno troppo. Classico.
Per il test: ho estratto il canovaccio dal testo originale (scritto con 3.5) e l’ho dato in pasto a 4.5. Stesso outline, stessi beat narrativi, stessa struttura a 16 capitoli. L’unica variabile: il modello.
E qui le cose si fanno interessanti.
La Scoperta: Non è Questione di Stile, è Architettura Cognitiva
Sonnet 3.5: Il Principe della Linearità
Sonnet 3.5 scrive come un ottimo studente di scrittura creativa – tecnicamente solido, decoroso, ma con alcuni tic rivelatori.
Apre così il prologo:
“Thomas Blackwood aveva tre problemi: una traduzione che si rifiutava di avere senso, un simbolo misterioso che non dovrebbe esistere, e un assistente decisamente attraente che sicuramente non era quello che dichiarava di essere.”
Classico hook a tre elementi. Poi sviluppa: la lampada tremola → l’assistente misterioso arriva → il console vuole un incontro → riflesso strano → commento criptico → fine scena.
È geometria euclidea narrativa. A, poi B, poi C. Ogni elemento ha il suo momento, viene introdotto, sviluppato, chiuso. Zero sovrapposizioni.
Il problema? Quando hai 15 subplot attivi (deterioramento Hassan + romance Erik/Thomas + politica dei Guardiani + motivazioni Phillips + worldbuilding rete temporale + mystery grammatica antica), questa linearità diventa una camicia di forza.
Sonnet 4.5: L’Orchestratore
4.5 invece pensa in multi-threading. Prendi il Capitolo 10, scena con Mitchell (soldato disperso di Phillips):
In 20 righe di dialogo gestisce simultaneamente:
- Intel tattica: Phillips ha rotta alternativa via Città Sepolta
- Worldbuilding: tecnologia vs metodo organico per accedere ai templi
- Character arc Hassan: vede il proprio futuro in Mitchell dissolto
- Villain characterization: Phillips “prese appunti” invece di salvare i compagni
- Theme development: pragmatismo vs umanità
- Setup capitolo successivo: necessità di intercettare Phillips
- Emotional beat: Hassan che realizza la propria mortalità
- World consequence: costo della forzatura tecnologica sulla rete
Otto layer simultanei. Non serializzati – intrecciati.
Una frase tipo questa:
“Mitchell guardò Hassan negli occhi. ‘Tu stai andando verso la stessa strada, vero? La dispersione.’”
Fa quattro cose in dodici parole: consegna info tecnica (dispersione come fenomeno), avanza subplot Hassan, crea tension emotiva, mostra conseguenze worldbuilding.
È come la differenza tra suonare una melodia (3.5) e dirigere un’orchestra (4.5).
Il Problema Delle Ossessioni: Quando l’AI Non Sa Smettere
Ma la differenza più straniante è emersa nell’editing. 3.5 aveva sviluppato delle… chiamiamole fissazioni.
Erik e il Complesso del Ghiaccio
Ogni volta – e intendo ogni singola volta – che Erik Sandersen (il console svedese) appariva in scena, 3.5 sentiva il bisogno compulsivo di ricordarti che è nordico:
- “la voce era come ghiaccio nel cristallo”
- “quegli occhi blu impossibili”
- “come se il pavimento fosse ghiaccio e lui fosse nato pattinando”
- “una fragranza che ricordava a Thomas la neve”
- “biondo artico”
- “l’inverno di Stoccolma”
Sei riferimenti a freddo/ghiaccio/inverno in due pagine.
Erik non poteva semplicemente fare qualcosa – doveva farlo mentre il narratore ti ricordava ossessivamente la sua nordicity. Come se il modello avesse un prompt interno: “Erik = metafora ghiaccio DEVE ATTIVARSI” e non riuscisse a liberarsene.
Il risultato? Character che collassano da personaggi a tropo ambulante. Erik diventa “quello del ghiaccio”, Hassan “quello misterioso e sensuale”, e il lettore inizia a sentirsi preso per scemo.
Il Culto di “Impossibile”
Altro tic: l’abuso di “impossibile” come parola stampella per segnalare “questo è magico”:
- occhi blu impossibili
- traduzioni impossibili
- impossibilmente fresco
- qualcosa di impossibile
- impossibilmente elegante
Otto occorrenze in tre pagine. Ogni volta che serviva trasmettere stranezza, il modello defaultava su quella parola invece di trovare modi più specifici di descrivere l’anomalia.
La Sindrome del Teatro
E poi c’era la metafora teatrale, ripetuta fino all’inverosimile:
- “come un attore che prende il centro della scena”
- “aspettando la sua battuta”
- “scricchiolio teatrale”
3.5 aveva deciso che Port Said = teatro, e non poteva lasciar perdere il concetto anche quando non aggiungeva nulla.
4.5: Il Minimalista Funzionale
4.5 invece? Zero ossessioni.
Mitchell appare e sparisce senza che ogni frase debba ricordarti che è semi-trasparente. Hassan deteriora senza che ogni paragrafo ripeta “sta morendo”. Erik agisce senza che il narratore ti strilli “GUARDA QUANTO È NORDICO”.
Una volta stabilito un concetto, 4.5 lo dà per acquisito. Sa che il lettore ha memoria funzionante.
È la differenza tra uno scrittore che rilegge il proprio lavoro e uno che scrive in eterno presente, trattando ogni frase come isolata dal contesto.
Il Costo in Editing Time
Con 3.5 il workflow era:
- Genera testo
- Cerca/sostituisci ossessivo per varianti degli stessi concetti
- Cancella 20-30% di prosa ridondante
- Ri-bilancia personaggi vs trama
- Spezza loop metaforici
- Ora puoi iniziare l’editing sostanziale
Con 4.5:
- Genera testo
- Editing sostanziale diretto
30-40% di tempo risparmiato solo eliminando la fase “potatura delle ossessioni”.
Il Pattern ABC vs ABC(DEF)GHIJKLMNO
La differenza strutturale è ancora più profonda di quanto sembri.
3.5 ragiona così:
Introduci mistero simbolo
↓
Mostra che Hassan è strano
↓
Setup meeting con Erik
↓
Cliffhanger finale
Ogni task ha la sua sezione. Sai sempre quando un beat finisce e il prossimo inizia. È serializzazione pura.
4.5 ragiona così:
Mitchell appare [A]
+ rivela info tattica [B]
× mentre Hassan riconosce il suo futuro [C]
× e scopriamo natura di Phillips [D]
× che setup prossimo capitolo [E]
× con implicazioni worldbuilding [F]
Tutto compresso e intrecciato. Non “prima A poi B”, ma “A contiene B che attiva C mentre D emerge come conseguenza”.
È la differenza tra una checklist e un sistema complesso dove ogni elemento influenza gli altri.
Dove 3.5 Tradisce la Sua Natura AI
Pattern che trovi ovunque nel testo 3.5:
1. Similitudini Eccessive e Decorative
- “come un attore che prende il centro della scena”
- “come ghiaccio nel cristallo”
- “come se il pavimento fosse ghiaccio”
Ogni descrizione deve avere la sua similitudine. È esagerato.
2. Purple Prose Uniformemente Distribuita
Ogni paragrafo ha lo stesso “peso” stilistico. Nessuna variazione di densità. È come ascoltare qualcuno che parla sempre allo stesso volume – tecnicamente corretto ma innaturale.
3. Mystery Markers Espliciti
- “qualcosa di impossibile”
- “molto più strano di”
- “non poteva essere”
Il testo ti dice costantemente “questo è misterioso!” invece di fartelo sentire.
Dove 4.5 Suona Più Umano
Guarda come maneggia la stessa informazione (rivelazione di Mitchell):
“Ha cercato di hackerare la grammatica temporale. Di costringere il tempio a dargli quello che voleva invece di guadagnarselo.”
Zero abbellimenti. Informazione diretta. Ma il peso emerge dal contrasto con Thomas che “ha ottenuto l’accesso senza spezzare niente” due paragrafi dopo.
Il significato viene dalla giustapposizione, non dalla decorazione.
Cosa Significa per il Futuro: Proiezione a Sonnet 5.0
Qui la parte che mi tiene sveglio la notte (in senso buono).
Da Sonnet 3.5 a 4.5: 20 mesi.
Salto qualitativo: da 3-4 thread narrativi coordinati a 15+, eliminazione pattern ossessivi, prosa più umana.
Se la curva continua – e storicamente con questi modelli continua – Sonnet 5.0 (ipotizziamo fine 2025 / inizio 2026) potrebbe:
1. Coordinare 30-50 elementi narrativi simultanei
Significa: multi-POV complessi, political intrigue stratificato, worldbuilding denso come Dune o Malazan gestibile senza collassare.
2. Prosa indistinguibile da autore umano esperto
Non “buona per essere AI” – proprio buona. Con voce distintiva, variazione di ritmo, sottotesto sofisticato.
3. Auto-editing efficace
Riconoscimento di quando sta ripetendo, quando la metafora è già saturata, quando serve potatura. Meno lavoro per l’umano.
4. Genre mastery flessibile
Passa da hard SF a narrativa letteraria a thriller senza contaminazione di convenzioni tra generi.
5. Gestione del sottotesto complesso
Non solo “cosa succede” ma “cosa significa che succede”, con layer di interpretazione multipli che emergono organicamente.
Implicazioni (Scomode) per Scrittori
La domanda che nessuno vuole fare ma che va fatta: cosa rimane all’autore umano?
Risposta non-consolatoria: sempre meno sul piano esecutivo, sempre più sul piano visionario.
Se 4.5 può già gestire 15 thread narrativi, e 5.0 ne gestirà 50, il collo di bottiglia non sarà più “riesco a tenere insieme questa complessità?” ma “quale storia vale la pena di raccontare?”.
L’architettura narrativa diventa commodity. La visione rimane discriminante.
È come quando la fotografia digitale ha reso triviale l’aspetto tecnico – non ha ucciso la fotografia, ha solo spostato il valore verso occhio e timing del fotografo. O come quando i sintetizzatori hanno democratizzato la produzione musicale: non hanno eliminato i musicisti, hanno solo reso chiaro che saper suonare perfettamente le note non basta più.
Il Paradosso della Leggibilità
C’è però un twist interessante: più complessità non significa migliore libro.
3.5 era più lineare, sì, ma anche più immediatamente leggibile. ABC è più scorrevole di ABC(DEF)GHIJKLMNO.
4.5 produce testi che richiedono lettore attivo – devi connettere i punti, assemblare i layer. È più gratificante ma anche più faticoso.
La domanda diventa: il target reader vuole lavorare per la complessità?
Per urban fantasy “serio” (Miéville, Jemisin, Gaiman), sì. Per comfort read commerciale, forse no. È la differenza tra Cent’anni di solitudine e Il Codice da Vinci – entrambi validi, pubblici diversi.
Il Test dei Ruoli Complessi e Intercorrelati
Ecco dove emerge la vera differenza architetturale:
3.5 annaspa quando:
- Multi-POV con agenda parallele
- Mystery con 10+ clue che devono convergere
- Political intrigue con 5+ fazioni attive
- Worldbuilding dove magia influenza economia influenza cultura
- Qualsiasi scenario che richieda tracking di stati multipli simultanei
4.5 eccelle quando:
- Devi mantenere coerenza attraverso timeline multiple
- Character arc si intersecano e si influenzano reciprocamente
- Ogni scena deve avanzare 3-4 subplot diversi
- Il sottotesto è denso quanto il testo principale
È la differenza tra serializzazione forzata e parallelizzazione nativa.
3.5 tratta “deterioramento Hassan” come subplot che emerge “quando tocca a lui”. 4.5 mantiene “deterioramento Hassan” come stato persistente che colora ogni decisione, ogni scena, ogni dialogo – anche quando Hassan non è focus.
Framework Decisionale Pratico
Usa 3.5 (o equivalenti lineari) quando:
- Plot è naturalmente lineare (quest, viaggio, investigation step-by-step)
- Hai 1-3 protagonisti con archi semplici
- Genere richiede chiarezza (YA, thriller commerciale, romance)
- Worldbuilding è semplice o secondario
- Target reader vuole comfort read, non puzzle narrativo
Usa 4.5 (o superiori) quando:
- Plot è multi-threaded (intrigo politico, ensemble cast, mystery complesso)
- Hai 5+ elementi che devono evolvere in parallelo
- Genere premia complessità (narrativa letteraria, hard SF, epic fantasy)
- Worldbuilding è denso e interconnesso
- Target reader vuole lavorare per capire
La Curva di Apprendimento delle Macchine (e Nostra)
Quello che stiamo osservando è un salto generazionale nell’architettura cognitiva dei modelli linguistici:
Sonnet 3.5 aveva:
- Attention pattern che favorivano dipendenze lineari (A→B)
- Focus ristretto (3-4 elementi alla volta)
- Necessità di completare un thread prima di iniziare il prossimo
- Tendenza al loop su pattern vincenti (le “ossessioni”)
Sonnet 4.5 ha:
- Attention pattern che supportano dipendenze circolari (A↔B↔C)
- Focus distribuito (10-15 elementi simultanei)
- Thread interlacciati che evolvono in parallelo
- Metacognizione sufficiente a riconoscere pattern saturi
Non è questione di “meglio” in assoluto – è questione di fit tra architettura del modello e complessità del compito.
Il Costo Nascosto: Effort di Verifica
C’è però un aspetto che emerge solo in produzione: con 15 thread attivi, il testing della coerenza diventa più complesso.
Con 3.5: se Hassan è malato in Cap 3, verifichi Cap 4, Cap 5, Cap 6… linearmente.
Con 4.5: se Hassan è malato in Cap 3, questo influenza:
- Sue capacità fisiche (ovvio)
- Decisioni tattiche del team (derivato)
- Dinamiche relazionali (sottile)
- Scelte narrative di altri POV (emergente)
- Temi filosofici sulla mortalità (meta)
Devi verificare cascate di implicazioni, non solo continuità lineare.
È più potente ma richiede QA più sofisticato.
Conclusione: Siamo a Un Punto di Flesso
Tra 20 mesi siamo passati da AI che scriveva “bene per essere AI” a AI che scrive “bene, punto”.
Tra altri 10-12 mesi, probabilmente, avremo AI che scrive meglio del 90% degli scrittori professionali – almeno sul piano tecnico-architetturale.
Non è apocalisse né utopia. È semplicemente shift dei paradigmi.
Gli scrittori che sopravviveranno non saranno quelli tecnicamente più bravi (quella skill si sta commoditizzando), ma quelli con voce, visione, prospettiva unica.
Come i fotografi post-digitale: la tecnica è democratizzata, il valore è nello sguardo. Come i musicisti post-sintetizzatore: saper suonare le note non basta, serve qualcosa da dire.
E come diceva Hassan nel mio libro (o forse era 4.5 che parlava attraverso Hassan – meta quanto basta): “Dipende interamente da come conti gli anni. E quali scegli di contare.”
Postscriptum: La Domanda Vera
Dopo questo esperimento, la domanda non è più “l’AI può scrivere?”.
La domanda è: cosa vogliamo raccontare ora che la capacità esecutiva non è più il limite?
Perché se in 20 mesi siamo passati da linearità ossessiva a orchestrazione sinfonica, e tra 12 mesi avremo capacità ancora superiori…
Beh, forse è il momento di pensare storie più ambiziose.
Storie che due anni fa erano impraticabili perché nessun essere umano (e nessuna AI) poteva tenerne insieme la complessità.
Storie che richiedono 50 thread attivi, 20 POV intrecciati, worldbuilding che fa sembrare Il Trono di Spade un tutorial.
Non perché “ora possiamo”, ma perché forse quelle storie – quelle davvero complesse, quelle che rispecchiano la vera densità del mondo – sono le uniche che vale ancora la pena raccontare.
Il resto è già commodity.
Note tecniche:
- Esperimento basato su 16 capitoli, ~60.000 parole per versione
- Sonnet 3.5: rilascio giugno 2024
- Sonnet 4.5: rilascio febbraio 2025
- Gap temporale: 20 mesi
- Proiezione Sonnet 5.0: Q4 2025 / Q1 2026
- Metodologia: stesso canovaccio estratto, generazione completa con entrambi i modelli, analisi comparativa strutturale e stilistica
Per approfondire:
- Pattern recognition vs pattern addiction nei modelli generativi
- Il concetto di “purple prose” come sintomo di feedback loop cognitivo
- Evoluzione dell’architettura attention nei transformer
- Implicazioni filosofiche della commoditizzazione della competenza tecnica
“Se Erik Sandersen mi fa causa per averlo ridotto a ‘metafora del ghiaccio ambulante’, la colpa è di Sonnet 3.5. Io ho solo documentato.”
Esperimento condotto tra febbraio 2024 e febbraio 2025. Nessun console svedese è stato maltrattato nella realizzazione di questo articolo. Hassan insiste che controlli il formato delle citazioni. Mitchell suggerisce di verificare la coerenza temporale. Thomas vorrebbe solo che la gente smettesse di ossessionarsi sui suoi occhi.

Leave a comment