System thinking applicato
L'IA è una componente in un sistema più grande. La progettiamo come tale: dipendenze, fallback, osservabilità, percorsi di degradazione gentile.
Metodo · Come rendiamo consegnabile un sistema IA probabilistico
Non vendiamo "metodo" in astratto. Vendiamo sistemi IA governabili grazie a un metodo: architetture, gate, verifiche, formati controllati e tracciabilità che trasformano modelli generativi in capacità operative reali.
L'IA propone. Il workflow struttura.La verifica seleziona. Le evidenze correggono.
Principio architetturale
Un LLM produce output diversi su input simili. È costruito così. Non promettiamo di renderlo deterministico — sarebbe una bugia tecnica. Promettiamo di rendere verificabile e ripetibile il processo che lo usa: dati, prompt, output, controlli, formati, gate, tracciabilità e criteri di accettazione espliciti. Quello che entra in produzione non è il modello da solo — è un sistema che attorno al modello costruisce le condizioni per cui ogni output può essere ispezionato, validato contro criteri espliciti, e accettato o respinto su base ripetibile.
Il concetto-firma
Il modello al centro è e resta probabilistico — funziona così, non si può evitare. Attorno costruiamo il guscio: input strutturati, prompt versionati, output vincolati da schema, gate di accettazione, fallback, tracciabilità, human-in-the-loop. Il guscio è deterministico per costruzione: ogni decisione è ispezionabile, ogni output verificabile contro criteri espliciti.
Non rendiamo deterministico il modello.
Rendiamo verificabile e consegnabile il workflow che lo usa.
I sette gate del metodo
Non è una checklist astratta. Sono i sette livelli su cui interveniamo, ognuno con strumenti, output e criteri di verifica.
L'IA è una componente in un sistema più grande. La progettiamo come tale: dipendenze, fallback, osservabilità, percorsi di degradazione gentile.
Schema espliciti, validazione su entrambi i lati. Niente "il modello restituirà più o meno questo": restituisce esattamente questo, o il gate successivo blocca.
Per ogni output: criteri scritti che dichiarano cosa è accettabile, cosa va a revisione umana, cosa va respinto. Soglie, ispezioni, fallback.
Il sistema chiama l'umano quando i gate dicono che serve, non come patch postuma. Dove, perché, e cosa fa l'operatore dopo.
Ogni output ha attaccati: input, modello invocato, prompt usato, gate attraversati, esito dei gate. Audit ricostruibile a posteriori.
Golden set, test deterministici dei gate, regressione su cambi di modello. Quando aggiorni il modello sai cosa rompi.
Ogni decisione tecnica ha una motivazione scritta. Non "best practice", ma "in questo contesto, con questi vincoli, abbiamo scelto X per Y".
Il ciclo di delivery
Dall'inquadramento iniziale al sistema in esercizio. Il metodo evita l'equivoco più comune: scambiare una demo rapida per un sistema pronto.
Problema, attori, vincoli, dati, ambiente, rischio e outcome desiderato.
Pattern, stack, confini, cloud/local, sicurezza e roadmap tecnica.
MVP rapido per validare flussi, assunzioni e interfacce operative.
Gate su struttura, policy, test, runtime, dipendenze e sicurezza.
Deploy, logging, monitoraggio, backup, credenziali e documentazione d'esercizio.
Backlog evolutivo, feedback, nuove release e miglioramento continuo.
Esempio applicato
Domanda libera in linguaggio naturale ("quali contratti del 2023 includono una clausola di rescissione anticipata?").
Retrieval ibrido (vector + keyword) → re-ranking → gate di confidenza → prompt strutturato verso LLM → output JSON schema-validated → gate di output.
Una risposta + per ogni claim un riferimento al documento, paragrafo, modello invocato, prompt applicato, confidenza retrieve, confidenza output. Se uno dei gate fallisce, il sistema risponde "non posso rispondere con confidenza" invece di confabulare.
Il responsabile audit può ispezionare ogni risposta a posteriori. Il responsabile sicurezza vede che i contratti non escono mai dal perimetro. Il responsabile costi ha un tetto operativo. Il legale ha la tracciabilità.
Un assessment iniziale verifica compatibilità tecnica, vincoli normativi, ROI atteso e tempi realistici.