Lab
Articoli
Pubblicazioni tecniche su verifica deterministica, Private AI, architetture post-LLM, epistemologia applicata e infrastrutture di inferenza locale.
Due paper tecnici, dai due estremi dello stack.
Pubblico due documenti che, insieme, mostrano lo stesso principio applicato a strati diversi del sistema: l'hardware che regge dodici ore di inferenza locale continua, e il software che verifica deter...
Meta-knowhow: il nuovo superpotere nell'era dell'intelligenza artificiale
Il valore di un professionista una volta si misurava in ciò che sapeva. Oggi che le macchine aggregano informazione più velocemente di chiunque, il valore si sposta sul controllo del flusso di conosce...
GPU per l'interpretazione. CPU per la conoscenza operativa.
La maggior parte pensa che l'infrastruttura IA finisca con il modello. Non è così.
Fluency non è ragionamento. Agli LLM serve un layer logico.
Più di un anno fa ho scritto che una direzione seria per l'IA fosse Transformers + Prolog. Oggi la riformulerei più precisamente: agli LLM serve un layer di esecuzione logica dichiarativa.
La semantica da sola non basta.
Un sistema può collegare concetti, organizzare simboli, produrre linguaggio altamente coerente. Può mettere in relazione sonno, stress, glucosio, idratazione e comportamento in modi che appaiono signi...
Dalla previsione all'ammissibilità nell'IA medica.
Il punto non è se un modello performa brillantemente su benchmark, paper o dataset clinici. La domanda reale è diversa: qual è lo stato epistemico del suo output sul singolo paziente?
Come testo vibrazioni e raffreddamento prima di fidarmi di hardware IA costoso.
Quasi nessuno parla di cosa succede quando lo accendi davvero.
Il mio primo test di inferenza locale è durato 180 secondi.
Quattro NVIDIA K80, GPT-J, server tower standard. A 85°C il thermal throttling si è attivato. A 90°C tutte e quattro le schede si sono spente. Aggiungere ventole aftermarket guadagnava circa 5°C. Irri...
Epistemic Software Engineering.
Il costo marginale di produrre software con IA si sta avvicinando a zero. Il costo di sapere se quel software è affidabile, no.
Lo smartphone come control plane per software e infrastruttura.
Per decenni, sistemi software seri hanno richiesto una workstation. Quell'assunto si sta rompendo.
Un modello abliterato in pubblico è un rischio. Dentro un lab controllato, può essere una capability.
Si parla di self-hosting come se riguardasse solo privacy o costo. Il vantaggio reale è controllare come si comporta il modello.
Tutti dicono che il self-hosting dell'IA è per risparmiare. Non è così.
È iniziato con due cose. Privacy come confine architetturale. E qualcosa che non mi aspettavo.
C'è un suono che la maggior parte degli AI engineer non sente mai.
Il ronzio di una macchina locale che calcola embedding — niente cloud, niente API call, nessun dato che lascia l'edificio.
L'incompletezza dell'intelligenza artificiale: umanità e IA, un'unione necessaria.
Il teorema di incompletezza di Gödel ci insegna che in ogni sistema logico-matematico ci saranno sempre verità non dimostrabili all'interno del sistema stesso.
Transformers e Prolog: la rivoluzione ibrida dell'IA.
Cosa succede quando un poeta e un matematico uniscono le forze?
La potenza della semantica: l'IT del futuro tra RAG, embedding e il web come database.
Dal lavoro manuale alla potenza degli orchestratori.
Generazione automatica di infrastruttura cloud con Llama3 e Ollama.
Un caso pratico: console Linux + Python + Ollama (LLM locale) + modello Llama3 per generare script Terraform pronti.
La più grande bolla della storia nasce da una parola.
Bank of England, IMF, ECB hanno rotto un tabù: hanno pronunciato apertamente la parola "bolla" riferita all'intelligenza artificiale.
Non è l'IA il problema, ma chi la usa senza criterio.
Un uomo ha chiesto a ChatGPT come ridurre il sale e si è sentito rispondere "usa il bromuro di sodio". Titoli: "L'IA è pericolosa".
Dal thermal testbed alla produzione: Qwen 2.5-Coder 32B su €300 di GPU usate.
Cosa diventa possibile quando l'ingegneria è fatta bene. Quattro generazioni di hardware dopo, il sistema di inferenza locale ospita un modello da 32 miliardi di parametri su due GPU usate.
Dal tool specialist al System Thinker: il filo conduttore di vent'anni.
Vent'anni in IT non sono una collezione di tool sul curriculum. Sono una traiettoria — e la traiettoria ha una direzione precisa.