di TOMMASO SASO-
Il 30 novembre 2022 è una data che segna la storia dell’intelligenza artificiale. Ricorderete come quel giorno OpenAI rilasciò ChatGPT al pubblico. Pensate che in soli cinque giorni raggiunse un milione di utenti e in due mesi, cento milioni! Nessun prodotto tecnologico aveva mai avuto una crescita così esplosiva. Ma ChatGPT non era solo un nuovo servizio, era la dimostrazione pubblica di una rivoluzione che covava da anni nei laboratori di ricerca e i (LLM) Large Language Models avevano imparato a pensare con le parole.
GPT (Generative Pre-trained Transformer), che rappresenta l’evoluzione più sofisticata del Natural Language Processing, non è solo un sistema che capisce il linguaggio, è una macchina che pensa attraverso il linguaggio. Può scrivere saggi filosofici, programmare software, risolvere problemi matematici, creare poesie, persino scherzare. Sembra possedere una forma di intelligenza generale emergente che nessuno aveva previsto.
La storia dei Large Language Models inizia con una semplice osservazione, ovvero che più dati e più parametri portano a capacità emergenti sorprendenti. GPT-1, rilasciato nel 2018, aveva 117 milioni di parametri. GPT-2 (2019) salì a 1.5 miliardi. GPT-3 (2020) esplose a 175 miliardi. GPT-5 (2025) probabilmente supera il trilione!
Ma cosa sono esattamente questi “parametri”? Beh, immaginate il cervello umano come una rete di 86 miliardi di neuroni connessi da trilioni di sinapsi. I parametri in un LLM sono l’equivalente digitale, ovvero connessioni ponderate che determinano come l’informazione fluisce attraverso la rete. Più parametri significano più connessioni, più sfumature, più capacità di catturare pattern (percorsi) complessi nel linguaggio.
L’addestramento di un LLM è un processo di una complessità sbalorditiva. GPT-5 è stato nutrito con trilioni di parole, praticamente tutti i testi pubblicamente disponibili su internet, libri digitalizzati, articoli scientifici, articoli giornalistici ecc. Ha “letto” più contenuti di quanti un essere umano potrebbe fare in mille vite.
Il meccanismo alla base è semplice, si basa sulla predizione della parola successiva. In pratica, dato un testo parziale, GPT calcola la probabilità di ogni possibile parola che potrebbe seguire. Sembra banale, ma questa task (compito) apparentemente semplice richiede comprensione profonda di grammatica, semantica, logica, conoscenza del mondo. Per predire che dopo “il sole sorge a” viene “est”, il sistema deve “capire” di astronomia, geografia e linguaggio.
Attraverso miliardi di esempi, GPT impara rappresentazioni incredibilmente ricche del linguaggio. Scopre che “re” sta a “regina” come “uomo” sta a “donna”, impara che “Parigi” è più simile a “Londra” che a “Apple”. Sviluppa intuizioni su causalità, temporalità, logica. È come se l’intelligenza emergesse naturalmente dalla complessità linguistica.
Ma i LLM hanno rivelato capacità che vanno oltre il linguaggio. Possono ragionare matematicamente, programmare software, giocare a scacchi (descrivendo mosse a parole), persino simulare personalità diverse. GPT-5 può “guardare” immagini e descriverle, analizzare grafici, rispondere a domande su contenuto visivo, in una multimodalità che si espande ai confini del possibile.
Si può immaginare come le applicazioni pratiche siano a questo punto esplose in ogni settore. I programmatori usano GitHub Copilot (basato su GPT) per scrivere codici più velocemente e gli scrittori usano AI per superare il blocco creativo! Gli studenti usano ChatGPT per spiegazioni personalizzate su qualsiasi argomento e anche, ahimè, per preparare le tesi di laurea, mentre le aziende automatizzano customer service, content creation e data analysis.
In medicina, gli LLM stanno letteralmente rivoluzionando diagnosi e ricerca, e infatti possono analizzare sintomi descritti in linguaggio naturale, suggerendo diagnosi differenziali, spiegando condizioni mediche in termini comprensibili ai pazienti.
Nelle attività legali, AI “avvocati” analizzano contratti, redigono documenti, ricercano tutti i precedenti. DoNotPay, “il primo robot avvocato al mondo”, aiuta consumatori con controversie legali.
Ma i LLM sollevano questioni profonde che vanno oltre la tecnologia. Quando GPT-5 risolve problemi che richiederebbero PhD (dottorati di ricerca) per essere compresi, sta “ragionando” o è un “pattern matching sofisticato”? Quando scrive poesie che commuovono, sta “creando” o “ricombinando” elementi visti nei dati di addestramento?
Il fenomeno delle cosiddette” allucinazioni” è particolarmente intrigante. I LLM possono inventare fatti plausibili ma falsi, creare citazioni di studi inesistenti, confabulare con sicurezza assoluta, ma speciosa. È creatività involontaria che dimostra sia la potenza che i limiti di questi sistemi.
La questione dell’”allineamento” rappresenta quindi una sfida esistenziale. Come garantire che sistemi così potenti rimangano allineati con valori umani? I LLM imparano da testo umano che riflette tutti i nostri pregiudizi, errori, bias cognitivi. Possono pertanto perpetuare stereotipi, amplificare disinformazione, essere utilizzati per manipolazione su scala industriale.
OpenAI, Anthropic, Google stanno investendo massicciamente nella sicurezza.
L’impatto economico dei LLM è già molto importante, tanto cheMcKinsey stima che l’AI generativa potrebbe aggiungere 2,6-4,4 trilioni di dollari annui all’economia globale. È una nuova economia costruita su intelligenza linguistica artificiale.
I LLM stanno anche democratizzando creatività e conoscenza, infatti chiunque può ora scrivere codice descrivendo cosa vuole in linguaggio naturale. Gli studenti possono avere tutor personalizzati 24/7 e anche persone senza background tecnico possono creare contenuti sofisticati. Praticamente siamo difronte ad una amplificazione di capacità umane su scala mai vista.
Il futuro dei LLM promette sviluppi ancora più radicali. Modelli multimodali che integrano testo, immagini, audio, video in comprensione unificata. AI agenti che possono eseguire compiti complessi nel mondo digitale autonomamente. Sistemi che imparano continuamente da interazioni senza dimenticare conoscenze pregresse.
Se macchine possono pensare con parole, scrivere come poeti, ragionare come filosofi, cosa rimane allora di unicamente umano? Forse la risposta sta non in cosa facciamo, ma nel perché lo facciamo. Intenzione, significato e esperienza vissuta potrebbero essere l’ultima frontiera dell’umanità.
In conclusione, i Large Language Models rappresentano forse il più grande salto nell’AI dalla sua nascita, hanno trasformato intelligenza artificiale da tool specializzato su specifici argomenti ad assistenti generali. Ogni giorno, milioni di persone conversano con AI, collaborano con AI, imparano da AI, sicuramente come molti di voi!
La prossima volta, esploreremo come questa intelligence linguistica si combini con la capacità di azione nel mondo attraverso il Reinforcement Learning, il tipo di AI che ha imparato a vincere a giochi impossibili e potrebbe presto imparare a navigare la complessità del mondo reale.




