InnovazioneTendenze

ChatGPT non è intelligenza artificiale: differenza tra LLM e IA

Oggi si parla continuamente di ChatGPT come una IA. Tuttavia, sono due cose collegate ma non sinonimi.

Negli ultimi anni, l’intelligenza artificiale (IA) ha dominato le conversazioni sulla tecnologia e ha catturato l’attenzione del pubblico come uno dei trend più significativi nel panorama tecnologico contemporaneo. Dai chatbot alle auto autonome, dalle previsioni di mercato alla diagnosi medica assistita da computer, l’IA sembra promettere soluzioni rivoluzionarie per una vasta gamma di sfide umane.

Tuttavia, mentre i media mainstream spesso celebrano le potenzialità dell’IA come un’innovazione trasformativa destinata a migliorare la nostra vita quotidiana, questa narrazione spesso trascura la complessità e le implicazioni più profonde di questa tecnologia. In questo articolo, esploreremo il motivo per cui le informazioni mainstream sull’IA sono spesso incomplete e fuorvianti, e cercheremo di scoprire il vero impatto che l’IA sta avendo e avrà sulla società.

Partiamo dai seguenti presupposti:

Cos’è davvero Intelligenza Artificiale

L’intelligenza artificiale (IA) è un campo dell’informatica che si occupa dello sviluppo di sistemi e tecnologie capaci di eseguire compiti che richiedono intelligenza umana. Questi compiti possono includere il riconoscimento di pattern, il ragionamento, il problem solving, il linguaggio naturale, il movimento e il controllo di dispositivi fisici, e molto altro. L’obiettivo dell’IA è quello di creare sistemi che possano imitare, ampliare o migliorare le capacità umane in diversi contesti, come la medicina, l’automazione industriale, la guida autonoma, il riconoscimento vocale e molto altro ancora. Gli approcci all’IA possono includere l’apprendimento automatico, le reti neurali artificiali, la logica simbolica, l’elaborazione del linguaggio naturale e molte altre tecnologie e metodologie. In sostanza, l’IA cerca di creare sistemi in grado di apprendere da dati, adattarsi all’ambiente circostante e svolgere compiti in modo autonomo e intelligente.

L’IA è sostanzialmente una materia di studi universitari.

 

E ChatGPT?

ChatGPT è un modello di elaborazione del linguaggio naturale (NLP) e utilizza una versione avanzata della trasformazione di GPT (Generative Pre-trained Transformer), tradotto, Trasformatore Generativo Pre-Addestrato. GPT è parte di una categoria più ampia di modelli noti come Large Language Models, o LLM (Grandi Modelli Linguistici), che sono sistemi di IA in grado di generare testo in modo coerente e comprensibile. L’obiettivo principale dei LLM è quello di creare modelli linguistici avanzati che possano essere utilizzati in una varietà di applicazioni, dall’elaborazione automatica del linguaggio naturale alla generazione di testo.

ChatGPT è uno strumento che usa sistemi di IA per generare testi partendo da altri testi.

 

profilo di umanoide robotico dal quale partono una serie di ramificazioni colorate

 

Il vecchio sogno dell’Intelligenza Artificiale

L’IA è uno dei sogni più antichi dell’umanità. Risale almeno alla Grecia classica e al mito di Efesto, fabbro degli dei, che aveva il potere di dare vita a creature metalliche. Variazioni sul tema sono apparse in miti e opere di finzione da allora. Ma è stato solo con l’invenzione del computer alla fine degli anni ’40 che l’IA ha iniziato a sembrare plausibile.

I grandi modelli linguistici rappresentano un notevole avanzamento nell’ambito dell’IA, ma siamo ancora lontani dal raggiungere le capacità di livello umano.

L’intelligenza artificiale è stata un sogno per secoli, ma solo di recente è diventata “virale” grazie a enormi progressi nella potenza di calcolo e nell’analisi dei dati. I grandi modelli linguistici (LLM) come ChatGPT sono essenzialmente una forma molto sofisticata di auto-complete (auto-completamento). La ragione per cui sono così impressionanti è perché i dati di addestramento consistono nell’intero internet.

I LLM potrebbero essere un ingrediente nella ricetta per una vera intelligenza artificiale generale, ma certamente non sono l’intera ricetta — ed è probabile che non conosciamo ancora alcuni degli altri ingredienti.

 

Usare ChatGPT è una porta sulla IA

Grazie a ChatGPT possiamo finalmente tutti sperimentare l’intelligenza artificiale. Tutto ciò di cui hai bisogno è un browser web e puoi parlare direttamente al sistema di intelligenza artificiale più sofisticato del pianeta — i traguardi culminanti di 70 anni di sforzo. E sembra una vera intelligenza artificiale — quella che abbiamo tutti visto nei film. Quindi, ciò significa che abbiamo finalmente trovato la ricetta per una vera intelligenza artificiale? È la fine della strada per l’IA ora in vista?

I computer e il concetto di Intelligenza Artificiale

I computer sono macchine che seguono istruzioni. I programmi che diamo loro non sono altro che istruzioni estremamente dettagliate — ricette che il computer segue diligentemente. Il tuo browser web, il tuo client di posta elettronica e il tuo elaboratore di testi si riducono tutti a queste liste di istruzioni incredibilmente dettagliate. Quindi, se la “vera intelligenza artificiale” è possibile — il sogno di avere computer altrettanto capaci degli esseri umani — allora anch’essa si ridurrà a una tale ricetta. Tutto ciò che dobbiamo fare per rendere l’IA una realtà è trovare la ricetta giusta. Ma che aspetto potrebbe avere una tale ricetta? E dato l’entusiasmo recente per ChatGPT, GPT-4 e BARD — grandi modelli linguistici (LLM), per dar loro il loro nome corretto — abbiamo finalmente trovato la ricetta per la vera intelligenza artificiale?

AI Simbolica vs. AI Neurale

Per circa 40 anni, l’idea principale che ha guidato i tentativi di costruire l’IA era che la sua ricetta coinvolgesse la modellazione della mente cosciente — i pensieri e i processi di ragionamento che costituiscono la nostra esistenza conscia. Questo approccio era chiamato AI simbolica, perché i nostri pensieri e il nostro ragionamento sembrano coinvolgere linguaggi composti da simboli (lettere, parole e punteggiatura). L’IA simbolica coinvolgeva il tentativo di trovare ricette che catturassero queste espressioni simboliche, o per manipolare questi simboli per riprodurre il ragionamento e la presa di decisioni.

serie di ramificazioni colorate che si trasformano in dati

 

Modellare il cervello: ruolo e ascesa delle Reti Neurali

Invece di modellare la mente, un’alternativa ricetta per l’IA coinvolge la modellazione delle strutture che vediamo nel cervello. Dopo tutto, i cervelli umani sono le uniche entità di cui siamo a conoscenza al momento che possono creare intelligenza umana. Se osservi un cervello al microscopio, vedrai enormi quantità di cellule nervose chiamate neuroni, collegati l’uno all’altro in vastissime reti. Ogni neurone cerca semplicemente modelli nelle sue connessioni di rete. Quando riconosce un modello, invia segnali ai suoi vicini. A loro volta, questi vicini cercano modelli e, quando ne vedono uno, comunicano con i loro pari, e così via.

Le reti neurali sono state studiate continuamente dagli anni ’40, venendo in auge e uscendo di moda in vari momenti (notabilmente alla fine degli anni ’60 e a metà degli anni ’80), e spesso venendo considerate in competizione con l’IA simbolica. Ma è negli ultimi dieci anni che le reti neurali hanno decisamente cominciato a funzionare. Tutto l’entusiasmo sull’IA che abbiamo visto nell’ultimo decennio è essenzialmente dovuto al fatto che le reti neurali hanno iniziato a mostrare progressi rapidi su una serie di problemi di IA.

L’Impatto delle Reti Neurali su ChatGPT e altri sistemi AI

Tutti i sistemi AI di cui abbiamo sentito parlare di recente utilizzano reti neurali. Ad esempio, AlphaGo, il famoso programma per il gioco del Go sviluppato dalla società di intelligenza artificiale con sede a Londra DeepMind, che nel marzo 2016 è diventato il primo programma per il Go a battere un campione del mondo, utilizza due reti neurali, ognuna con 12 strati neurali. Anche i recenti sistemi AI di rilievo — ChatGPT e GPT-4 di OpenAI, così come BARD di Google — utilizzano reti neurali. Ciò che rende diversi gli sviluppi recenti è semplicemente la loro scala. Tutto ciò che li riguarda è su una scala che fa girare la testa.

Le dimensioni colossali dei Modelli Linguistici

Consideriamo il sistema GPT-3, annunciato da OpenAI nell’estate del 2020. Questa è la tecnologia alla base di ChatGPT, ed è stata l’LLM che ha segnalato una svolta in questa tecnologia. Le reti neurali che compongono GPT-3 sono enormi. Gli esperti di reti neurali parlano del numero di “parametri” in una rete per indicarne la scala. Un “parametro” in questo senso è un componente della rete, sia un singolo neurone che una connessione tra neuroni. GPT-3 aveva in totale 175 miliardi di parametri; si dice che GPT-4 ne abbia 1 trilione. A titolo di confronto, un cervello umano ha circa 100 miliardi di neuroni in totale, collegati tramite fino a 1.000 trilioni di connessioni sinaptiche. Per quanto siano vasti gli attuali LLM, sono ancora lontani dalla scala del cervello umano.

icona intelligenza artificiale contornato da icone tecnologiche

 

Gli LLM non sono vera IA

La prima cosa ovvia da dire è che gli LLM non sono semplicemente una tecnologia adatta per nessuna delle capacità fisiche. Gli LLM non esistono affatto nel mondo reale, e le sfide poste dall’IA robotica sono molto, molto lontane da quelle che gli LLM sono stati progettati per affrontare. E infatti, il progresso sull’IA robotica è stato molto più modesto rispetto al progresso sugli LLM. Forse sorprendentemente, capacità come la destrezza manuale per i robot sono ancora lontane dall’essere risolte. Inoltre, gli LLM non suggeriscono alcun modo per affrontare tali sfide.

Costruire una IA che ti aggiusta il lavandino è più difficile che creare un calcolatore.

 

Capacità mentali e LLM

Naturalmente, si può facilmente immaginare un sistema AI che sia pura intelligenza software, per così dire, quindi come si confrontano gli LLM con le capacità mentali elencate sopra? Beh, di queste, l’unica su cui gli LLM possono davvero vantare di aver compiuto progressi molto sostanziali è l’elaborazione del linguaggio naturale, che significa essere in grado di comunicare efficacemente in lingue umane ordinarie. Nessuna sorpresa lì; è per questo che sono stati progettati.

Ma la loro competenza abbagliante nella comunicazione simile a quella umana ci porta forse a credere che siano molto più competenti in altre cose di quanto non siano in realtà. Possono fare un ragionamento logico e risolvere alcuni problemi superficiali, ma al momento è davvero superficiale.

Forse dovremmo invece stupirci del fatto che possano fare qualcosa oltre all’elaborazione del linguaggio naturale. Non sono stati progettati per fare altro, quindi qualsiasi altra cosa è un bonus — e qualsiasi capacità aggiuntiva deve in qualche modo essere implicita nel testo su cui il sistema è stato addestrato.

Limitazioni degli LLM

Per questi motivi, e altri, mi sembra improbabile che la sola tecnologia LLM possa fornire una via per la “vera IA”.

Gli LLM sono entità piuttosto strane e disincarnate. Non esistono nel nostro mondo in nessun senso reale e non ne sono consapevoli. Se lasci un LLM a metà conversazione e vai in vacanza per una settimana, non si chiederà dove sei. Non è consapevole del passare del tempo o di qualsiasi altra cosa. È un programma informatico che letteralmente non sta facendo nulla finché non digiti un prompt e poi semplicemente calcola una risposta a quel prompt, momento in cui torna nuovamente a non fare nulla.

La loro conoscenza enciclopedica del mondo, per quanto limitata, è congelata al punto in cui sono stati addestrati. Non sanno nulla oltre a quello.

 

Limiti di esperienza e consapevolezza degli LLM

E gli LLM non hanno mai sperimentato nulla. Sono solo programmi che hanno assorbito quantità inimmaginabili di testo. Gli LLM potrebbero fare un ottimo lavoro nel descrivere la sensazione di essere ubriachi, ma questo è solo perché hanno letto molte descrizioni di essere ubriachi. Non l’hanno sperimentato e non possono sperimentarlo loro stessi.

Gli LLM non hanno altro scopo se non produrre la migliore risposta al prompt che dai loro.

 

Ciò non significa che non siano impressionanti (lo sono) o che non possano essere utili (lo sono). E credo sinceramente che siamo in un momento di svolta nella tecnologia. Ma non confondiamo questi veri successi con la “vera IA”. Gli LLM potrebbero essere un ingrediente nella ricetta per la vera IA, ma sicuramente non sono l’intera ricetta — e sospetto che non sappiamo ancora quali siano alcuni degli altri ingredienti.

Articoli Correlati