di Noemi Ricci
Prima ristretto a una nicchia di appassionati dell’intelligenza artificiale (AI), ora quasi diventato di uso comune, praticamente tutti abbiamo almeno sentito parlare – se non usato – ChatGPT.
Per chi non lo sapesse, si tratta di un modello di linguaggio sviluppato da OpenAI, come risultato di anni di ricerca nel campo dell’intelligenza artificiale. Il suo addestramento consiste nell’analisi di vasti insiemi di dati testuali provenienti da Internet, libri, e altre fonti. Questo gli permette di apprendere modelli di linguaggio complessi e di rispondere in modo coerente a una varietà di richieste.
I chatbot, in generale, sono programmi informatici progettati per interagire con gli utenti attraverso il linguaggio naturale. Possono essere utilizzati per rispondere a domande, fornire informazioni, eseguire azioni specifiche o automatizzare compiti ripetitivi. I chatbot possono essere implementati su siti web, app, piattaforme di messaggistica e altri canali di comunicazione per migliorare l’esperienza dell’utente e ottimizzare le operazioni aziendali.
Come funziona ChatGPT
La versione più recente di ChatGPT è basata sulla quarta generazione (GPT-4) di modelli di trasformatori generativi, noti come GPT (Generative Pre-trained Transformer), riservata però agli utenti Plus (in abbonamento). L’ultima versione open source è GPT-3,5. Tra le principali differenze c’è la base di conoscenza: GPT-3,5 possiede informazioni aggiornate fino a settembre 2021, mentre il nuovo modello include informazioni aggiornate fino ad aprile 2023. GPT-4 supporta, inoltre, l’elaborazione di testi decisamente più lunghi (fino a 300 pagine di un libro) e presenta alcune altre migliorie.
Ma vediamo di capire meglio cosa sono e come funzionano i modelli di trasformatori generativi, analizzando il significato dei termini che portano all’acronimo GPT:
- Generative: questo termine indica la capacità del modello di generare testo in modo autonomo. Il modello è in grado di produrre nuovi contenuti testuali in risposta a input o domande, senza che il testo specifico sia stato precedentemente fornito durante il suo addestramento.
- Pre-trained: il modello è preaddestrato su un vasto corpus di testo prima di essere messo a disposizione degli utenti. Durante questa fase di preaddestramento, il modello impara a comprendere il linguaggio naturale, la struttura delle frasi e il contesto attraverso l’analisi di grandi quantità di dati testuali provenienti da Internet, libri e altre fonti.
- Transformer: il termine “Transformer” si riferisce all’architettura del modello, che è basata sul Transformer, un tipo di rete neurale ricorrente (RNN) che ha dimostrato di avere eccellenti capacità nel trattare le dipendenze a lungo termine nei dati sequenziali, come il linguaggio naturale.
In sostanza, l’approccio “Generative Pre-trained Transformer” sfrutta il preaddestramento su un vasto corpus di testo per insegnare al modello le strutture linguistiche e semantiche. Una volta preaddestrato, il modello può essere affinato su task specifici o utilizzato per generare testo coerente in risposta a nuovi input.
A cosa serve ChatGPT
Quanto all’utilità di ChatGpt e dei tool alternativi, questi possono essere impiegati in diversi contesti. Sono infatti molteplici gli utilizzi per i modelli di linguaggio come ChatGPT, sia per aziende che per individui. Ecco alcuni possibili utilizzi:
- Generazione di Contenuti: può essere utilizzato per creare contenuti scritti, come articoli, descrizioni di prodotti, e-mail, copie pubblicitarie e altro ancora.
- Assistenza Virtuale: può essere integrato in sistemi di assistenza virtuale per rispondere automaticamente a domande comuni o fornire supporto di base ai clienti.
- Ricerca e Analisi: può analizzare grandi quantità di testo per identificare tendenze, estrarre informazioni chiave o svolgere ricerche specifiche.
- Traduzione Automatica: può essere implementato per tradurre testi da una lingua all’altra, facilitando la comunicazione multilingue.
- Sviluppo di Applicazioni: è in grado di integrarsi in applicazioni esistenti per arricchire le funzionalità linguistiche e migliorare l’interazione utente.
- Formazione Automatica: può essere utilizzato per addestrare automaticamente modelli in specifici settori o domini di conoscenza.
- Creazione di Dialoghi Interattivi: può essere sfruttato per creare chatbot interattivi per siti web, app o piattaforme di messaggistica.
- Generazione di Codice: può fornire assistenza nello sviluppo di codice, fornendo esempi di codice, spiegazioni e risposte a domande di programmazione.
- Supporto Terapeutico: in contesti non clinici, modelli di linguaggio possono essere utilizzati per fornire supporto emotivo e risorse informative.
- Educazione e Formazione: può essere utilizzato per creare materiali educativi, quiz interattivi e fornire risposte a domande degli studenti.
I suoi sviluppi futuri sono difficili da prevedere con precisione, sicuramente continuerà a migliorare in termini di comprensione del contesto, capacità di risposta e adattamento a una gamma sempre più ampia di compiti.
Le sue potenzialità sono notevoli, ma ovviamente esistono anche dei punti deboli. Ad esempio, bisogna porre attenzione ai contenuti generati, perché le risposte potrebbero sembrano coerenti ma essere in realtà inesatte o fuorvianti, non avendo il chatbot comprensione del mondo reale come un essere umano.
Alternative a ChatGPT
Da quando l’azienda guidata da Sam Altman ha presentato ufficialmente il modello GPT-3 nel giugno 2020, il successo e le innovazioni associate ai modelli di linguaggio come ChatGPT hanno influenzato lo sviluppo e l’adozione di altri chatbot e sistemi basati su intelligenza artificiale nel campo della comunicazione automatizzata. Oltre a OpenAI, anche aziende più grandi come Google, Meta, Microsoft (strettamente legata a OpenAI), Amazon, Samsung e altre si sono avventurate in questa direzione.
Ma anche aziende meno conosciute hanno iniziato a implementare modelli generativi open source. Addirittura, ci sono alcuni esperti che suggeriscono che i modelli open source potrebbero superare quelli di OpenAI e Google. Ad esempio, Mistral AI in Francia ha addestrato il suo modello generativo open source, Mistral 7b, utilizzando le risorse del supercomputer Leonardo presso il consorzio CINECA di Bologna. Il risultato è un modello generativo “aperto” che può essere utilizzato anche per scopi commerciali.
Da precisare la differenza tra chatbot e modello generativo: un chatbot è un’applicazione specificamente progettata per facilitare la comunicazione con gli utenti, mentre un modello generativo è un tipo di intelligenza artificiale in grado di generare testo in modo autonomo senza la necessità di una programmazione specifica per risposte particolari.
È importante notare che alcuni chatbot possono incorporare elementi di modelli generativi per migliorare la loro capacità di rispondere a domande aperte o di adattarsi a conversazioni più complesse. La distinzione tra i due concetti può quindi talvolta essere molto sottile, portando il progresso nella ricerca in intelligenza artificiale a sempre nuove e più avanzate implementazioni.
Oltre ai modelli generativi concorrenti di OpenAI GPT, esistono anche chatbot alternativi a ChatGPT. Diverse realtà hanno sviluppato prodotti open source pensati per interagire con modelli noti e performanti. Questi chatbot open source offrono una maggiore trasparenza nella gestione dei dati rispetto a soluzioni commerciali, sono inoltre altamente personalizzabili e non vincolati alle politiche di una singola azienda.
In più la disponibilità del codice sorgente – a seconda della licenza d’uso – consentono di eseguire i chatbot open source in locale e di integrarli nei propri progetti.
Vediamo dunque quali sono in questo momento le migliori alternative open source a ChatGPT.