Imparare una lingua chiacchierando con il tutor dell'intelligenza artificiale

La nuova applicazione dell'ETH Quazel* permette di imparare le lingue straniere parlando con un'intelligenza artificiale (AI). L'intelligenza artificiale si adatta alle competenze linguistiche dell'utente e ne corregge gli errori.

Mano che regge uno smartphone, sopra di essa appaiono parole in diverse lingue
Con l'app, le persone in formazione possono parlare con un tutor IA in 21 lingue e vengono corrette in tempo reale. (Immagine: Adobe Stock)

I fatti più importanti in breve

  • Con l'app Quazel, le persone in formazione possono parlare con un tutor AI in 21 lingue e vengono corrette in tempo reale.
  • Il bot vocale capisce quanto bene qualcuno stia parlando e adatta di conseguenza l'espressione, la scelta delle parole e la struttura della frase.
  • Una delle sfide più grandi per i tre fondatori è stata quella di domare i modelli linguistici accessibili al pubblico.

Se si vuole imparare una lingua straniera, è meglio parlare regolarmente con un insegnante di lingua qualificato o con un partner in tandem. Tuttavia, questo può diventare rapidamente costoso o scomodo.

L'apertura dell'ETH Quazel ha ora sviluppato un'applicazione che promette un rimedio: le persone in formazione possono parlare con un tutor AI sul loro smartphone in qualsiasi momento e ovunque, che non solo parla perfettamente 21 lingue, ma è anche infinitamente paziente.

"Vogliamo rendere l'apprendimento di una lingua straniera il più semplice e accessibile possibile", afferma il fondatore e CEO Philipp Hadjimina, che ha studiato informatica all'ETH di Zurigo. "Il maggior numero possibile di persone dovrebbe poter beneficiare di un insegnante di lingua personale".

Conversazioni in apertura con il chatbot

La maggior parte delle app esistenti per l'apprendimento delle lingue tende a concentrarsi su compiti scritti. Se c'è una funzione linguistica, di solito le app rispondono solo con frasi predefinite. Questo spesso sembra artificiale e non permette di conversare in modo fluente. Il rapido sviluppo di modelli linguistici di grandi dimensioni come ChatGTP sta rendendo possibile per la prima volta conversazioni in apertura e dall'aspetto naturale con un'intelligenza artificiale.

Anche l'app Quazel si avvale di questo progresso tecnologico: "Dall'ordinazione al ristorante, allo sport preferito, agli argomenti filosofici, le persone in formazione possono parlare con il loro tutor AI di quasi tutto e vengono corrette in tempo reale se commettono errori grammaticali o usano parole sbagliate", spiega Hadjimina.

La conversazione inizia solitamente con una domanda del chatbot, alla quale le persone in formazione rispondono con un input vocale. Soprattutto per i principianti, di solito sono le domande del chatbot a far progredire la conversazione. L'intelligenza artificiale adatta automaticamente la complessità delle risposte al livello delle persone in formazione.

Riproducendo il video, si accetta l'informativa sulla privacy di YouTube.Per saperne di più OK
Una demo di Quazel (Video: ETH di Zurigo / Quazel)

Modelli linguistici di grandi dimensioni sullo sfondo

Tutte queste funzioni sono rese possibili da modelli linguistici di grandi dimensioni, accessibili al pubblico, che girano in background nell'app Quazel. Questi sono stati addestrati utilizzando una grande quantità di dati provenienti da fonti online. Sulla base di innumerevoli libri, articoli, siti web e post sui social media, il tutor AI ha appreso le regole grammaticali di 21 lingue e le relazioni semantiche tipiche tra parole e frasi.

Il principio alla base di questi modelli linguistici può essere paragonato al riconoscimento del testo sui nostri smartphone: In base a ciò che è già stato digitato, ai vecchi messaggi e a un ampio database di parole e frasi conosciute, un'intelligenza artificiale prevede quali parole potrebbero avere senso in seguito.

Questo è anche il caso di Quazel: "Anche se il nostro robot vocale non ha mai sentito una frase dell'utente esattamente nello stesso modo, è comunque in grado di stimare quale risposta sarebbe appropriata in base al contesto tematico, alle conversazioni precedenti e alle sue conoscenze di base", spiega l'ETH, l'informatico e cofondatore David Niederberger, responsabile della tecnologia di Quazel.

Rendere il modello adattabile

Una delle sfide più grandi per i tre fondatori è stata quella di domare i modelli linguistici disponibili pubblicamente. Questo perché modelli come GPT4 di OpenAI sono ormai così validi che le loro risposte sarebbero troppo complicate per gli studenti di lingue. "Per esempio, abbiamo dovuto usare il feedback per insegnare al nostro tutor AI come suona una persona al livello linguistico di un principiante", dice Niederberger. In breve: il bot linguistico capisce quanto una persona parla bene e adatta di conseguenza la sua espressione, la scelta delle parole e la struttura delle frasi.

I tre fondatori di Quazel David Niederberger, Samuel Bissegger e Philipp Hadjimina (da sinistra a destra)
I tre fondatori di Quazel David Niederberger, Samuel Bissegger e Philipp Hadjimina (da sinistra a destra) (Immagine: ETH di Zurigo / Quazel)

Anche la scelta del modello linguistico giusto ha causato notti insonni ai fondatori: Se il modello è troppo complesso, richiede molta potenza di calcolo e quindi diventa troppo costoso per l'utente finale. Se invece è troppo semplice, le conversazioni non scorreranno in modo fluido. "Quando abbiamo scelto il modello, abbiamo dovuto trovare un equilibrio tra complessità e costo. Un classico problema di ingegneria, come lo conoscevamo dai nostri studi all'ETH", spiega Niederberger.

Inoltre, il mercato dei modelli linguistici si sta sviluppando così rapidamente che quasi ogni settimana compaiono nuovi e migliori modelli. Il fatto di dover decidere costantemente quali innovazioni hanno senso per Quazel richiede ai tre fondatori una grande flessibilità e un buon senso degli sviluppi futuri.

Una domanda elevata fin dall'inizio

I tre fondatori hanno ottenuto un posto nel famoso programma di promozione Y-Combinator lo scorso autunno e attualmente lavorano in un Airbnb a San Francisco. Nell'ambito del programma, hanno accesso a un'ampia rete di fondatori esperti e potenziali investitori.

Il successo dell'applicazione per l'apprendimento delle lingue è emerso chiaramente nei primi giorni dopo il lancio: "Quazel ha fatto il botto. Nel giro di due giorni, 50.000 persone stavano usando il prototipo", ricorda Hadjimina. I fondatori ora vogliono continuare questa tendenza.

*L'apertura dell'ETH Quazel ha subito un rebranding nel marzo 2024 ed è ora denominata pagina esternaUniverbale.

JavaScript è stato disabilitato sul tuo browser