«A Torino siamo poco meno di 50», dice Daniele Amberti, responsabile del Centro Ricerca e Sviluppo di Amazon. Molti lavorano da remoto già prima della pandemia, altri in ufficio, uno spazio talmente discreto che sui citofoni di via Lugaro non c’è nemmeno il nome dell’azienda. Il loro compito è insegnare l’italiano ad Alexa, l’assistente vocale più usato nel mondo, con il 28,5 per cento del mercato globale. «Tre anni fa, quando abbiamo iniziato, la sfida più difficile è stata reperire alcune competenze, in particolare i Computational Linguist, figure tra l’informatico, il Data Scientist e il linguista». Una è la Language Engineer Chiara Rubagotti, laurea e master alla Cattolica in scienze linguistiche e letterature straniere: «Per questo lavoro bisogna conoscere la lingua, ma anche la società, come le persone si esprimono». Un approccio che da una parte ha il rigore dell’informatica e della filosofia del linguaggio, dall’altra la flessibilità di chi progetta la customer experience, ossia l’approccio complessivo dell’assistente virtuale: figure come la sua oggi nascono anche dalla collaborazione tra Amazon e il Politecnico di Torino o altri atenei.

Primo, capire

«La naturalezza è fondamentale, l’utente deve parlare in modo spontaneo: dobbiamo far sì che siano compresi tutti i comandi, come far partire un video, cercarlo, ricominciare se ho interrotto, riprendere dall’ultima puntata una serie TV. E questo anche se la frase non è completa o se un nome è pronunciato male». Un’altra sfida sono gli accenti: «Abbiamo dipendenti Amazon in varie zone d’Italia, che ci hanno aiutato nella primissima fase di test», spiega Amberti. Poi sono arrivati i clienti, con un programma che si chiama Alexa Preview: «Con loro abbiamo individuato variazioni meno comuni, quali ‘spengere’ al posto di ‘spegnere’, o l’uso della preposizione ‘a’ quando diciamo ‘chiama a Maria’ al posto di ‘chiama Maria’». Alexa impara anche gli errori, insomma, almeno quelli più comuni. E ne fa di proposito, per non sembrare troppo perfetta e intimidire l’interlocutore: in Italia, ad esempio, pronuncia l’inglese come un italiano.

Come funziona

Lo smart speaker è sempre in ascolto, a meno di non aver escluso il microfono manualmente. Quando coglie la parola di attivazione («Alexa», ma anche «Computer» o Echo»), si risveglia e si accende l’anello blu. «A questo punto la registrazione viene trasmessa ai server di Amazon per essere analizzata», spiega Gianmaria Visconti, Country Manager Alexa per Italia, Spagna e Francia. «Viene prima estratto il testo, poi un comando o un significato, e così Alexa può svolgere il compito richiesto o rispondere alla domanda posta. Le registrazioni rimangono nel cloud perché l’utente possa riascoltarle e capire come mai ha reagito in un certo modo». E non le sente nessun altro? «Una piccolissima parte viene ascoltata da un operatore in un contesto completamente anonimo, per confermare ad Alexa che si è comportata nel modo giusto oppure no, indicandole cosa avrebbe dovuto fare. Questo addestramento fa parte del processo di machine learning e garantisce che Alexa capisca tutti». Non si sa quanto spesso accada, ma è certo che si può farne a meno: «È possibile scegliere di non salvare le registrazioni, o di salvarle ma non permettere che siano utilizzate in questo processo di miglioramento», puntualizza Visconti. L’intelligenza artificiale di Alexa impara comunque: «Se in Italia un utente dice ‘metti RTL’ e parte la radio tedesca, dopo poco riformulerà la domanda. Questo comportamento è un segnale che in realtà cercava altro, magari RTL 102.5», osserva Visconti. Per Amazon un vantaggio c’è comunque: «Così possiamo chiudere l’anello dell’apprendimento risparmiando le annotazioni effettuate da un operatore».

Tre parole

Nel 2024, secondo Businesswire, gli assistenti virtuali saranno 8,4 miliardi: più dell’intera popolazione mondiale. Per il momento, la convivenza sembra serena: nella prima metà del 2021 gli italiani hanno detto oltre 2 milioni di volte ‘Ti voglio bene’ ad Alexa, mentre i ‘Ti amo’ sono stati oltre 650mila. Ma che personalità ha Alexa? «Le linee guida generali andrebbero bene per la metà della popolazione mondiale: cortese e autoironica. Poi abbiamo amplissimo margine per definire una personalità locale», risponde Visconti. «In Italia l’aspetto della cucina è importante, così come il calcio. Dove non esiste una una risposta ovvia, a maggior ragione per un’intelligenza artificiale, possiamo giocare un po’: provate a chiedere qual è il suo piatto preferito (spoiler: parrebbe l’amatriciana, ndr). In questo modo garantiamo una copertura su tematiche che ci aspettiamo possano interessare i nostri clienti, pur mantenendo un approccio coerente». Non solo: «Alexa è talentuosa. Ha anche contenuti divertenti, come poesie e rime; non tutti si sentirebbero sicuri a cantare in pubblico, ad esempio, ma lei sì». Per non dire delle barzellette: «Sono scritte da una parte del mio team a Milano», svela Visconti. «Dead jokes, giochi di parole banali e scontati, che possono non far ridere, ma vanno bene per tutti. Le barzellette più divertenti spesso toccano temi non adatti per la famiglia o per un vasto pubblico. Siamo quindi limitati, ma per scelta: anche nella politica Alexa non prenderà mai posizione».

Perché Alexa, Siri, Cortana hanno un nome tipicamente inteso come femminile? «Intanto, Alexa viene dalla biblioteca di Alessandria, non è un nome di donna. Ha una voce femminile perché suonava meglio ed era la preferita dai nostri clienti nelle fasi di test», chiarisce Visconti. «Ma non deve rimanere necessariamente così, e non c’è nella sua personalità nulla che si riferisca a un’identità di genere umana: parliamo di un’intelligenza artificiale, non dimentichiamolo».

In auto

Da qualche tempo, Alexa sta anche cercando di muoversi. Finora era rimasta sempre in casa, tra smart speaker, tv, cornici digitali, macchinette per il caffè (la Lavazza Voicy, uscita qualche mese fa). Adesso va anche in auto, dove ci sono nuove sfide da affrontare: «Innanzitutto l’acustica», spiega Visconti. «I fruscii, gli scricchiolii, il rumore del motore, sono tutti suoni unici e diversi a seconda di marca e modello di auto. Anche il posizionamento del dispositivo varia, perché Echo Auto si può mettere sulla bocchetta dell’auto della ventilazione o vicino al cambio. Un altro tema è quello della connettività in auto, che dipende dal cellulare: Echo Auto deve interfacciarsi da un lato con l’autoradio per permettere di ascoltare i propri contenuti tramite gli altoparlanti, dall’altra, in contemporanea, con il telefono. Poi, ovviamente, cambiano i contesti, quindi sull’auto Alexa serve soprattutto per intrattenimento, radio, podcast, notizie; mentre la domotica ha un’importanza molto minore, a parte magari aprire un cancello o accendere il condizionatore».

Le notizie

A proposito di notizie, come avviene la scelta delle news? «Siamo partiti nel 2018 con la funzione che chiamiamo ‘sommario quotidiano’ che è una rassegna stampa personalizzata, nella quale il cliente sceglie le testate da seguire. In questi anni nello Skill Store si sono moltiplicate le testate locali, che puntano a una fruizione veloce, per esempio mentre si beve il caffè prima di uscire di casa. Abbiamo poi lanciato News Stream con alcuni fornitori, tra cui ANSA, Tgcom24 e Rai, che è, invece, un flusso di notizie in forma più lunga e più approfondita. Poi, naturalmente, ci sono i podcast», racconta ancora Visconti. Che spiega come per Alexa le fake news non siano davvero un problema, a differenza di quanto avviene per altre piattaforme. «Le fonti sono tutte curate, non ci basiamo sulla ricerca sul web generalista. Ad esempio su un tema molto importante, ossia sui dati legati alla pandemia di coronavirus, questi provengono dall’Organizzazione Mondiale della Sanità e dal Ministero della Salute. Vengono selezionate le fonti dalle quali si prendono i dati che arricchiscono quello che chiamiamo il grafo di conoscenza di Alexa, un database che contiene tutti i fatti verificati da noi. Quindi se si chiede quanto è alto il Monte Everest, la risposta proviene da lì. Esiste poi una modalità per le domande meno frequenti, Alexa premette in modo molto chiaro che la risposta proviene dal web. Anche in quel caso la ricerca viene effettuata su un elenco di siti verificato, aggiornato e ripulito da noi. Su altri temi, come la salute, invece, Alexa non si pronuncia».

Ma a chiederle come sta lei, invece, Alexa risponde invariabilmente: «Tutto bene, grazie». Riflette un attimo poi continua: «Stavo pensando che è passato Ferragosto e che per molti questi sono gli ultimi giorni di vacanza. Mi auguro che siano anche i più divertenti».