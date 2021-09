Sono da poco passati 23 anni da quando Google è andata online per la prima volta, e ora il motore di ricerca più usato al mondo introduce un cambiamento radicale nel modo in cui funziona. All’inizio di quest’anno, alla conferenza annuale degli sviluppatori I/O, l’azienda aveva presentato il Multitask Unified Model, o MUM: è un algoritmo che può cercare simultaneamente informazioni in una vasta gamma di formati, tra cui testo, immagini e video, e trarre intuizioni e connessioni tra argomenti, concetti e idee. A breve arriveranno le prime applicazioni pratiche di MUM, a cominciare da Google Lens.

Google Lens è la tecnologia di riconoscimento delle immagini consente di utilizzare la fotocamera dello smartphone per eseguire una varietà di compiti, come la traduzione in tempo reale, l’identificazione di piante e animali, copiare e incollare da foto, trovare oggetti simili a ciò che è inquadrato, ottenere aiuto con problemi di matematica, e molto altro.

Google sfrutterà le capacità di MUM per aggiornare Google Lens con la capacità di aggiungere testo alle ricerche visive al fine di consentire agli utenti di porre domande su ciò che vedono; combinando immagini e testo, sarà possibile avere risultati più precisi e più utili. Mettiamo ad esempio che si rompa una parte della nostra bicicletta e ci serve sapere come sistemarla: non sarà più necessario cercare “come riparare il mozzo”, ma basterà inquadrare il componente danneggiato e digitare “come riparare”. Finché il nome della cosa è noto cambia poco, ma non è detto che tutti conoscano il termine esatto, e qui entra in funzione il riconoscimento delle immagini. E la novità è che la risposta non arriverà solo in forma di testo, ma anche di immagini e video, e in quest’ultimo caso il risultato indicherà il punto preciso del filmato in cui c’è la soluzione al nostro problema.

Questa funzione sarà disponibile in un primo momento su YouTube (che, ricordiamo, è di proprietà di Mountain View), poi anche su altre piattaforme video. Al momento, spiega a Italian Tech Liz Reid, vicepresidente del reparto Search, “MUM non ricava le informazioni dai contenuti dei singoli frame di un video, ma da trascrizioni dell’audio generate automaticamente usando il riconoscimento della voce”.

MUM è mille volte più potente dell’algoritmo precedente Bert: mille sono i nodi della rete neurale su cui è progettato, con l’idea di ricreare le sinapsi del cervello umano, dove ogni nodo è un punto di decisione attraverso cui l’algoritmo fa passare la ricerca dell’utente. “MUM – aggiunge Reid – conosce molte più cose del mondo”, così può fornire risultati più utili e più precisi. Anche le differenze linguistiche non sono una barriera, visto al momento è compatibile con 75 lingue.

Ma a Google vanno ancora oltre, e puntano molto sull’ispirazione. Come se il pulsante “Mi sento fortunato” che qualche anno fa è scomparso dalla homepage del motore di ricerca fosse stato inglobato nell’algoritmo. Così le ricerche si possono restringere o allargare, un po’ come con lo zoom di una fotocamera. E su un argomento come le vernici acriliche si può sapere davvero di tutto: dalla composizione chimica agli artisti che le hanno usate più spesso, da come togliere le macchie sui vestiti fino ai consigli per le combinazioni di colori.

Gli utenti saranno in grado di eseguire ricerche di immagini inverse quando navigano sull’app di Google per iOS o sul browser desktop Chrome. Selezionando un’immagine si tireranno fuori immagini online simili, il che potrebbe aiutare gli acquirenti a trovare dove acquistare gli oggetti visti nelle foto e infine condurli a Google Shopping (e dunque in prospettiva dirottare traffico che andrebbe magari ad Amazon).