Google introduce una nuova funzionalità basata sull’intelligenza artificiale nell’applicazione Lookout: la visione assistita. Così le persone ipovedenti possono discutere con l’intelligenza artificiale per porle, attraverso diverse domande, tutti i dettagli dell’immagine.
Descrivere un’immagine non è più una sfida troppo complicata per una buona IA. Tuttavia, Google è riuscita a portare questo concetto un ulteriore passo avanti per renderlo più funzionale e impressionante. Il colosso americano ha appena rivelato Funzione Picture & Answer nell’app per l’accessibilità Lookout – Visione assistita E siamo stati in grado di fare una breve demo durante Google I/O 2023 qualche giorno fa.
Il concetto è facilmente riassumibile: fai qualsiasi domanda per capire cosa c’è nella foto e l’IA ti dà ogni volta una risposta chiara. Lo scopo di questa funzione, e del monitoraggio in generale, è aiutare le persone ipovedenti a sapere cosa c’è in una foto o in un disegno. Da qui il concetto di domande e risposte, che significa domande e risposte. Lo spettacolo, aveva una piccola cosa piuttosto sorprendente.
In sostanza, carichi un’immagine sull’app e chiedi all’IA di descriverla. Quest’ultimo si esibirà e ti spiegherà cosa vediamo. Questa prima descrizione è efficace e può bastare se vuoi solo un breve riassunto. Tuttavia, per coloro che hanno bisogno di maggiori dettagli, è sufficiente porre una domanda, per iscritto o ad alta voce.
L’intelligenza artificiale risponde alle tue domande per descrivere l’immagine
Durante la demo all’I/O, Image Q&A di Lookout si è confrontato con un’immagine ed ecco la conversazione che ha avuto in seguito con l’utente umano.
intelligenza artificiale: In questa foto vedo un cane che corre sulla spiaggia. Vedo anche che ha una pallottola in bocca. Sullo sfondo vedo acqua, montagne e cielo.
umani: Cos’è una razza di cane?
intelligenza artificiale: Il cane è un bastardo.
umani: Il cane sembra allegro?
intelligenza artificiale: Sì, il cane è giocoso.
umani: Descrizione dell’oceano.
intelligenza artificiale: L’oceano è calmo e c’è una montagna sullo sfondo.
umani: Le onde sono grandi?
intelligenza artificiale: No, le onde sono piccole.
umani: Ci sono nuvole nel cielo?
intelligenza artificiale: Sì, c’è una nuvola nel cielo.
umani: La spiaggia è affollata?
intelligenza artificiale: No, la spiaggia è deserta.
La conversazione non è necessariamente delle più naturali, ma è abbastanza fluida e chiara da rappresentare una soluzione interessante per i non vedenti che sul Web spesso devono accontentarsi di brevissime descrizioni.
Lì hanno uno strumento con un grande potenziale per dare loro un’idea precisa dell’immagine.
Abbiamo fotografato la manifestazione in questione. Precisiamo solo che questa registrazione non è di alta qualità, era principalmente destinata a supportare la stesura di questo articolo.
Collegamento YouTubeIscriviti a Frandroid
Ricordiamo infine che Lookout è un’app disponibile da tempo sul Play Store. Questo strumento di accessibilità ha già diverse funzionalità interessanti per i non vedenti: lettura di carte commerciali e fedeltà o etichette, rilevamento del valore delle banconote e aiuto nella scansione di un documento.
Vuoi entrare a far parte di una community di appassionati? Il nostro disaccordo Vi dà il benvenuto, è un luogo di mutua assistenza e passione per la tecnologia.
“Pluripremiato studioso di zombi. Professionista di musica. Esperto di cibo. Piantagrane”.