Microsoft continua a investire nella ricerca dell’Intelligenza Artificiale annunciando di aver messo a punto VASA-1, un nuovo modello di intelligenza artificiale in grado di animare un volto di un individuo basandosi semplicemente su una immagine e un file audio.

VASA, un framework per la generazione di volti parlanti realistici di personaggi virtuali con capacità visive affettive (VAS) accattivanti, dati da una singola immagine statica e da una clip audio del parlato. Il primo modello, VASA-1, è in grado non solo di produrre movimenti labiali squisitamente sincronizzati con l’audio, ma anche di catturare un ampio spettro di sfumature facciali e movimenti naturali della testa che contribuiscono alla percezione di autenticità e vivacità.