
Keerulises keskkonnas saavad inimesed aru kõne tähendusest paremini kui AI, sest me ei kasuta mitte ainult oma kõrvu, vaid ka silmi.
Näiteks näeme, et kellegi suu liigub ja võime intuitiivselt teada, et kuulda, mida me kuuleme, peab sellelt inimeselt tulema.
Meta AI töötab uue AI -dialoogisüsteemi kallal, milleks on õpetada AI -d õppima ka peente korrelatsioone selle vahel, mida ta näeb ja kuuleb vestluses.
VisualVoice õpib sarnaselt sellega, kuidas inimesed õpivad uusi oskusi valdama, võimaldades audiovisuaalset kõne eraldamist, õppides visuaalse ja kuulmisnäpunäiteid märgistamata videotest.
Masinate jaoks loob see parema ettekujutuse, samas kui inimeste taju paraneb.
Kujutage ette, et saaksite osaleda grupikohtumistel The Metaverse'is kolleegidega kogu maailmast, liitudes väiksemate rühmakoosolekutega, kui nad liiguvad läbi virtuaalse ruumi, mille jooksul stseenis toimuvad heliharjumused ja Timbres vastavalt keskkonnale vastavalt kohandab.
See tähendab, et see võib hankida samal ajal heli-, video- ja tekstiteavet ning sellel on rikkalikum keskkonnaalase mõistmise mudel, mis võimaldab kasutajatel saada "väga vau" helikogemust.
Postiaeg: 20. juuli-20122