我們常常在電影中,可以看到有一些世外高人,可以透過觀看對方的口型,得知道對方的對話內容(即使聽不到任何聲音),這技能我們稱為讀唇,不過,你又有沒有想過,電腦的人工智能系統,可以學會這個超強技能?
Google 的 AI 部門 DeepMind 和牛津大學的研究人員使用人工智能,創作了目前最準確的一款讀唇軟件,利用 BBC 數千小時的電視節目,將 AI 軟件對電視節目嘉賓唇語解讀,準確率提升到46.8%。
對比專業的唇語專家在接受同樣的測試,準確率僅為 12.4%,可見人工智能又再一次超越人類了,Google 的 DeepMind 部門研發「Watch, Listen, Attend, and Spell」AI 軟件,與其它測試軟件不同,使用的是即時檢測,可以說是實戰,並不是固定對話,因此有接近 50% 準確度,已是相當了不起。