重點文章
Siri 是 iOS 預設語音助理,它其中一個功能就是無需按實 Home 鍵就可以發動的「Hey Siri」功能,只需錄下你的聲效,以後使用 Siri 之前只需說出「Hey Siri」一字,就可以進入 Siri 介面。然而在實現「Hey Siri」功能的背後,原來原理是那麼複雜。
在蘋果官方文件之提及,要支援「Hey Siri」功能,iOS 裝置要裝上一個會持續啟動的小型語音識別裝置,這裝置會利用深度神經網絡一直聆聽,並把用戶的語音命令轉換為音訊數據,每秒 16000 個,在 0.2 秒的音訊數據之中作出評價,辨別用戶是否說出「Hey Siri」一詞。
如果評價夠高,就會打開 Siri,但如果評價不夠高,iOS 裝置會變得更敏感,語音識別裝置會更敏銳地檢測「Hey Siri」一詞,當你再次說出「Hey Siri」的時候,就更容易辨識到了。
蘋果也能辨識近音字,「Hey Siri」不會認錯
英文用字廣泛,總會有很多近音字,例如 Siri 可以聽錯「Hey Seriously」或「Hey Syria」等文字作「Hey Siri」。用「Hey Siri」打開 Siri 之後,這個字也會傳送到 Siri 伺服器作驗證,如果 Siri 聽錯其他文字作「Hey Siri」而試圖打開 Siri 的話,Siri 伺服器會傳送錯誤訊息,迫令關閉 Siri。另外在 iOS 裝置設定「Hey Siri」的時候,需要用戶連續說 5 次,蘋果會紀錄不同環境中說出「Hey Siri」的情況,令到這個命令更清晰和準確。