原標題:【專利解密】百度唇語語音喚醒技術
集微網消息,7月25日,百度舉辦了“百度AI城市&烏蘭察布戰略合作簽約儀式”。這次簽約儀式上,百度和烏蘭察布市集寧區正式達成了合作共識,將在交通、城管、社區、供熱等24個項目中進行合作,聯合帶動人工智能城市治理產業向集寧區聚集,打造內蒙古智能城市樣板間。
在人工智能城市治理項目規劃上,雙方將共同投入智能城市基礎設施建設并促進全面智能的城市治理體系的建成。從人工智能城市基礎設施及重點示范項目建設開始,逐步實施人工智能交通管理系統建設、人工智能政務服務系統建設等多個方面的建設,逐步推進集寧區人工智能城市發展改造進程。
而語音識別技術則是智能城市中不能缺少的一個環節,隨著語音識別的能力的增強,越來越多的智能設備也應用到了語音識別。目前的智能設備的語音交互方式基本上使用的是基于語音喚醒詞的語音交互。在進行語音功能喚醒的具體操作一般為采用固定的喚醒詞,比如:小度小度,等來喚醒語音交互設備。在由語音交互設備進行啟動識別,然后再和用戶進行語音交互。然而,現有的語音喚醒的方式,每次在進行語音交互前都要說一遍喚醒詞,重復的說喚醒詞會給用戶造成不好的體驗。
在這樣的背景下,百度在18年1月22日申請了一項名為“基于唇語的語音喚醒方法、裝置及計算機可讀介質”的發明專利(申請號:201810061009.1),申請人為北京百度網訊科技有限公司。
根據目前公開的專利文件,讓我們一起來看看這項基于唇語的語音喚醒方法吧。
如上圖所示為基于唇語的語音喚醒方法的步驟流程圖。首先,采集用戶的嘴唇變化圖像,當用戶需要針對某個智能設備啟動語音交互功能時,可以直接對著智能設備的攝像頭上說話,此時可以通過攝像頭實時采集用戶的嘴唇圖像。
其次,判斷用戶的嘴唇變化圖像是否與預設變化圖像相匹配。根據接收到的用戶的嘴唇變化圖像進行判斷,可以跟預設變化圖像進行比對,判斷是否相匹配。另外,由于用戶可能在與其他人對話,此時需要判斷用戶是否正對著智能設備進行語音輸入。
最后,當用戶的嘴唇變化圖像與預設變化圖像相匹配時,喚醒語音交互功能。此時,當用戶嘴唇變化圖像與預設圖像相匹配時,說明用戶想與智能設備進行語音通話,此時智能設備開始喚醒語音交互功能。此時用戶不需要做額外的喚醒動作,就可以直接進行語音對話。
如上圖為嘴唇閉合和張開的示意圖。當用戶的嘴唇變化圖像與預設變化圖像相匹配時,喚醒語音交互功能的步驟之后,還要接收用戶的語音,并判斷所述語音是否為有效的語音信息;若是,則執行響應動作,若否,則關閉語音交互功能。
以上就是基于唇語的語音喚醒方法,在某些尷尬的場合,并不適合發出聲音,甚至是在一些危險的場合,那么這樣的唇語技術就可以發揮用場了。也是一項腦洞大開的專利,希望隨著面部識別等技術的完善及發展,以后也有可能會出現唇語解鎖等新技術呢!返回搜狐,查看更多
責任編輯: