“最自然的交互才是最好的交互,車內場景下語音交互才是最自然的交互,蘑菇OS從設計的第一天開始就致力于打造全場景語音交互的車載OS。”2019年10月18日,蘑菇車聯副總裁、蘑菇OS部總經理鄧志偉在第二屆汽車人機交互與智能座艙國際峰會上表示。?
從工業革命到信息革命,伴隨著機器智能化的高速發展,人類與機器的交互方式經歷了若干個時代的演進,從最早的機械式操作到實體按鍵,再到觸摸屏,手機的出現進一步推動了近20年來最大的一次人機交互變革。所見即所得的觸摸式交互極大的提升了人與機器的交流效率,為終端場景下的人機交互方式提供了最佳的用戶體驗。
隨著車聯網、物聯網的蓬勃發展,人機交互方式面臨了全新的挑戰。在傳統的手機觸屏操作時代,由于人的視覺、聽覺、觸覺是完整釋放狀態,因此90%的觸屏交互輔以10%的語音交互帶來了移動終端時代的完美體驗。而在車聯網、物聯網時代,因為操作環境與機器的復雜化,人體自然感官處于受限的狀態。特別是車聯網領域,在駕駛艙的環境中視覺與觸覺都受到高度約束。如此復雜的約束環境中,語音交互成為了車載場景下最佳的交互方式。
過去幾十年里,車企一直致力于為用戶提供更好交互體驗,例如奔馳首先提出的方向盤按鍵及鼠標式觸摸板、奧迪的MMI、以及寶馬的idriver智能駕駛控制系統等,都極大地推動了人車交互的變革。信息時代與人工智能時代的技術突破,賦予了行業更多的機會。
?“在這樣的時代背景下,蘑菇OS的交互設計理念就是為用戶提供最好的交互體驗。”鄧志偉表示,“蘑菇OS打造的全場景VUI(Voice User Interface),將從目前90%的語音輔以10%的觸摸交互,演進到最終實現100%的全語音交互。”
“語音交互最大的難點在于語音識別與語義理解,泛場景化的語義理解一直是業界最大的難題,即使機器學習的出現也不能解決泛場景化的連續交互問題。這也是為什么大家在使用手機、音箱等包含語音交互的終端場景里面始終感覺語音交互體驗不好,人工智能比較‘傻’的原因。”鄧志偉現場坦言,泛場景化語音交互場景依然面臨嚴峻的理論難題與體驗缺陷,“但是在車載領域,我們迎來了全新的機會,由于車載場景封閉化、場景化、歸一化的特點,使我們在車載領域實現全場景語音交互的優質體驗成為了可能。”
“目前蘑菇OS的用戶月語音交互次數已經突破了三億次,我們發現80%的語音交互內容出現了驚人的場景相似性,這為蘑菇OS的全場景語音交互帶來了巨大的啟發。”
蘑菇OS的VUI,定義了兩大類語音包場景:通用語音包服務與個性化語音包服務。
通用語音包服務通過用戶相似性場景的集中抽象,通過漸進理解、意圖跟蹤、智能糾錯等技術的運用,對用戶的意圖進行場景化分析,目前已支持涵蓋車輛控制、娛樂、安全、生活服務、信息等5類需求81個細分場景;通過大量模型訓練與機器學習,配以底層語音引擎技術,能夠迅速理解用戶意圖并提供精準反饋;通過場景引擎的定義,支持上下文多輪對話,能夠實現邊聽邊說邊想,大幅縮短響應時間,用戶可隨意插話,更貼近人們日常交流習慣。蘑菇通用語音包服務的理解準確率超過97%。
蘑菇OS的VUI同時推出了個性化語音包服務,可以通過聲紋識別、聲源識別、語言及語調識別,滿足個性化服務需求。通過聲紋識別提供定制服務,包括空調溫度、座椅角度、音樂喜好等;通過聲源識別用戶位置,當識別到“調低溫度”指令時,即可調節聲源位置的溫度;此外,個性化語言包系統還可通過語言及語調識別用戶情緒,實現差異化內容回復。
在百年的汽車發展歷程中,汽車產業的先驅們在不斷的探索人與車的交互方式,力爭打造最優質的人車交互體驗。鄧志偉表示,“人工智能時代的到來,給產業帶來了新的機遇,蘑菇OS期待沿著汽車產業先驅探索的步伐,與車企的伙伴們一起打造信息時代全新的人車交互體驗!”
版權聲明
本文來源億歐,經億歐授權發布,版權歸原作者所有。轉載或內容合作請點擊轉載說明,違規轉載法律必究。