最自然的交互才是最好的交互，蘑菇車聯打造全場景語音交互車載OS

億歐網 2019-10-18 19:51 搶發第一評

“最自然的交互才是最好的交互，車內場景下語音交互才是最自然的交互，蘑菇OS從設計的第一天開始就致力于打造全場景語音交互的車載OS。”2019年10月18日，蘑菇車聯副總裁、蘑菇OS部總經理鄧志偉在第二屆汽車人機交互與智能座艙國際峰會上表示。?

從工業革命到信息革命，伴隨著機器智能化的高速發展，人類與機器的交互方式經歷了若干個時代的演進，從最早的機械式操作到實體按鍵，再到觸摸屏，手機的出現進一步推動了近20年來最大的一次人機交互變革。所見即所得的觸摸式交互極大的提升了人與機器的交流效率，為終端場景下的人機交互方式提供了最佳的用戶體驗。

隨著車聯網、物聯網的蓬勃發展，人機交互方式面臨了全新的挑戰。在傳統的手機觸屏操作時代，由于人的視覺、聽覺、觸覺是完整釋放狀態，因此90%的觸屏交互輔以10%的語音交互帶來了移動終端時代的完美體驗。而在車聯網、物聯網時代，因為操作環境與機器的復雜化，人體自然感官處于受限的狀態。特別是車聯網領域，在駕駛艙的環境中視覺與觸覺都受到高度約束。如此復雜的約束環境中，語音交互成為了車載場景下最佳的交互方式。

過去幾十年里，車企一直致力于為用戶提供更好交互體驗，例如奔馳首先提出的方向盤按鍵及鼠標式觸摸板、奧迪的MMI、以及寶馬的idriver智能駕駛控制系統等，都極大地推動了人車交互的變革。信息時代與人工智能時代的技術突破，賦予了行業更多的機會。

?“在這樣的時代背景下，蘑菇OS的交互設計理念就是為用戶提供最好的交互體驗。”鄧志偉表示，“蘑菇OS打造的全場景VUI（Voice User Interface），將從目前90%的語音輔以10%的觸摸交互，演進到最終實現100%的全語音交互。”

“語音交互最大的難點在于語音識別與語義理解，泛場景化的語義理解一直是業界最大的難題，即使機器學習的出現也不能解決泛場景化的連續交互問題。這也是為什么大家在使用手機、音箱等包含語音交互的終端場景里面始終感覺語音交互體驗不好，人工智能比較‘傻’的原因。”鄧志偉現場坦言，泛場景化語音交互場景依然面臨嚴峻的理論難題與體驗缺陷，“但是在車載領域，我們迎來了全新的機會，由于車載場景封閉化、場景化、歸一化的特點，使我們在車載領域實現全場景語音交互的優質體驗成為了可能。”

“目前蘑菇OS的用戶月語音交互次數已經突破了三億次，我們發現80%的語音交互內容出現了驚人的場景相似性，這為蘑菇OS的全場景語音交互帶來了巨大的啟發。”

蘑菇OS的VUI，定義了兩大類語音包場景：通用語音包服務與個性化語音包服務。

通用語音包服務通過用戶相似性場景的集中抽象，通過漸進理解、意圖跟蹤、智能糾錯等技術的運用，對用戶的意圖進行場景化分析，目前已支持涵蓋車輛控制、娛樂、安全、生活服務、信息等5類需求81個細分場景；通過大量模型訓練與機器學習，配以底層語音引擎技術，能夠迅速理解用戶意圖并提供精準反饋；通過場景引擎的定義，支持上下文多輪對話，能夠實現邊聽邊說邊想，大幅縮短響應時間，用戶可隨意插話，更貼近人們日常交流習慣。蘑菇通用語音包服務的理解準確率超過97%。

蘑菇OS的VUI同時推出了個性化語音包服務，可以通過聲紋識別、聲源識別、語言及語調識別，滿足個性化服務需求。通過聲紋識別提供定制服務，包括空調溫度、座椅角度、音樂喜好等；通過聲源識別用戶位置，當識別到“調低溫度”指令時，即可調節聲源位置的溫度；此外，個性化語言包系統還可通過語言及語調識別用戶情緒，實現差異化內容回復。

在百年的汽車發展歷程中，汽車產業的先驅們在不斷的探索人與車的交互方式，力爭打造最優質的人車交互體驗。鄧志偉表示，“人工智能時代的到來，給產業帶來了新的機遇，蘑菇OS期待沿著汽車產業先驅探索的步伐，與車企的伙伴們一起打造信息時代全新的人車交互體驗！”

本文來源億歐，經億歐授權發布，版權歸原作者所有。轉載或內容合作請點擊轉載說明，違規轉載法律必究。

聲明：該文章版權歸原作者所有，轉載目的在于傳遞更多信息，并不代表本網贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題，請在30日內與本網聯系。

您閱讀這篇文章花了0秒

轉發這篇文章只需要1秒鐘哦