
摘要
目前,微軟智能語音已賦能超過 100 個國家合作伙伴的產品及服務,共同打造了語音交互生態。
多年來,微軟持續探索 AI 語音合成與識別技術,獲得了大量成果:Azure Neural TTS(text-to-speech,語音合成)與 STT(speech-to-text,語音識別)支持的語言區域達到 140 余個,并支持超過 400 多個音色,并具有豐富細膩的情感,與真人聲音不相伯仲。目前,微軟智能語音已賦能超過 100 個國家合作伙伴的產品及服務,共同打造了語音交互生態。
近兩年,微軟在漢語方言智能語音上加大了研究力度,在語音合成上實現了對吳方言和粵方言兩種漢語方言,以及西南官話、東北官話、冀魯官話、中原官話(包括河南、陜西地區)等多種官話次方言的支持;在語音識別上支持吳方言、粵方言和西南官話,受到了眾多企業客戶的青睞,也得到了終端用戶的認可。
值此辭舊迎新之際,微軟智能語音為大家送上新春祝福!一起感受方言朗讀的獨特魅力。
中原官話(河南)音頻:00:0000:17
中原官話(河南)朗誦的北宋王安石的《元日》
在智能家居領域,使用智能語音控制空調、電視、電燈等家居產品已經越來越常見。在與智能機器人的對話中,人們往往需要使用標準普通話以得到準確的反饋,但一些習慣使用方言的用戶群體——比如家中的老人可能更傾向使用方言進行交流。因此,若智能家居企業在產品中引入方言語音,便能更好地滿足人們對不同方言使用的需求。
以吳方言(上海)與智能空調進行交互:
吳方言(上海)音頻:00:0000:08
儂好,已為儂打開空調,并將溫度調低至 25 度。稍后還有其它需要,可以隨時呼叫我。
在智能導航領域,各大地圖廠商將"聲音"作為吸引客戶的重要賣點,紛紛推出了明星語音包、幽默風趣的相聲語音包等等。近兩年,越來越多的用戶認為方言會讓他們感覺更親切、熟悉,也更容易理解。
以東北官話(遼寧)進行的語音導航:
東北官話(遼寧)音頻:00:0000:25
我們已經駛入 2022 年冬季,冬天常常與雪為伴,溫度將至零下,路面易結冰,所以請減速減速再減速。注意兩百米后有一個小小的急轉彎,但道路濕滑也容易讓你漂移,請收油慢行。前方路口行人較多,還請踩下剎車,不要讓它成為擺設。
在影視配音中,來自眾多地域的不同角色,有時需要搭配方言才能更好地呈現人物形象。比如,角色設定來自東北,性格熱情豪爽、快言快語,如果以普通話配音,就失去了特色;再比如,在美食介紹節目中,針對不同的菜系搭配當地的特色方言,更能引起人們的共鳴,想象中就能口齒生津。
以西南官話(四川)介紹美食:
西南官話(四川)音頻:00:0000:23
重慶火鍋以麻、辣、燙、鮮、香、嫩、脆著稱,然而正宗的重慶火鍋究竟應該燙啥子才巴適?鮮脆毛肚、爽滑鴨腸必不可少,富有嚼勁;剁椒嫩牛肉不可錯過,雙椒口感鮮辣十足;井水豆芽口感獨特,石磨黑豆腐鮮香四溢,清爽荷心香甜解膩。
除了上述場景外,微軟智能語音也已經在呼叫中心、新聞閱讀等眾多場景中應用。越來越多的企業對方言智能語音有需求,包括智能汽車、智能手機等企業對語音助理、呼叫中心的方言場景規劃,以及(短)視頻配音等等。
漢語是世界上最古老的語言之一,受歷史與地理條件的影響,出現了眾多代表地域文化特色的方言。自 2017 年起,微軟一直致力于 AI for Good 計劃的推進,其中包括:通過提供前沿的技術、資源和專業知識,保護人文遺產以及創造更具可持續性和便利性的世界。微軟也將持續投入于方言智能語音的研究,助力中國傳統文化的保護與傳承。
在方言之外,古典詩歌也是文化傳承的重要載體。微軟通過學習大量詩歌朗誦者的語音數據,可以讓 AI 更好地表達詩歌的韻律、停頓、情感。微軟可支持傳統詩歌、現代詩歌、五言、七言律等智能語音的朗誦。?
中原官話(陜西)朗誦唐朝李世民的《守歲》:
中原官話(陜西)音頻:00:0000:23
《守歲》,唐,李世民。暮景斜芳殿,年華麗綺宮。寒辭去冬雪,暖帶入春風。階馥舒梅素,盤花卷燭紅。共歡新故歲,迎送一宵中。
從智能家居到車載語音助手,從呼叫中心轉寫到多人會議記錄,微軟智能語音技術不斷打破場景限制,讓人工智能以各種各樣的聲音形象來豐富人們的工作和生活。未來,微軟智能語音還將擴展覆蓋更多全球語言和方言,持續提升模型質量、準確度,盡全力滿足區域用戶的個性化、差異化定制需求,為使用者提供更好的語音服務,解鎖更多交互場景。
附:漢語方言通常分為十大方言:官話方言、晉方言、吳方言、閩方言、客家方言、粵方言、湘方言、贛方言、徽方言、平話土話。各方言區內又分布著若干次方言和許多種「土語」。其中使用人數最多的官話方言可分為東北官話、北京官話、冀魯官話、膠遼官話、中原官話、蘭銀官話、江淮官話、西南官話八種次方言。
來源:中國語言文字概況(2021 年版)
(完)