圖片來源@視覺中國
鈦媒體快訊 |?9月19日消息:百度地圖事業部總經理李瑩今日宣布,百度推出行業首個地圖語音定制功能。據李瑩介紹,語音定制功能推出后,用戶只需要在手機錄制20句話,經過20分鐘左右的制作,就可以生成個人完整語音包。
如圖,用戶可從百度地圖首頁進入語音定制頁面,可選擇性別,還可以錄制童聲。錄制的文本方面,用戶也可以選擇系統推薦文本,卡通文本和電影臺詞。特別是錄制童聲時,百度為低齡兒童設置了語句更短、可重復的兒童語句。錄制完的語音包可以自己使用,也可通過微信或者百度地圖分享給他人使用。
百度地圖語音定制模塊圖示
據悉,用戶定制的語音包使用場景比較廣泛,在手機地圖的任何場景中都可使用,比如景區智能語音導覽、智能語音交互等全部場景使用。用戶可免費使用自己或家人的語音包在景區游覽。
李瑩也特別強調,在整個流程中百度地圖遵循了業界最標準、最成熟的安全規范,采取了非常安全的保護措施,會最大程度的保障每個用戶的安全隱私。“百度地圖對于語音定制服務的權限獲取將僅用作語音包錄制,不做他用。百度地圖未經用戶的授權同意,不會將用戶的語音包共享給任何人。”
李瑩在演講中介紹道,如果做一個通用大庫的語音包,大概需要錄制的語音量是上萬句,制作周期近半年。如果做個人定制的,如某一個明星的語音包,需要在大庫基礎之上錄制1000到2000句語音,要在專業的錄音棚里面錄制大概兩周時間,而真正把這個語音包用語音技術生成出來需要兩個月的時間。
新的語音定制功能大大縮減了此前語音錄制的成本。百度語音首席架構師賈磊介紹了語音定制功能背后的技術:
“百度地圖語音定制功能基于百度獨創的說話人韻律遷移技術Meitron,其特點主要體現在發音人音色轉換,多情感朗讀和韻律風格遷移三個方面,從而讓個性化語音合成的定制門檻大大降低。”
云端深度學習語音合成技術可形成不同風格的聲音
賈磊介紹道,以前語音合成大多數都是新聞播音腔,而現在百度的語音合成可以有多重風格和聲線。在現場原聲與合成聲音的比對測試中,兩種聲音幾乎分辨不出差別。
當前,在數據生產方面,百度地圖80%數據采集環節已實現AI化,擁有3000萬的POI空間圖譜、700萬的用戶興趣圖譜,共同組成了百度地圖POI高精知識圖譜。
(本文首發鈦媒體,作者/蘆依)
更多精彩內容,關注鈦媒體微信號(ID:taimeiti),或者下載鈦媒體App
2022-09-14 鈦媒體 App發布了 《星巴克加碼中國市場,未來三年要新增開3000家門店|鈦快訊》的文章
2022-08-11 鈦媒體 App發布了 《白云山麾下公司虛抬藥價“把戲”,被拆穿了》的文章
2022-07-06 鈦媒體 App發布了 《為了幫00后卷王找到工作,簡歷修改師們拼了》的文章
2022-07-06 鈦媒體 App發布了 《威尼斯向游客收“進城費”,國內城市如何借鑒?》的文章
2022-03-25 鈦媒體 App發布了 《蔚來2021年財報發布:年營收361億元,整車毛利率達到20.1%》的文章