【獵云網北京】9月23日報道(文/奇點)
近年來,全球智能語音市場呈現連年增長的趨勢,預計到2020年,全球市場規模將達到191.7億美元——相比2015年的61.9億美元,四年內其增長速度翻了三倍多。
但實際落地情況并沒有表象中樂觀。
當前,語音識別在行業落地遇到的最大問題,是行業數據與需求的不對等,即語音識別缺乏專業性。縱使是語音識別頭部企業,也很難覆蓋到各細分市場,從而導致行業整體識別率提升困難。
從技術角度來看,當前NLP(自然語言處理)的發展仍面臨著“四大挑戰”:詞法、語義等不同層面存在著不確定性;新的術語和詞匯等導致未知語言現象的不可預測性;數據資源的不充分難以覆蓋復雜的語言現象;相關語義知識等難以用簡單的數學模型描述,對參數龐大的深度模型需求迫切。
所以,NLP并未真正實現技術突破,這也使得整個語音領域的產品落地與客戶期望之間存有一定差距,尤其是在客服、問答等領域。
近日,獵云網接觸到語音界的新生力量——北京孚睿星辰智能科技有限責任公司(FreeNeb),其是一家專注語音處理技術研究,并面向企業提供“獨具一格”的聲紋識別和語音識別解決方案與專業服務的創業公司。
FreeNeb依托清華大學語音AI核心技術研究力量,目前在語音、聲紋識別等語音相關領域已取得一系列成果。
其核心產品包括語音及聲紋識別服務私有化平臺、嵌入式語音和聲紋識別服務,同時配套了智能語音翻譯、智能語音門鎖等多種解決方案。現已觸達到教育、金融、政府、客服等多個領域。
FreeNeb COO劉榮在接受獵云網采訪時表示:“基于目前整個語音領域的產品落地情況,FreeNeb要做一個為企業量身定制的語音優化工具,旨將語音識別技術經驗做成一個簡單可用的工具。“
劉榮還表示:“我們最主要的工作,就是讓語音識別的技術觸角觸及到更多的行業,讓各個行業具備獨立利用其內部數據和語音技術實現快速變現的能力。”
近年來,FreeNeb在產品定位上:旨要做一個標準化、可應用、高效率的語音優化工具,并且未來這將會是一個可鋪量的標準化工具。
FreeNeb日前推出的產品“創新企業開放語音平臺(CeaOS)”是由智能語音創新企業開放聯盟(CeaFos)支持的企業級私有引擎開放系統。其從本質上看,CeaOS系統是一款服務于中小企業的“語音識別私有引擎及優化工具”。
中小企業及微小型創企都可以利用該開放平臺免費獲得企業級語音服務引擎,從而可以自由地打造屬于自己企業的“專業語音服務”。
目前FreeNeb的產品工具已達到標準化,同時上線了語音識別私有引擎和自適應訓練平臺,若究其技術原理,便涉及到聲學及語言兩種模型。
聲學模型的自適應學習可以增強系統對特定行業領域的魯棒性(簡單理解為適應能力、性能穩定性),包括對使用人群(年齡、性別、生理、口音等方面)和環境(場所、背景音、近遠場等)的魯棒性,最終達到提升系統整體識別性能的目的。
整個過程類似遷移學習,即模型已經習得的通用“知識”通過適應于特定場景數據的內在變化、差異,形成該場景下的專業“知識”,并使系統更擅長于數據所描述的特定領域。
而語言模型是機器“遣詞造句”時所要參照的知識庫,對特定行業領域的語言模型自適應則需要學習該領域下的文本數據(領域知識載體),從而讓語音識別引擎知道更多的行業知識,再面對行業場景時會變得更加聰明。
CeaOS的主要目的是讓更多初創企業可以獲得免費的語音技術,從而減少語音產業落地過程中的摩擦成本。
另外,對于行業用戶,FreeNeb推出私有化訓練平臺解決方案,提供用戶私有化學習功能,一鍵訓練快速提升,可以應用到電話端語音識別、網絡端語音識別等場景。目前已有行業用戶應用到金融端的呼叫中心應用解決方案中。
當下聲紋識別的應用較為廣泛,其技術在各個領域都有滲透。自2016年起,中國建設銀行便應用了手機聲紋支付。不僅如此,聲紋技術也同樣應用于:呼叫中心的反欺詐及VIP認證,智能手機華為、三星的聲紋喚醒技術,社保中的遠程認證等。
目前FreeNeb的聲紋技術主要應用于銀行金融領域、安防領域、智能硬件領域。與此同時,FreeNeb在與具體企業業務上的結合也正在打磨,得到了來自各方企業的一致認可。
值得一提的是,從目前智能語音市場來看,其中不乏做語控及聲紋的廠商,但致力于將聲紋與語音技術融合的廠商——FreeNeb是第一家。
劉榮對此闡述道:“就聲紋和語音技術兩方面:融合是我們的特點,拆分后雙方我們都有相對應的落地產品。團隊一直在嵌入式語音技術上持續研發,在邊緣端的語音技術和聲紋技術已經在市場上落地,聲紋+的產品模組也已經量產。”。
一方面,FreeNeb依托清華語音AI核心的力量,聲紋技術早在清華實驗室中積累了十幾年的豐富經驗;另一方面,FreeNeb發起人王東專注于語音技術研究已有20多年,經驗極為豐富。
此外,目前國內聲紋市場剛剛興起,聲紋技術人才相對短缺,脫胎于清華語音科研團隊的FreeNeb具有天然的技術優勢和人才儲備。
目前FreeNeb正在與相關公司進行合作,推出聲紋門鎖模組,在原有指紋靜態特征的基礎上又融入了聲紋動態特征,安全性極高。
此外,FreeNeb在產品落地的設計上也獨具一格。其注重在邊緣端上發力,用戶的數據信息不需上傳至云端服務器,直接在邊緣端上進行處理,用戶可隨時請求數據在邊緣端進行刪除,此舉有效地保護了用戶隱私。
劉榮說:“接下來我們希望能在端上實現設備與設備之間可靠的控制,邊緣端處理數據不會上傳至云端,所有的語音數據都在邊緣端上計算,這也將是未來智能設備處理數據的一個正確趨勢。”在未來的研究中,FreeNeb端上技術不僅只是人的聲紋控制,還會延伸到設備的聲紋控制(即對物體的聲紋識別)。
未來我們周圍的智能設備及專屬穿戴設備將無需通過繁瑣機械的步驟進行手工控制,而是采用自然、便捷的聲紋+語音實現可靠、可信的交互式控制。
FreeNeb的核心團隊源自于科研底蘊深厚的清華大學。發起人王東是清華大學副教授、語音語言技術中心副主任,曾任Oracle軟件工程師、IBM高級軟件工程師、愛丁堡大學馬麗-居里研究員、法國EURECOM博士后研究員、美國Nuance公司高級研究科學家等。
CEO 湯志遠 中科院與清華大學聯合培養博士,專注語音識別、說話人識別、語種語別等領域,在主要國際期刊或會議上發表論文20余篇。
CTO李藍天,清華大學博士,專注說話人識別領域,在主要國際期刊或會議上發表論文50余篇,北京市優秀畢業生,公開專利10余。
COO劉榮是中國石油大學學士,清華大學語音和語言技術中心資深工程師,曾任阿里巴巴資深算法工程師、優酷土豆信息流推薦算法工程師。此外,FreeNeb團隊還包括來自知名互聯網公司的多名優秀人才。
技術實力的儲備和行業從業經驗的積累,使得FreeNeb團隊具備了從技術到商務的人才梯隊。
劉榮在接受獵云網采訪中表示:“AI到這個階段,為什么落地遇到了瓶頸,大部分原因還是因為AI人才的成本太高。”在一個行業中,商務、市場、銷售不懂技術,往往是最讓人頭疼的事情。
從這個出發點,劉榮從思維上做出了改變。
團隊2016年組建之初,FreeNeb就帶著算法博士去現場、去和客戶進行深入溝通。在這個轉變的過程中,將其技術上的思維與解決問題的思維慢慢融合、打磨。雖然過程極其痛苦,但FreeNeb也為AI落地完成了思維上的改革。
劉榮表示:“這是個心態轉變的過程,既要懂技術,又要涉獵到業務上。當然最重要的是放低技術身段,謙虛地與傳統廠商討論學習,這個轉變對FreeNeb的影響很大。”
當下,FreeNeb涵蓋了技術研發部、工程開發部、產品質檢部、市場項目部等。合作方包括國家電網、日本清華同方、中科匯聯等。
他們也正在開放接洽新一輪融資,尋找共同致力于語音技術產業落地的投資方和資源方。
項目:CeaOS(創新企業開放語音平臺)
公司:北京孚睿星辰智能科技有限責任公司
網址:http://www.freeneb.com/
2022-04-08 獵云網發布了 《俞敏洪流露退隱之意?稱自以為是的努力,已成為新東方發展的障礙》的文章
2022-04-08 獵云網發布了 《闊別五年重返網約車!周航掌舵曹操出行》的文章
2022-04-08 獵云網發布了 《加速布局芯片!小米入股芯片公司尊湃通訊》的文章