近日,在奧地利召開的機(jī)器語音國際頂會 InterSpeech 2019 上,國際聲紋識別權(quán)威競賽 VoxCeleb Speaker Recognition Challenge(VoxSRC)公布最新結(jié)果,依圖科技大幅領(lǐng)先海內(nèi)外多支強(qiáng)隊(duì)獲得冠軍,再次展示了世界級人工智能算法實(shí)力,充分表明中國聲紋識別技術(shù)已達(dá)世界領(lǐng)先水平。
此次參賽隊(duì)伍不僅包括約翰霍普金斯大學(xué)、法國國家信息與自動化研究所、清華大學(xué)、中山大學(xué)等海內(nèi)外知名高校、研究機(jī)構(gòu),還包含平安科技、NEC、君林科技等各大企業(yè)。至此,依圖人工智能技術(shù)不僅在視覺感知、自然語言理解等領(lǐng)域領(lǐng)跑全球,聲紋識別技術(shù)也已達(dá)世界頂尖水平。
聲紋識別是一種通過聲音判別說話人身份的技術(shù)。如果說語音識別是讓機(jī)器判斷「說了什么」,那聲紋識別就是判斷「是誰說的」,用于解決生物身份的確認(rèn)和識別。很顯然,使用基于端到端深度學(xué)習(xí)的方法做聲紋識別,擁有大量聲紋數(shù)據(jù)樣本,就有了無可置疑的優(yōu)勢。
聲紋識別的應(yīng)用前景非常廣泛,比如智能手機(jī)鎖屏、聲控安全門、汽車聲控鎖等;利用聲紋辨認(rèn)技術(shù),還可以支持智能音箱、智能語音助理等提供個性化服務(wù),比如針對家里的老人和孩子,推薦不同的歌曲、新聞。
但由于聲紋識別技術(shù)本身的難度很高,這些應(yīng)用需求大部分還處在探索階段。這也是到目前市面上能自動辨別說話人的智能語音應(yīng)用比較少見的一個原因。
在聲紋識別領(lǐng)域,VoxCeleb Speaker Recognition Challenge(VoxSRC)是兼具影響力和權(quán)威性的國際評測。與常規(guī)的聲紋識別評測不同,VoxSRC所用的數(shù)據(jù)量大、來源多樣,而且都采集自真實(shí)場景,比如會場訪談、室外多人對話,含有各種噪音和雜音,對于算法性能的要求非常高。此外,該競賽的評估方法非常嚴(yán)謹(jǐn),因此其結(jié)果在學(xué)術(shù)界和工業(yè)界都得到認(rèn)可。
成立 7 年來,依圖在視覺感知、自然語言處理、語音識別、智能決策等多算法領(lǐng)域發(fā)展,并且都獨(dú)占鰲頭。這次在全球聲紋識別權(quán)威競賽 VoxSRC 中奪冠,是對中國自有 AI 技術(shù)能夠引領(lǐng)世界的又一個絕佳證明。
依圖這次創(chuàng)下紀(jì)錄的聲紋識別精度水平,已經(jīng)可以滿足基本的智能聲紋應(yīng)用需求,比如在線交易支付的動態(tài)聲紋密碼、個人賬戶登錄的聲紋動態(tài)口令登錄。試想,社保局安裝聲紋身份認(rèn)證系統(tǒng)后,就能實(shí)現(xiàn)安全的遠(yuǎn)程身份認(rèn)證,讓“信息多跑路,群眾少跑腿”,為百姓生活帶來極大的便利。隨著技術(shù)的不斷成熟和融合,聲紋識別技術(shù)將逐漸融入我們的日常生活,產(chǎn)生巨大的應(yīng)用價(jià)值。中國自研的人工智能技術(shù),也將持續(xù)推動和引領(lǐng)全球技術(shù)發(fā)展,力爭成為行業(yè)標(biāo)桿。
近年來,隨著人工智能利好政策頻出、AI技術(shù)逐漸發(fā)展成熟,在巨大的市場需求下中國AI產(chǎn)業(yè)迅猛發(fā)展。相關(guān)數(shù)據(jù)顯示,2018年中國人工智能市場規(guī)模約為238.2億元,增長率達(dá)到56.6%,2019年市場規(guī)模預(yù)計(jì)達(dá)到近280億元。而在蓬勃發(fā)展的人工智能產(chǎn)業(yè)中,計(jì)算機(jī)視覺領(lǐng)域尤為火熱,不單單依圖的聲紋識別優(yōu)秀,商湯、曠視、WiMi微美全息的計(jì)算機(jī)視覺同樣格外令人矚目。
商湯科技成立于2014年,是國內(nèi)一家致力于計(jì)算機(jī)視覺和深度學(xué)習(xí)原創(chuàng)技術(shù)的創(chuàng)新型科技公司,提供人臉識別、語音技術(shù),文字識別,人臉識別,深度學(xué)習(xí)等一系列人工智能產(chǎn)品及解決方案,幫助各行各業(yè)的客戶打造智能化業(yè)務(wù)系統(tǒng)。作為全球領(lǐng)先的人工智能平臺公司,商湯科技為中國科技部指定的國家新一代人工智能“智能視覺”開放創(chuàng)新平臺。同時(shí),商湯科技也是“全球最具價(jià)值的AI創(chuàng)新企業(yè)”,公司總?cè)谫Y額超過16億美元,估值超過45億美元。
商湯科技的市場占有率居多個垂直領(lǐng)域首位,涵蓋智慧城市、智能手機(jī)、互動娛樂及廣告、汽車、金融、零售、教育、地產(chǎn)等多個行業(yè)。目前,商湯科技已與國內(nèi)外700多家世界知名的公司和機(jī)構(gòu)建立合作,包括美國麻省理工學(xué)院、高通、英偉達(dá)、本田、阿里巴巴、蘇寧、中國移動、銀聯(lián)、萬達(dá)、華為、小米、OPPO、vivo、微博等。
此次商湯集團(tuán)智能視覺國家新一代人工智能開放創(chuàng)新平臺將在四個方面發(fā)揮核心使命,包括通過超算系統(tǒng)、訓(xùn)練系統(tǒng)、智能視覺工具鏈等核心基礎(chǔ)的研發(fā)、數(shù)據(jù)系統(tǒng)的構(gòu)建,在基礎(chǔ)研究和核心技術(shù)上與國際保持同步研發(fā)水平;實(shí)現(xiàn)智能視覺底層關(guān)鍵技術(shù)和共性支撐技術(shù)的突破,促進(jìn)智能視覺技術(shù)與多行業(yè)的快速結(jié)合、產(chǎn)業(yè)賦能;建立人工智能國際化人才體系和培養(yǎng)國際化人才;通過人工智能賦能,創(chuàng)造以眾創(chuàng)空間、孵化器為代表的大眾創(chuàng)業(yè)、萬眾創(chuàng)新的生態(tài)環(huán)境,促進(jìn)新舊動能轉(zhuǎn)換。同時(shí),商湯集團(tuán)將成為助推粵港澳大灣區(qū)打造科技創(chuàng)新新高地,推動科技全球化布局的領(lǐng)導(dǎo)力量。
國內(nèi)的另外一家以全息視覺為引導(dǎo)的企業(yè)微美全息,在AI視覺領(lǐng)域也是較為突出。微美全息專注于計(jì)算機(jī)視覺全息云服務(wù),微美全息覆蓋從全息計(jì)算機(jī)視覺AI合成、全息視覺呈現(xiàn)、全息互動軟件開發(fā)、全息AR線上及線下廣告投放、全息ARSDK支付、5G全息通訊軟件開發(fā)、全息人臉識別開發(fā)、全息AI換臉開發(fā)等全息AR技術(shù)的多個環(huán)節(jié),是一家全息云綜合技術(shù)方案提供商。
微美全息十分注重底層技術(shù)的研發(fā),憑借多年來在計(jì)算機(jī)視覺領(lǐng)域的耕耘與積累,微美全息已經(jīng)完成了從0到1的技術(shù)沉淀、打磨,微美的AI視覺技術(shù)已經(jīng)到了成熟落地,各項(xiàng)技術(shù)指標(biāo)也達(dá)到了行業(yè)的領(lǐng)先水平。技術(shù)成熟后,微美著重規(guī)劃了從1到N落地應(yīng)用,其中機(jī)器人是規(guī)劃中非常重要的一環(huán)。微美全息云產(chǎn)品布局商業(yè)應(yīng)用場景主要聚集在家用娛樂、光場影院、演藝系統(tǒng)、商業(yè)發(fā)布系統(tǒng)及廣告展示系統(tǒng)等五大專業(yè)領(lǐng)域。
微美的全息圖像處理功能定期進(jìn)行優(yōu)化和改進(jìn),包括兩項(xiàng)核心技術(shù):全息AI面部識別技術(shù)和全息AI面部變化技術(shù)。由于視頻處理和識別技術(shù)的發(fā)展,微美基于圖像檢測、識別、模板匹配、圖像動態(tài)融合和替換的全息AR廣告和全息成像服務(wù)目前在行業(yè)中處于領(lǐng)先地位。
微美云息技術(shù)研發(fā)以滿足客戶需求和自身業(yè)務(wù)發(fā)展為目的,以計(jì)算機(jī)圖形圖像處理技術(shù)為基礎(chǔ),AR全息技術(shù)為核心,各環(huán)節(jié)技術(shù)成熟。
此外,我國計(jì)算機(jī)視覺的發(fā)展與國外有著不同的應(yīng)用市場。根據(jù)IDC市場跟蹤,2018年我國計(jì)算機(jī)視覺技術(shù)輸出規(guī)模最大的三個行業(yè)是政府、金融和互聯(lián)網(wǎng)。而國外計(jì)算機(jī)視覺技術(shù)則主要輸出于消費(fèi)、機(jī)器人(及機(jī)器視覺)、智能駕駛行業(yè)。不過,有業(yè)內(nèi)人士指出,隨著我國計(jì)算機(jī)視覺的不斷發(fā)展,其也將與更多行業(yè)進(jìn)行全方位地深入融合,這意味著計(jì)算機(jī)視覺市場仍有巨大的潛力。
在此背景下,聚焦于計(jì)算機(jī)視覺領(lǐng)域的商湯、曠視、WiMi微美全息等企業(yè)將值得期待。與此同時(shí),我國人工智能的發(fā)展也將圍繞計(jì)算機(jī)視覺等核心領(lǐng)域展開,在人工智能相關(guān)政策的推動下,計(jì)算機(jī)視覺也將繼續(xù)滿足各行各業(yè)的需求,推動產(chǎn)業(yè)的轉(zhuǎn)型升級。
2023-03-28 i黑馬發(fā)布了 《網(wǎng)紅文和友,只能是長沙限定嗎?》的文章
2021-11-08 i黑馬發(fā)布了 《悠絡(luò)客成為首批“可信人臉識別守護(hù)計(jì)劃”成員》的文章
2021-11-05 i黑馬發(fā)布了 《城市級數(shù)字停車企業(yè)「潤銘科技-停開心」獲百年鑫投基金戰(zhàn)略投資》的文章
2021-11-03 i黑馬發(fā)布了 《又一獨(dú)角獸即將破產(chǎn)清算:10 億美金往后的路也不容易》的文章
2020-05-05 i黑馬獲得了天子之梅的關(guān)注