2016年12月1日,教育部公布了2016年度高等學??茖W研究優秀成果獎(科學技術)的授獎項目結果,博云視覺創始人陳杰與北京大學的聯合科研成果:《視覺特征緊湊表示方法及高性能圖像搜索技術》獲得技術發明一等獎。
研發攻關,突破帶寬、計算復雜度瓶頸
圖像(以及作為運動圖像的視頻)是人工智能、計算機視覺與多媒體技術等方向的重要研究對象。智能前端(如智能手機、智能攝像頭、智能眼鏡)具有便捷的圖像采集功能,催生大量的圖像。視覺搜索(基于視覺特征的圖像搜索)結合手機等移動終端便攜性,正在變革移動互聯網的用戶體驗,使得圖像輸入日益成為移動搜索用戶“解放雙手”的重要交互模式。在安防領域,智能監控對圖像視頻大數據處理與分析技術的依賴日益顯著,期待檢測與識別準確率更高、帶寬占用更小的視覺特征表達。通過智能前端抽取緊湊視覺特征,并將特征傳輸至后端進行內容分析,可以大幅降低帶寬占用,突破圖像視頻大數據應用平臺面臨的數據匯聚與計算瓶頸,并提升大規模圖像視頻識別與檢索的性能。
傳統圖像搜索采用復雜的視覺特征和多類型的索引,在特征緊湊性、特征抽取復雜度、特征規范化和索引可擴展性方面存在諸多局限性,影響了視覺搜索技術的大規模應用與推廣。針對以上方面,該發明技術突破了四個關鍵問題:如何設計視覺特征緊湊表示、如何高效抽取緊湊視覺特征、如何構建大規模圖像索引模型、如何在多設備平臺上兼容多樣化搜索系統和圖像特征數據庫,開展了關鍵核心技術攻關,形成了以發明專利、國際標準、高水平學術論文以及產業化應用為主要形式的“視覺特征緊湊表示方法與高性能圖像搜索技術”系統性成果。

自2010年起,陳杰作為主要技術骨干全面參與了低比特、低復雜度、高性能的局部視覺特征提取、聚合、壓縮,交互數據規范化模型,以及移動端交互查詢等技術的研究。全程參與了緊湊視覺描述子國際標準MPEG CDVS的制定。主要提出了基于分塊尺度空間表示的低復雜度興趣點檢測技術和基于多級矢量量化的局部特征壓縮技術,突破了傳統局部視覺特征提取的高復雜度、大尺寸的局限。相關特征表示和索引技術被國際標準MPEG CDVS采納為核心技術,解決了圖像內容描述與檢索的標準化語言問題。已經在百度識圖、手機百度、微信智能開放平臺中得到應用。
推動底層技術產業化,圖搜更多可能
2015年底陳杰帶領他的核心研發團隊創建博云視覺,針對智能商業和安防監控行業,圍繞對海量圖像視頻數據的理解需求,依托于既有的緊湊視覺特征國際標準,深度融合人工智能技術,建立高性能圖像搜索分析平臺。市場方面,博云視覺將基于緊湊視覺特征的圖搜技術開放成API,現已部署在阿里云、華為云、京東云,用戶可直接調用集成圖搜功能。

深度融合特征,持續深耕技術
作為一家技術驅動型公司,在研發方面,博云視覺以標準化芯片級算法應用研究為導向,持續深耕優化視覺搜索與分析的底層算法技術。同時將底層生物特征表達結合基于深度學習技術的語義特征,使視頻目標對象搜索的平均準確率提高了10%以上。并在第116次ISO/IEC JTC1運動圖像專家組MPEG國際標準會議上博云視覺聯合北京大學、南洋理工大學共同提交了提案《Improved retrieval and matching with CNN feature for CDVA》,各國專家對該提案給予了高度評價,針對融合深度學習特征與底層視覺特征專門設立了核心實驗,期望未來進一步解決深度學習模型壓縮和深度學習特征編碼等問題,以此作為未來CDVA技術的導向性探索。
正如圖像搜索應用在各領域的擴張一樣,博云視覺成立滿一年之際,其技術已經在移動互聯網、藝術品、安防監控、輔助駕駛、綜合電商、旅游等多個領域得到了廣泛應用。已與北京大學、新加坡南洋理工大學、華為、阿里巴巴、中國美術家協會、尚易德等達成戰略合作。
您也可以關注我們的官方微信公眾號(ID:ctoutiao),給您更多好看的內容。