9億張圖片是個什么概念?
相當于世界最大的社交平臺Facebook世界各地的用戶每天上傳圖片的總數的兩倍。如果將9億張圖片打印成A4紙疊在一起,長度能有79.2公里,北京地鐵最長的10號線總長也才57.1公里。
互聯網圖片、視頻數據的暴漲,也給互聯網公司內容監管工作帶來挑戰。數據顯示在整個的內容里面,涉黃的比例只占萬分之四以下。
但是關鍵是如何把這萬分之四的不良內容給找出來?
以普通鑒黃師每天需審核2萬張圖片計算,如果沒有人工智能技術的協作,這么大的工作量需要4萬多人參與其中,相當于阿里巴巴員工數量的2倍多。對于任何需要進行對內容審核的互聯網公司來說,都是不可承受的人力投入。
通過人工智能技術,圖普科技提供一整套的圖像識別服務為互聯網企業保駕護航。
“其實在人工智能技術的應用上,鑒黃只是一件簡單的事情。” 圖普科技創始人兼CEO李明強說。
隨著行業對人工智能重視程度的提高,各種以圖像識別技術為賣點的初創公司也如雨后春筍般涌現。在人臉識別、身份驗證、拍照搜索、視頻監控、防止疲勞駕駛等方面都有應用。圖普科技將人工智能應用在了互聯網的內容審核上面,正是抓住了互聯網企業規避平臺上色情、暴恐、時政敏感、廣告等的風險的痛點。
“目前我們的識別精確度和準確率均超過99.5%,單張圖片響應時間小于0.2s。”李明強說。合作互聯網企業每天過9億次的圖片調用,減少了至少80%的互聯網有害信息。
以迅雷為例,通過接入圖普科技的圖像識別云平臺,由平臺提供智能機器審核服務,后期數據反饋,超過98%的色情視頻被機器過濾,復審量低于總量2%,節省了超過98%的人力成本。
李明強表示,讓原本無意識的機器能夠識別和理解圖像,是人工智能的目標之一。但深度學習在研發上還面臨著三大問題:
1.理論問題
深度模型都是非凸函數,在研究需要多少計算資源或計算樣本才能通過訓練得到更好的模型,以及理想的計算優化方法上,這方面的研究極其困難。
2.建模問題
也就是針對具體應用問題,如何設計一個最適合的深度模型來解決問題?
2.工程問題
對于互聯網企業而言,如何在工程上利用大規模的并行計算平臺來實現海量數據訓練,是各家企業從事深度學習技術研發首要解決的問題。
圖像識別技術核心就在于深度學習算法,但這需要大量的經驗數據去提高學習能力。
在這方面,蘋果、百度、谷歌和微軟等國內外的大公司有著先天的優勢,另外,大公司在人才以及物資方面比較充足。往往他們也不惜投入重金,通過收購或建設以圖像識別為主要課題的人工智能技術團隊。
2014年4月圖普科技成立后,成為國內最先做圖像識別云平臺的幾家企業之一。較早的進入使得企業在這一領域擁有了較強的競爭優勢。
1.工程技術。
圖普科技不僅擁有自主研發產品的技術開發團隊,通過與浙江大學合作,搭建并開放了國內首個圖像識別云平臺,基于大規模GPU集群搭建的人工智能超算平臺,支持億萬級別的圖像處理。
2.克服大數據壁壘。
圖普科技研發了一套關于內容審核方面的圖像和視頻判斷的一個人工智能的模型,利用深度學習算法設計的智能程序能通過快速迭代擁有強大的學習能力。
通過與迅雷、酷狗、花椒、唱吧、今日頭條、Bilibili、秒拍等知名公司合作,從而積累了大量圖片和視頻數據,克服了智能程序設計中關鍵的的大數據壁壘。
3.建立服務優勢
圖普科技是國內最早利用人工智能算法做審核服務的。也是在在工程經驗、服務專業度方面具有先發優勢。能夠根據不同的客戶、不同的細分領域,做單獨的模型調整以及算法細節的優化,專人服務對專門的客戶做專業的運營。
“圖譜制定的很多定價的方法、歸類的方法、接口返回的定義都為后來的同行做出了一定標準和規范。”李明強介紹,在滿足企業的基本需求后,圖普科技逐步提供一系列增值服務,如基于圖像和視頻的廣告投放、智能導購,直播平臺的主播推薦等。除此之外,還有其他的可定制的應用場景,比如電商平臺的“以圖搜圖”、電視臺的臺標識別、旅游網站的場景識別、金融行業的智能投資分析等。
李明強表示,日益普及的人工智能技術將會越來越影響到移動產品的未來創新,在產品競爭力上,人工智能可以從兩個方面切入。
1.現有App可以考慮AI+
首先在體驗上。
用語音識別或圖像、視頻搜索在海量數據中提升搜索效率,通過大數據和標準匹配來增加個性化推薦、相關推薦的智能化功能。
其次是運營上。
智能化審核文字、圖片、視頻等UGC內容,以此保障信息安全;描繪、分類用戶畫像及分析用戶行為,可以為你的用戶體驗提供感性建議;還可以通過AI提高趣味性,比如顏值識別接口,可以為顏值打分——最近圖普科技與悅跑圈合作搞了一個“鬼臉活動”,這個活動不是比美,而是比丑,看誰做出的鬼臉扮丑最厲害。
其實不僅如此,還可以利用圖像識別接口做“最萌妹子”、“最文藝范”、“最性感”等有趣的評選活動,可以通過人工智能解決很多產品同質化的問題。
2.創造AI為核心的產品
比如說Google Translate,能夠實時視覺翻譯AI+AR,改變你看到的世界;或者是最近很火的圖像編輯軟件Prisma,利用AI融入藝術相機將照片變成畢加索、梵高等名畫。
李明強最后建議,創業者要去思考和學習人工智能方面的知識,結合正在從事的行業或者從理解較深的行業著手,在細分領域去積累數據,新進的創業者需要去找行業的新切入點進入,這樣更有機會。