9億張圖片是個(gè)什么概念?
相當(dāng)于世界最大的社交平臺Facebook世界各地的用戶每天上傳圖片的總數(shù)的兩倍。如果將9億張圖片打印成A4紙疊在一起,長度能有79.2公里,北京地鐵最長的10號線總長也才57.1公里。
互聯(lián)網(wǎng)圖片、視頻數(shù)據(jù)的暴漲,也給互聯(lián)網(wǎng)公司內(nèi)容監(jiān)管工作帶來挑戰(zhàn)。數(shù)據(jù)顯示在整個(gè)的內(nèi)容里面,涉黃的比例只占萬分之四以下。
但是關(guān)鍵是如何把這萬分之四的不良內(nèi)容給找出來?
以普通鑒黃師每天需審核2萬張圖片計(jì)算,如果沒有人工智能技術(shù)的協(xié)作,這么大的工作量需要4萬多人參與其中,相當(dāng)于阿里巴巴員工數(shù)量的2倍多。對于任何需要進(jìn)行對內(nèi)容審核的互聯(lián)網(wǎng)公司來說,都是不可承受的人力投入。
通過人工智能技術(shù),圖普科技提供一整套的圖像識別服務(wù)為互聯(lián)網(wǎng)企業(yè)保駕護(hù)航。
“其實(shí)在人工智能技術(shù)的應(yīng)用上,鑒黃只是一件簡單的事情。” 圖普科技創(chuàng)始人兼CEO李明強(qiáng)說。

隨著行業(yè)對人工智能重視程度的提高,各種以圖像識別技術(shù)為賣點(diǎn)的初創(chuàng)公司也如雨后春筍般涌現(xiàn)。在人臉識別、身份驗(yàn)證、拍照搜索、視頻監(jiān)控、防止疲勞駕駛等方面都有應(yīng)用。圖普科技將人工智能應(yīng)用在了互聯(lián)網(wǎng)的內(nèi)容審核上面,正是抓住了互聯(lián)網(wǎng)企業(yè)規(guī)避平臺上色情、暴恐、時(shí)政敏感、廣告等的風(fēng)險(xiǎn)的痛點(diǎn)。
“目前我們的識別精確度和準(zhǔn)確率均超過99.5%,單張圖片響應(yīng)時(shí)間小于0.2s。”李明強(qiáng)說。合作互聯(lián)網(wǎng)企業(yè)每天過9億次的圖片調(diào)用,減少了至少80%的互聯(lián)網(wǎng)有害信息。
以迅雷為例,通過接入圖普科技的圖像識別云平臺,由平臺提供智能機(jī)器審核服務(wù),后期數(shù)據(jù)反饋,超過98%的色情視頻被機(jī)器過濾,復(fù)審量低于總量2%,節(jié)省了超過98%的人力成本。
李明強(qiáng)表示,讓原本無意識的機(jī)器能夠識別和理解圖像,是人工智能的目標(biāo)之一。但深度學(xué)習(xí)在研發(fā)上還面臨著三大問題:
1.理論問題
深度模型都是非凸函數(shù),在研究需要多少計(jì)算資源或計(jì)算樣本才能通過訓(xùn)練得到更好的模型,以及理想的計(jì)算優(yōu)化方法上,這方面的研究極其困難。
2.建模問題
也就是針對具體應(yīng)用問題,如何設(shè)計(jì)一個(gè)最適合的深度模型來解決問題?
2.工程問題
對于互聯(lián)網(wǎng)企業(yè)而言,如何在工程上利用大規(guī)模的并行計(jì)算平臺來實(shí)現(xiàn)海量數(shù)據(jù)訓(xùn)練,是各家企業(yè)從事深度學(xué)習(xí)技術(shù)研發(fā)首要解決的問題。
圖像識別技術(shù)核心就在于深度學(xué)習(xí)算法,但這需要大量的經(jīng)驗(yàn)數(shù)據(jù)去提高學(xué)習(xí)能力。
在這方面,蘋果、百度、谷歌和微軟等國內(nèi)外的大公司有著先天的優(yōu)勢,另外,大公司在人才以及物資方面比較充足。往往他們也不惜投入重金,通過收購或建設(shè)以圖像識別為主要課題的人工智能技術(shù)團(tuán)隊(duì)。
2014年4月圖普科技成立后,成為國內(nèi)最先做圖像識別云平臺的幾家企業(yè)之一。較早的進(jìn)入使得企業(yè)在這一領(lǐng)域擁有了較強(qiáng)的競爭優(yōu)勢。
1.工程技術(shù)。
圖普科技不僅擁有自主研發(fā)產(chǎn)品的技術(shù)開發(fā)團(tuán)隊(duì),通過與浙江大學(xué)合作,搭建并開放了國內(nèi)首個(gè)圖像識別云平臺,基于大規(guī)模GPU集群搭建的人工智能超算平臺,支持億萬級別的圖像處理。
2.克服大數(shù)據(jù)壁壘。
圖普科技研發(fā)了一套關(guān)于內(nèi)容審核方面的圖像和視頻判斷的一個(gè)人工智能的模型,利用深度學(xué)習(xí)算法設(shè)計(jì)的智能程序能通過快速迭代擁有強(qiáng)大的學(xué)習(xí)能力。
通過與迅雷、酷狗、花椒、唱吧、今日頭條、Bilibili、秒拍等知名公司合作,從而積累了大量圖片和視頻數(shù)據(jù),克服了智能程序設(shè)計(jì)中關(guān)鍵的的大數(shù)據(jù)壁壘。
3.建立服務(wù)優(yōu)勢
圖普科技是國內(nèi)最早利用人工智能算法做審核服務(wù)的。也是在在工程經(jīng)驗(yàn)、服務(wù)專業(yè)度方面具有先發(fā)優(yōu)勢。能夠根據(jù)不同的客戶、不同的細(xì)分領(lǐng)域,做單獨(dú)的模型調(diào)整以及算法細(xì)節(jié)的優(yōu)化,專人服務(wù)對專門的客戶做專業(yè)的運(yùn)營。
“圖譜制定的很多定價(jià)的方法、歸類的方法、接口返回的定義都為后來的同行做出了一定標(biāo)準(zhǔn)和規(guī)范。”李明強(qiáng)介紹,在滿足企業(yè)的基本需求后,圖普科技逐步提供一系列增值服務(wù),如基于圖像和視頻的廣告投放、智能導(dǎo)購,直播平臺的主播推薦等。除此之外,還有其他的可定制的應(yīng)用場景,比如電商平臺的“以圖搜圖”、電視臺的臺標(biāo)識別、旅游網(wǎng)站的場景識別、金融行業(yè)的智能投資分析等。
李明強(qiáng)表示,日益普及的人工智能技術(shù)將會越來越影響到移動(dòng)產(chǎn)品的未來創(chuàng)新,在產(chǎn)品競爭力上,人工智能可以從兩個(gè)方面切入。
1.現(xiàn)有App可以考慮AI+
首先在體驗(yàn)上。
用語音識別或圖像、視頻搜索在海量數(shù)據(jù)中提升搜索效率,通過大數(shù)據(jù)和標(biāo)準(zhǔn)匹配來增加個(gè)性化推薦、相關(guān)推薦的智能化功能。
其次是運(yùn)營上。
智能化審核文字、圖片、視頻等UGC內(nèi)容,以此保障信息安全;描繪、分類用戶畫像及分析用戶行為,可以為你的用戶體驗(yàn)提供感性建議;還可以通過AI提高趣味性,比如顏值識別接口,可以為顏值打分——最近圖普科技與悅跑圈合作搞了一個(gè)“鬼臉活動(dòng)”,這個(gè)活動(dòng)不是比美,而是比丑,看誰做出的鬼臉扮丑最厲害。
其實(shí)不僅如此,還可以利用圖像識別接口做“最萌妹子”、“最文藝范”、“最性感”等有趣的評選活動(dòng),可以通過人工智能解決很多產(chǎn)品同質(zhì)化的問題。
2.創(chuàng)造AI為核心的產(chǎn)品
比如說Google Translate,能夠?qū)崟r(shí)視覺翻譯AI+AR,改變你看到的世界;或者是最近很火的圖像編輯軟件Prisma,利用AI融入藝術(shù)相機(jī)將照片變成畢加索、梵高等名畫。
李明強(qiáng)最后建議,創(chuàng)業(yè)者要去思考和學(xué)習(xí)人工智能方面的知識,結(jié)合正在從事的行業(yè)或者從理解較深的行業(yè)著手,在細(xì)分領(lǐng)域去積累數(shù)據(jù),新進(jìn)的創(chuàng)業(yè)者需要去找行業(yè)的新切入點(diǎn)進(jìn)入,這樣更有機(jī)會。