原標題:依圖朱瓏:AI 新時代,我們該關注什么?
文明變遷靠科技推動,科技推動即基礎設施革命。
作者 | 張棟
“AI 新時代,我們該關注什么?”
剛剛,在廈門人工智能峰會上,依圖科技聯合創始人朱瓏出席演講并丟出了這個終極疑問。
在他看來,文明的變遷靠的是科技的推動,科技推動就是基礎設施的革命;基礎設施提升的關鍵在于:提升一個區域或者一個城市的智能密度。
智能密度可以分為兩個維度考量:
宏觀上,要從單體的機器智能到群體的智能。比如說一個攝像頭能夠識別人臉的數量從100個到1000個、1萬個。而且這1萬個攝像頭能夠相互交流,互相對話,并且它們識別出來的信息是可決策的。
微觀上,單個計算機能夠支撐的智能算力要足夠大,這里的智能算力不是簡單的機器算力。
高級的算法可以用更少的機器算力實現更高的智能。總之:算力和算法兩者決定了智能的密度,而提升智能密度是普及AI的關鍵。
朱瓏總結,從感知智能到認知智能,未來還會出現一個新物種:機器智能,它會慢慢地具備人類的智能。
機器智能的發展可以分成幾個階段:
1、記錄功能,沒有任何的識別能力;
2、可識別,比如說攝像頭能夠識別人臉;
3、可關聯,不同攝像頭之間識別出來的信息之間的關系是什么?怎么判斷?
4、可預測、可預判;
5、可規劃。
他篤信,隨著數據、算法、存儲、算力和傳輸等基礎設施的不斷提升,AI在未來幾年會有更為革命性的發展,讓智能文明社會加速到來。
以下是朱瓏的全部演講內容,雷鋒網AI掘金志做了不改變原意的整理與編輯:
人工智能為什么重要?
中國和美國都把AI作為國家戰略,今天廈門人工智能峰會以及多媒體信息識別技術競賽的舉辦也印證了這一點。
人工智能是世界創新的源動力,依圖很榮幸能夠參加這次競賽,為國家創新貢獻我們的力量。
此前我們參加了三年美國國家標準技術局(NIST)舉辦的人臉識別供應商測試(FVRT),也獲得了三次冠軍,深知舉辦這類賽事的不易,在此向本次比賽的組織者和執行人員致敬。希望廈門能夠成為人工智能發展標準和方向的引領者,成為人工智能思想交流的高地。
我簡單介紹一下我的背景,從中也能看出美國研究人工智能的不同學派。
我在美國待了十年,我的三位導師,一個是理論物理出身的 Alan Yuille,他也是霍金的學生。
第二個是我在麻省理工大學人工智能實驗室讀博士后的老板Bill Freeman,他也是在今年4月人類首次拍攝到黑洞照片研究小組的領導者。
第三位大家可能比較熟悉了,紐約大學教授 Yann LeCun,他是推動這一輪人工智能浪潮興起的技術——深度神經網絡的其中一位奠基人,他也因此獲得了2018 年的圖靈獎。
由此可見,在美國從物理到深度神經網絡再到腦科學,不同領域的頂級專家都在研究人工智能,他們推動了過去幾十年人工智能的發展,讓AI有了今天這個基礎。
那么,人工智能發展現在處于一個怎樣的狀態?
剛才高文院士有講到人類智能的演化用了大約630萬年。我總結了人類文明的變遷:從人類直立行走到形成最原始的社會形態,再到1 萬年前的農業革命,工業革命我們花了200年,而人工智能從一九五幾年開始到現在,也就60多年的時間,人類的文明史或者是地球的文明史大致就是這么一個區分。
從眼睛看到這個世界的感知智能到語言也即認知智能的誕生,到今天很可能出現一個新的物種,那就是機器,它慢慢地具備了人類的智能。
當機器的智能曲線與人類的智能曲線交叉甚至超過的時候,文明的形態會是什么?這非常值得我們遐想和憧憬或者是思考。
我今天給出最重要的一個觀點就是:文明的變遷靠的是科技的推動,科技推動就是基礎設施的革命。
這里我列舉了一些不同文明時代的基礎設施,從剛才談到的發明火到使用文字,農業文明時期有了輪子、道路;
工業文明出現了蒸汽機、內燃機,有了鐵路;
信息文明,也就是我們過去30年的互聯網時代,出現了計算機、PC、互聯網、手機,人類克服了時空的障礙。
這幾個最重要的基礎設施的變革,見證了文明的變遷。
我們現在處于什么時代?我們這個時代的基礎設施又是什么呢?
過去30年,CPU運算能力提升了100萬倍,存儲能力也提升了100萬倍,通訊能力也即數據的傳輸速度提升了100萬倍。我們現在是站在過去30年的基礎上來看接下來發展的基礎。
智能時代只談開始的時間可能定義得不清楚,這里只談2019年回溯回去的過去五年,我們發生了什么、五年前是什么。
AlphaGo在2015年的時候超過人類的那一天,也是機器以計算機視覺為代表超過人類的那一天,大家可能記憶猶新。
人工智能現在已經非常火了,但就是這火的過去五年,機器又發生了什么呢?機器的算法水平又提升了100萬倍,什么意思呢?
就是人臉識別為代表的錯誤率又下降了100萬,它可以從1萬人當中識別、1000萬人當中識別、 1億人當中識別出你,10億人當中識別你,甚至20億人當中識別你,這是已經看似超過人類的那個時刻之后,它又提升了100萬倍,算力提升了10萬倍。
從過去我們用1萬量級規模的數據做訓練,到百萬規模的數據做訓練,到現在用10億的數據集做訓練,又提升了1萬倍,速度是非常快的。
基礎設施現在處于一個什么水平?當前發展了這么多, AI處于什么樣的一個水平呢?
我這里用比較通俗的一個語言講一下:人不需要思考、本能地一眼瞄過去,能看見的、能說清楚的、能看懂的,這是機器可以看到的。
比如說這里有人,有座位,這個是機器可以看清楚的。但這么遠要識別清楚,可能有點難,比如這里有多少個人?可能要數一數,誰跟誰近,這個會坐在旁邊認識,可能要想一想,機器還不一定能做好。
機器可以聽懂什么?就一下能聽懂的語音識別,理解一句話、一個段落可能就變得困難,對一個文章的理解還比較困難。非常低階的智能機器已經可以或者接近可以了。我們覺得智能要往前躍遷,最重要的就是提升基礎設施,我后面會講基礎設施是什么。
我把機器智能分成幾個階段:
第一個就是記錄功能,沒有任何的識別能力;第二個是可識別,比如說攝像頭能識別人臉;到第三個可關聯,不同的攝像頭之間識別出來信息之間的關系是什么?怎么判斷?這是有關聯性。第四個是可預測、可預判。第五個是可規劃。大概分這個級別。
我們覺得智能的提升是在基礎設施的提升上。
我舉城市管理的一個例子,因為城市管理當中包括安防攝像頭的覆蓋,把剛才講的五級智能做一個分類,從最簡單的代替人記錄,可追溯、到可檢索、可關聯,代替人的推理與決策,代替人統籌,分成幾個級別。
右邊這一列是說達到這些級別的提升,我們要怎么做。是需要最簡單的一定程度下的稀疏攝像頭的識別率和到最高到20萬個攝像頭基本的一個覆蓋。
這里可以看到我們的感知需要增加密度,我們的算力需要增加識別的能力,就慢慢地就在整個城市規模上,它有智能等級的躍遷。
這是一個空間布局的感覺,當密度達到一定程度的時候,就可以在空間上或者一個關鍵場所的圍欄上,形成自己的新的高階的智能,比如看軌跡怎么發生、事件怎么建模。
我們提了一個概念:基礎設施提升的關鍵在于,提升一個區域或者一個城市的智能密度。
分兩個維度來解釋,一個是宏觀上,單體智能要變成群體智能,一個攝像頭的智能要變成1萬個攝像頭的智能,他們之間識別出來的內容是能夠匯聚在一起,能夠形成一個新的、大的智能體。
微觀上,要普及成從一個到1萬個,甚至10萬個,微觀上的算力要急劇提升,才能有經濟性,或者說性價比較高的基礎能夠普及開來。
我們5月份發了一款AI芯片,這是云端的一個視覺芯片,一塊芯片能夠支撐50個攝像頭的算力,那一臺1U的服務器可以支撐約兩百路攝像頭的算力,比同類的市面上最先進的英偉達的方案提高5到10倍的性價比。
一個是它的能耗降低了非常多,空間降低了非常多,降低多少呢?
一個機柜能夠支撐一萬路攝像頭的全解析的功能,且機柜中有空間的限制、電的限制、能源的限制、算力的限制,這是在一個城市在做城市的智能等級的提升上面,有了非常重要的基礎設施的準備。由此,我們就可以打開城市管理的豐富的場景。
這里列了大概18個場景,包括機場、火車站等等,可以解鎖更多的應用。
我們認為,今天從算法的成就到算法的提升,到我們整個城市或老百姓都能感知到,點亮AI就是要在基礎設施上做重大的提升,包括剛才高院士提到的人才資本和政策以外。
我們認為基礎設施就是數據、算法、存儲、算力和傳輸,它們一定會在未來的幾年會進一步以三倍、十倍的速度再加大速度提升,這才是革命性的,這個會讓智能文明更快速的到來。
這是我們的一個小小的愿景,也是希望能夠在廈門以10萬路的視覺中樞為基礎,助力廈門成為全球智能密度最高、智能等級最高的城市。謝謝大家。
返回搜狐,查看更多
責任編輯: