
9月11日上午,在2025 Inclusion·外灘大會開幕主論壇上,中國工程院院士、阿里云創始人、之江實驗室主任王堅發表《人工智能:從代碼開放到資源開放》主題演講。
“2025年注定是不平凡的一年。開源這一沿用軟件時代的概念,成為了AI競爭的關鍵變量,”王堅表示,在今年1月之前,當時世界上最好的基礎模型都集中在美國幾家頭部公司,隨后通義千問Qwen、DeepSeek開源,OpenAI CEO奧爾特曼也承認,在開源方面OpenAI站在了歷史的錯誤一邊。
當數據、模型、算力乘上了更大的變量,規模被千倍萬倍增加后,我們看到的人工智能發生了不只是原理上的進步,在事實上發生了一次天翻地覆的變化。
而當規模到這個程度的時候,資源就變成了非常重要的事情。
“太空是人類最大的資源,今天絕對不是只把人工智能用在手機上、電腦上,其實人工智能不應該缺失太空”。王堅表示,在通訊衛星、導航衛星、遙感衛星以后,因為人工智能的出現就會出現第四種衛星,他稱之為“計算衛星”。
他最后表示:“只有把AI和算力送入太空,人類才有可能真正地走出地球。”
以下為演講實錄:
各位朋友,非常高興有這么一次機會跟大家分享一下這個話題,在今天人工智能的背景下有一個繞不開的話題——“開放”。
今天我想把幾個可能大家熟悉,但是又比較困惑的事情,從我的角度說一下。“開源”這個詞其實大家有不同的理解,我們今天正在經歷一個從代碼的開放、開源,到資源的開放、開源,一個非常不同的革命性變化。
其實最近一年發生了很多事情,如果從人工智能角度(來看),2025年注定是非常不平凡的一年。
今年年初1月13日,美國公布了對人工智能的出口管制,可能大家比較熟悉的就是關于芯片、集成電路、半導體的出口管制,但事實上在同一個出口管制上是第一次那么明確地說出來了,說要對人工智能模型的權重進行管制。這個管制令有一個非常有意思的事情,也可以講是一個漏洞,他只是明確地提出了對“閉源”權重的出口管制,而專門強調了“開源”的權重不在管制之列。
我想這邊后面有一個非常重要的假設,在1月13日,其實也就是大半年以前。當時,世界上最好的基礎模型都是在美國頭部的那幾家公司。當然也有一個很有意思的事情,在今年1月18日大家都熟悉的Jeff Hinton也在幾個星期以前到過上海,大家都知道他是一個極其反對讓人工智能模型開源出來的人,當然他有他自己非常重要的理由。
可是就是在1月31日,隨著千問Qwen的開源,DeepSeek的開源,在1月30日Sam Altman說過一句讓所有人都很震撼的話:在開源這個時刻,OpenAI站在了歷史的錯誤一邊。我想這句話背后的含義我就不多說了,他不是一個策略性的錯誤,這是一個歷史的選擇。
我覺得2025年很神奇的一件事情就是一個說不清還道不明的事情,甚至還沿用了在軟件時代的概念,使得變成了今天AI競爭的一個很關鍵的變量,今天沒有人可以繞開這個變量來說下面我要怎么做AI。對于一個產業和一個技術(來說),這個變量不是新的。
其實在1998年,互聯網要起來的時候,大家知道互聯網要起來的一個最重要標志就是瀏覽器。大家知道Netscape是當時最好、最開放,也是改變了這個格局的瀏覽器,在互聯網時代,Netscape的開源是那個時代的“分水嶺”。關于這個開放的話題不只是今天重要的關鍵,其實在互聯網時代就是那個關鍵的變量。
可能很少人知道,其實是在1998年,“開源”(Open Source)這個詞,大家知道Open Source指的就是Open Source Code,指開放源代碼。“開源”這個詞在1998年4月份,才被一批極客固化下來,因為當時有很多不同的叫法,比如自由軟件、免費軟件,但是Open Source這個詞是在1998年,其實離我們沒有多遠,但是它開創了后來互聯網的那個時代。
談到圖靈獎,其實很有意思,2019年Jeff Hinton和那幾位開創者得了圖靈獎的時候,其實很多事情也是剛剛開始,他們2018年得了圖靈獎,后來Hinton做過一個演講。在這個演講上,他說了兩個很重要的觀點和今天的開源是有關系的,是2018、2019年給的talk。里面講到了人工智能兩個最重要的方法,即所謂邏輯驅動的,或者被邏輯這樣的方法來啟發的,以及因為大腦或者神經元這樣的生物特性來啟發的這兩種不同邏輯。
因為有第二個方法,所謂的用神經元/生物學方法來驅動的方法論演進,使得我們有了“權重”概念。
大家都知道,8年以后,Hinton上個月在“上海人工智能大會”上重復了他8年前講的這兩句話。但這是有原因的,事實上以生物學作為思想的驅動,不是從人工智能開始的。圖靈在40年代末第一次說了最基本的(觀點),今天所有神經元基礎的東西都有一個很好聽的名字叫“Connectivity”。我畫了紅線的地方是非常有意思的事情,他覺得受神經元的啟發,跟真正的神經元沒有任何關系,所以打的引號。但里面很重要的事情是這樣神經元的數量要足夠多,多到一定程度的時候就會產生今天的“智能”,這是圖靈在1948年說的。所以Jeff Hinton講的第二個路徑就是這個路徑。
很有意思的一件是很長時間有人在探索這件事情,這篇文章發表在1986年的《自然》雜志上,這篇文章非常明確地講到了“權重”這件事情在模型中的重要性。這篇文章的第三作者就是得了“圖靈獎”和“諾貝爾獎”的Jeff Hinton,但前面兩個作者是當時世界上最著名的心理學家。
事實上跟Neural有關系的探討,在80年代中期是以心理學家為核心的小組在討論的,那時候以計算機科學家為核心討論的人工智能方向就是以邏輯作為驅動的方法。
如果你在那時候真的要做這件事情,有一本教科書,是1986年以后我自己接觸這個領域時的教科書,到今天大家應該都不太熟悉,叫作《Parallel Distributed Processing》。上次在上海碰見Jeff Hinton我跟他說起這套書的時候他還是蠻激動的,他說那時候設想的東西今天都變成現實了。這篇文章還是 Hinton作為第三作者跟幾位心理學家一起完成的。
講到這件事情也要感謝互聯網,其實這兩本書的背后又專門出了一本書,這本書是本實驗手冊,是第一次真正把所有關于這個理論的代碼都開放出來了。到今天為止,你還可以到我這頁PPT上的鏈接去下載代碼,盡管代碼是運行在docs上的,是運行在最原始操作系統上的,而代碼開放的時候還沒有開源概念,這是1986年的(鏈接),開源概念是1998年才真正被固化下來。
事實上,“開放資源”的概念不是因為有開源這個說法而帶來的,事實上在任何科學探索的過程中有很多先驅已經做了這件事情。當然,我自己很高興的是最早提出以生物學神經元為基礎的方法論先行者們為我們做了非常好的探索。
這才有了后面2012年第一次Hinton跟他的兩位學生把數據、模型、算力GPU搞在一起,這帶來了大家都熟悉的人臉識別的時代。但在那時候“資源”概念還是沒有那么深入人心,因為數據量不足夠大,模型不足夠復雜,算力也沒有想象那么大,這篇文章發表的時候只用了2塊普通打游戲的GPU卡,遠不是今天想象的規模。
但這一切在2017年發生了很大的變化,在那時候這幾位作者提出了“Transformer”提出了“Tokenization”,就是今天講的Token,大家都知道Tokenization是非常關鍵的技術,使得讓數據真正資源化,這是里程碑的事情。
同樣會發現因為有這兩個東西的出現,2012年時的數據、模型、算力乘上了一個更大的變量,叫“規模”,也就是說所有東西的規模都是被千倍萬倍增加而使得今天我們看到的人工智能發生了不只是原理上的進步,在事實上發生了一次天翻地覆的變化。
當規模到這個程度的時候,資源就變成了非常重要的事情。大家試想一下,到今天模型權重的開放本質上是數據資源和計算資源的開放,有了模型開放以后,你再也不需要自己花掉那么多計算資源重新做有人替你做掉的事情。
我想說,開放以后并不是大規模計算不重要了,而是作為個體不需要再重新發揮這么多資源,因為有人幫你付掉了這筆錢。倒過來講,要做一個更好的模型,可能需要有其他人以更多的資源投入來完成這件事情。
到了今天這個時候,只是開放源代碼,其實不解決過去在軟件時代解決的問題,而開放資源(特別是數據和計算資源)是讓我們推動行業往前走的不能缺失的環節,這就是今天人工智能時代說“開源”非常重要的特點,我更愿意把開源叫“Open Resource”,大家知道Open Source和Open Resource翻譯成中文,都可以有同樣的翻譯,叫“開源”。當然,開源不只是今天的模型。
太空一直是我們最大的資源,在50年以前是這樣,今天絕對不是只把人工智能用在手機上、電腦上,其實人工智能不應該缺席太空。但這有個障礙,就是算力,當你用三個組合的時候。
這時候讓我們有了機會,就像當年我們重新定義手機作為你的電腦,其實今天有了通訊衛星、導航衛星、遙感衛星以后,因為人工智能的出現就會有第四種衛星,我把它叫“計算衛星”。同樣因為衛星的存在,使得我們有機會把AI送到那里去。
我自己還是蠻幸運的,因為在之江實驗室做這件事情,今年5月14日,第一次把12顆衛星同時上了天,而且在這12顆衛星組成的星座上,第一次把地面真正意義上的8B AI模型放到太空去了。不是用了簡單的深度學習算法做了處理的小程序放到衛星上,是一個跟地面上一模一樣的完完整整的AI模型送到了太空上。其實當第一次進去的時候還是非常激動的,所以讓我們覺得第一次可以感受到AI是不能缺失太空的。
這12顆衛星到了太空以后會保證只要衛星到達的地方,就可以在太空的任何地方完成對所有數據的處理。大家知道在這之前,所有的衛星在天上是沒有任何關系的,所有在天上的衛星只跟地面發生關系,天上的這顆衛星和那顆衛星之間沒有關系,這也是第一次完整地做完了在太空衛星的互通互聯,給人工智能在太空帶來了一次巨大的機會。
很有意思的這件事情為什么給它叫了個名字“三體計算星座”?這邊有很多朋友知道“三體”這個詞是從小說上讀來的。事實上,“三體”這個詞是一個徹頭徹尾的科學概念,最早是牛頓提出來的。他講了一個非常簡單的道理,在太空中如果只有兩個物體,假定月亮和地球是可以有解析解的。也就是說,有一個準確的數學解決方式來說明這兩個物體之間的關系。但只要還有第三個物體存在,比如說太陽,這三個物體之間的關系就沒有解析解了,就沒有一個確定的解了。所以你要描述它們之間的關系,一定要假定另外一個物體是固定不動的,后來被牛頓稱為“三體問題”。這背后告訴一個非常簡單的道理,一個人、兩個人做事情是很容易做的,只要三個人搞在一起就不好做了。中國有一句古話叫“三個和尚沒有水喝”。但“三體計算星座”就是希望我們有N多主體還是可以完成一件事情的,這是開放資源的情況下必須要做到的事情。“三體計算星座”就是希望有無數的主體來共同完成這個星座,來共同分享這個太空。
香港《南華早報》在聽過我的一個演講之后,后來寫了一篇文章,大家可以去看一下。本質上就是“只有這樣,我們才能夠真正分享太空,把人工智能送入太空。”這里面我們會做一個非常有意思的計劃,真的把每一顆衛星開放給全世界的任何一個人。這里面可以解決很多問題,可持續發展的問題就不多說了,當然也可以為我們想象要往深空去探索,這是一些科學家在設想的幾年以后,不是十年以后,就在幾年以后,把衛星送到太陽軌道。也就是說,不只是地球的衛星,而是太陽的衛星,這顆衛星會放在大家看到的L5.(Lagrange拉格朗日第五點),這個“·(點)”離地球1.5億公里,離太陽1.5億公里。在那個時候,數據幾乎沒有辦法傳回到地面再做處理,只有把AI和算力送入太空,人類才有可能真正地走出地球。
下面這個時代還是非常激動人心的。我經常講,人類去火星的路上,是不能沒有計算的陪伴和AI,這就是下面十年甚至二十年最激動人心的地方。
謝謝大家!