china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网

公眾號
關(guān)注微信公眾號
移動(dòng)端
創(chuàng)頭條企服版APP

谷歌DeepMind報(bào)告稱AI for Science黃金時(shí)代已來(36 頁報(bào)告全文)

22324
2024-12-12 18:40 搶發(fā)第一評

2024年11月,Google DeepMind發(fā)布報(bào)告《A new golden age of discovery:Seizing the AI for Science Opportunity》。

這份報(bào)告揭示出:全球?qū)嶒?yàn)室 AI 使用正在指數(shù)級增長,AI for Science真正的黃金時(shí)代即將來臨。

其中還提到了五個(gè)能夠利用 AI 來促進(jìn)科研的機(jī)遇,包括知識(shí)、數(shù)據(jù)、實(shí)驗(yàn)、模型、解決方案。

DeepMind成立于2010年,以突破性成果聞名,包括在圍棋領(lǐng)域擊敗頂級棋手的AlphaGo、預(yù)測蛋白質(zhì)結(jié)構(gòu)的AlphaFold,以及在氣候預(yù)測和基因研究等領(lǐng)域的創(chuàng)新應(yīng)用。

它以多學(xué)科合作為核心,注重技術(shù)的安全性和社會(huì)責(zé)任,目標(biāo)是讓AI成為解決全球性挑戰(zhàn)的關(guān)鍵力量,為人類創(chuàng)造更美好的未來。

以下為《報(bào)告》原文:

引言

在全球各地的實(shí)驗(yàn)室中,一場靜悄悄的革命正在醞釀之中,科學(xué)家使用人工智能(AI)的情況正呈指數(shù)級增長。現(xiàn)在,三分之一的博士后研究人員使用大型語言模型來幫助進(jìn)行文獻(xiàn)回顧、編碼和編輯工作。在10月份,我們的AlphaFold 2系統(tǒng)的創(chuàng)造者Demis Hassabis和John Jumper因使用AI預(yù)測蛋白質(zhì)結(jié)構(gòu)而與科學(xué)家David Baker一同成為了諾貝爾化學(xué)獎(jiǎng)得主,后者的工作是設(shè)計(jì)新蛋白質(zhì)。隨著AI幫助設(shè)計(jì)的藥物和材料正在開發(fā)中,社會(huì)很快將更直接地感受到這些好處。

在這篇文章中,我們將探討AI如何轉(zhuǎn)變從基因組學(xué)到計(jì)算機(jī)科學(xué)再到天氣預(yù)報(bào)的科學(xué)學(xué)科。一些科學(xué)家正在訓(xùn)練他們自己的AI模型,而另一些則在微調(diào)現(xiàn)有的AI模型,或者使用這些模型的預(yù)測來加速他們的研究。科學(xué)家們將AI作為一種科學(xué)工具來幫助解決重要問題,例如設(shè)計(jì)更緊密地結(jié)合疾病靶點(diǎn)的蛋白質(zhì),但同時(shí)他們也在逐漸改變科學(xué)本身的實(shí)踐方式。

科學(xué)家擁抱AI的背后有一個(gè)日益增長的迫切性。近幾十年來,科學(xué)家們繼續(xù)取得重大進(jìn)展,從Covid-19疫苗到可再生能源。但實(shí)現(xiàn)這些突破所需的研究人員數(shù)量越來越多,并且將這些突破轉(zhuǎn)化為下游應(yīng)用。因此,盡管過去半個(gè)世紀(jì)以來科學(xué)勞動(dòng)力顯著增長,僅在美國就增長了七倍以上,我們預(yù)期隨之而來的社會(huì)進(jìn)步卻放緩了。例如,世界許多地區(qū)都經(jīng)歷了生產(chǎn)率增長的持續(xù)放緩,這削弱了公共服務(wù)的質(zhì)量。朝著2030年可持續(xù)發(fā)展目標(biāo)的進(jìn)展,這些目標(biāo)涵蓋了健康、環(huán)境等方面最大的挑戰(zhàn),正在停滯。

特別是,今天的科學(xué)家在尋求突破時(shí)越來越多地遇到與規(guī)模和復(fù)雜性相關(guān)的挑戰(zhàn),從他們需要掌握的日益增長的文獻(xiàn)基礎(chǔ),到他們想要運(yùn)行的日益復(fù)雜的實(shí)驗(yàn)。現(xiàn)代深度學(xué)習(xí)方法特別適合這些規(guī)模和復(fù)雜性的挑戰(zhàn),并且可以壓縮未來科學(xué)進(jìn)步所需的時(shí)間。例如,在結(jié)構(gòu)生物學(xué)中,單次X射線晶體學(xué)實(shí)驗(yàn)確定蛋白質(zhì)結(jié)構(gòu)可能需要數(shù)年的工作,并且根據(jù)蛋白質(zhì)的不同,成本大約為10萬美元。AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫現(xiàn)在免費(fèi)提供即時(shí)訪問2億個(gè)預(yù)測的蛋白質(zhì)結(jié)構(gòu)。

AI對科學(xué)的潛在好處并不是有保證的。已經(jīng)有一部分科學(xué)家使用基于LLM(大型語言模型)的工具來協(xié)助日常任務(wù),例如編碼和編輯,但使用以AI為中心的研究方法的科學(xué)家比例要低得多,盡管這個(gè)比例正在迅速上升。在急于使用AI的過程中,一些早期的科學(xué)用例的影響值得懷疑。政策制定者可以幫助加速AI的使用,并將其引導(dǎo)向更高影響的領(lǐng)域。美國能源部、歐盟委員會(huì)、英國皇家學(xué)會(huì)和美國國家科學(xué)院等機(jī)構(gòu)最近都認(rèn)識(shí)到了AI for Science的機(jī)會(huì)。但迄今為止,還沒有哪個(gè)國家制定了全面的戰(zhàn)略來實(shí)現(xiàn)它。

我們希望我們的文章能夠?yàn)檫@樣的戰(zhàn)略提供信息。它的目標(biāo)是那些制定和影響科學(xué)政策以及資金決策的人。我們首先確定了5個(gè)越來越需要使用AI的機(jī)遇領(lǐng)域,并檢查了在這些領(lǐng)域取得突破所需的主要要素。然后,我們探討了使用AI在科學(xué)中最常見的風(fēng)險(xiǎn),例如對科學(xué)創(chuàng)造力和可靠性的風(fēng)險(xiǎn),并認(rèn)為AI最終可以在每個(gè)領(lǐng)域都是凈有益的。我們以四個(gè)公共政策理念結(jié)束,幫助迎接一個(gè)新的AI賦能科學(xué)的黃金時(shí)代。

在整個(gè)文章中,我們借鑒了來自我們自己的AI for Science項(xiàng)目以及外部專家的二十多位專家的見解。文章自然反映了我們作為一個(gè)私營部門實(shí)驗(yàn)室的觀點(diǎn),但我們相信我們提出的論點(diǎn)對整個(gè)科學(xué)界都是相關(guān)的。我們希望讀者通過分享他們對最重要的AI for Science機(jī)會(huì)、要素、風(fēng)險(xiǎn)和政策理念的看法來做出回應(yīng)。

Part A: 機(jī)遇

科學(xué)家的目標(biāo)是理解、預(yù)測和影響自然和社會(huì)世界的運(yùn)作,以激發(fā)和滿足好奇心,并解決社會(huì)面臨的重大問題。技術(shù)和方法,如顯微鏡、X射線衍射和統(tǒng)計(jì)學(xué),既是科學(xué)的產(chǎn)物,也是推動(dòng)科學(xué)進(jìn)步的工具。在過去的一個(gè)世紀(jì)中,科學(xué)家越來越依賴這些工具來進(jìn)行實(shí)驗(yàn)和推進(jìn)理論。計(jì)算工具和大規(guī)模數(shù)據(jù)分析變得尤為重要,使得從發(fā)現(xiàn)希格斯玻色子到繪制人類基因組圖譜成為可能。從某種角度看,科學(xué)家越來越多地使用人工智能是這一長期趨勢的邏輯延伸。但它也可能標(biāo)志著更為深刻的變化——科學(xué)能力極限的不連續(xù)躍升。

與其列出所有可能使用AI的領(lǐng)域,我們強(qiáng)調(diào)了五個(gè)我們認(rèn)為有使用AI的迫切需要的機(jī)會(huì)。這些機(jī)會(huì)跨越學(xué)科,并解決科學(xué)家在科學(xué)過程中的不同點(diǎn)越來越多地面臨的與規(guī)模和復(fù)雜性相關(guān)的具體瓶頸,從生成有力的新假設(shè)到與世界分享他們的工作。

640 (4).png


1. 知識(shí)

改變科學(xué)家笑話和傳播知識(shí)的方式

為了做出新發(fā)現(xiàn),科學(xué)家需要掌握不斷增長且日益專業(yè)化的現(xiàn)有知識(shí)體系。這種“知識(shí)負(fù)擔(dān)”有助于解釋為什么做出變革性發(fā)現(xiàn)的科學(xué)家越來越年長、跨學(xué)科,并且位于精英大學(xué),以及為什么個(gè)人或小團(tuán)隊(duì)撰寫的論文比例正在下降,盡管小團(tuán)隊(duì)通常更有可能推進(jìn)顛覆性的科學(xué)思想。在分享他們的研究成果方面,已經(jīng)有了一些受歡迎的創(chuàng)新,如預(yù)印本服務(wù)器和代碼庫,但大多數(shù)科學(xué)家仍然以密集、充滿行話、僅限英文的論文形式分享他們的發(fā)現(xiàn)。這可能會(huì)阻礙而不是激發(fā)對科學(xué)家工作的興趣,包括來自政策制定者、企業(yè)和公眾的興趣。

科學(xué)家已經(jīng)開始使用LLM(大型語言模型)和基于LLM的早期科學(xué)助手來幫助解決這些挑戰(zhàn),例如通過綜合文獻(xiàn)中最相關(guān)的見解。在一個(gè)早期的演示中,我們的科學(xué)團(tuán)隊(duì)使用我們的Gemini LLM在一天之內(nèi)從20萬篇論文中最相關(guān)的子集中找到、提取和填充特定數(shù)據(jù)。隨著對更多科學(xué)數(shù)據(jù)的微調(diào)、長上下文窗口和引用使用的進(jìn)展,這些能力將穩(wěn)步提高。正如我們下面將要展開的,這些機(jī)會(huì)并非沒有風(fēng)險(xiǎn)。但它們提供了一個(gè)窗口,可以從根本上重新思考某些科學(xué)任務(wù),例如在一個(gè)科學(xué)家可以使用LLM幫助批評它、為不同受眾定制其含義或?qū)⑵滢D(zhuǎn)換為“交互式論文”或音頻指南的世界中,“閱讀”或“編寫”科學(xué)論文意味著什么。

2. 數(shù)據(jù)

生成、提取和注釋大模型科學(xué)數(shù)據(jù)集

盡管流行的說法是數(shù)據(jù)泛濫的時(shí)代,但大多數(shù)自然和社會(huì)世界的科學(xué)數(shù)據(jù)都存在長期的缺乏,從土壤、深海和大氣到非正規(guī)經(jīng)濟(jì)。AI可以在不同的方式上提供幫助。它可以使現(xiàn)有的數(shù)據(jù)收集更準(zhǔn)確,例如通過減少測序DNA、檢測樣本中的細(xì)胞類型或捕獲動(dòng)物聲音時(shí)可能發(fā)生的噪聲和錯(cuò)誤。科學(xué)家還可以利用LLM在圖像、視頻和音頻上日益增長的能力,提取埋藏在科學(xué)出版物、檔案和不太明顯的資源(如指導(dǎo)視頻)中的非結(jié)構(gòu)化科學(xué)數(shù)據(jù),并將其轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)集。

AI還可以幫助用科學(xué)家需要的支持信息注釋科學(xué)數(shù)據(jù),以便使用它。例如,至少有三分之一的微生物蛋白質(zhì)沒有可靠地注釋其被認(rèn)為執(zhí)行的功能。在2022年,我們的研究人員使用AI預(yù)測蛋白質(zhì)的功能,導(dǎo)致UniProt、Pfam和InterPro數(shù)據(jù)庫中出現(xiàn)了新條目。

一旦驗(yàn)證,AI模型也可以作為新的合成科學(xué)數(shù)據(jù)的來源。例如,我們的AlphaProteo蛋白質(zhì)設(shè)計(jì)模型訓(xùn)練于超過1億個(gè)由AlphaFold 2生成的AI蛋白質(zhì)結(jié)構(gòu),以及來自蛋白質(zhì)數(shù)據(jù)銀行的實(shí)驗(yàn)結(jié)構(gòu)。這些AI機(jī)會(huì)可以補(bǔ)充并增加其他非常需要的努力來生成科學(xué)數(shù)據(jù),如數(shù)字化檔案,或資助新的數(shù)據(jù)捕獲技術(shù)和方法,如正在進(jìn)行的單細(xì)胞基因組學(xué)努力,以創(chuàng)建個(gè)體細(xì)胞的強(qiáng)大數(shù)據(jù)集,細(xì)節(jié)前所未有。

3. 實(shí)驗(yàn)

模擬、加速個(gè)通知復(fù)雜實(shí)驗(yàn)

許多科學(xué)實(shí)驗(yàn)昂貴、復(fù)雜且緩慢。有些實(shí)驗(yàn)根本沒有發(fā)生,因?yàn)檠芯咳藛T無法獲得他們所需的設(shè)施、參與者或輸入。聚變就是一個(gè)例子。它承諾了一種幾乎無限的、無排放的能源,并且可能使得能源密集型的創(chuàng)新規(guī)模化,如海水淡化。要實(shí)現(xiàn)聚變,科學(xué)家需要?jiǎng)?chuàng)造和控制等離子體——物質(zhì)的第四種基本狀態(tài)。然而,所需的設(shè)施極其復(fù)雜,難以建造。ITER的原型托卡馬克反應(yīng)堆于2013年開始建設(shè),但等離子體實(shí)驗(yàn)最早要到2030年代中期才開始,盡管其他人希望在更短的時(shí)間內(nèi)建造更小的反應(yīng)堆。

AI可以幫助模擬聚變實(shí)驗(yàn),并使隨后的實(shí)驗(yàn)時(shí)間使用更加高效。一種方法是在物理系統(tǒng)的模擬上運(yùn)行強(qiáng)化學(xué)習(xí)代理。在2019年至2021年之間,我們的研究人員與洛桑聯(lián)邦理工學(xué)院合作,展示了如何使用RL控制模擬的托卡馬克反應(yīng)堆中等離子體的形狀。這些方法可以擴(kuò)展到其他實(shí)驗(yàn)設(shè)施,如粒子加速器、望遠(yuǎn)鏡陣列或引力波探測器。

使用AI模擬實(shí)驗(yàn)在不同學(xué)科中看起來會(huì)非常不同,但一個(gè)共同點(diǎn)是模擬通常會(huì)通知和指導(dǎo)物理實(shí)驗(yàn),而不是替代它們。例如,普通人的DNA中有超過9000個(gè)錯(cuò)義變異,或單字母替換。這些遺傳變異大多數(shù)是良性的,但有些可能會(huì)破壞蛋白質(zhì)執(zhí)行的功能,導(dǎo)致罕見遺傳疾病如囊性纖維化以及常見疾病如癌癥。對這些變異影響的物理實(shí)驗(yàn)通常限于單一蛋白質(zhì)。我們的AlphaMissense模型將7100萬個(gè)潛在的人類錯(cuò)義變異中的89%分類為可能無害或有害,使科學(xué)家能夠?qū)⑺麄兊奈锢韺?shí)驗(yàn)集中在最可能導(dǎo)致疾病的變異上。

640 (5).png

4. 模型

建模復(fù)雜系統(tǒng)及其組件如何相互作用

在1960年的一篇論文中,諾貝爾獎(jiǎng)獲得者物理學(xué)家尤金·維格納對數(shù)學(xué)方程在模擬重要自然現(xiàn)象(如行星運(yùn)動(dòng))方面的“不合理的有效性”感到驚訝。然而,在過去的半個(gè)世紀(jì)中,依賴于一組方程或其他確定性假設(shè)的模型在捕捉生物學(xué)、經(jīng)濟(jì)學(xué)、天氣等領(lǐng)域的系統(tǒng)的全部復(fù)雜性方面一直存在困難。這反映了這些系統(tǒng)的組成部分?jǐn)?shù)量龐大,以及它們的動(dòng)態(tài)性和潛在的突發(fā)性、隨機(jī)性或混沌行為。在模擬這些系統(tǒng)方面的挑戰(zhàn)阻礙了科學(xué)家預(yù)測或控制它們將如何行為的能力,包括在沖擊或干預(yù)期間,如氣溫上升、新藥物或稅收政策的引入。

AI可以通過吸收更多關(guān)于它們的數(shù)據(jù),并在這些數(shù)據(jù)中學(xué)習(xí)更強(qiáng)大的模式和規(guī)律,更準(zhǔn)確地模擬這些復(fù)雜系統(tǒng)。例如,現(xiàn)代天氣預(yù)報(bào)是科學(xué)和工程的勝利。對于政府和工業(yè)來說,它通知了從可再生能源規(guī)劃到準(zhǔn)備颶風(fēng)和洪水的一切。對于公眾來說,天氣是谷歌搜索上最受歡迎的非品牌查詢。傳統(tǒng)的數(shù)值預(yù)測方法基于精心定義的物理方程,提供了非常有用但不完美的大氣復(fù)雜動(dòng)態(tài)的近似。它們在運(yùn)行時(shí)也是計(jì)算成本高昂的。在2023年,我們發(fā)布了一個(gè)深度學(xué)習(xí)系統(tǒng),可以預(yù)測多達(dá)10天的氣候條件,這在準(zhǔn)確性和預(yù)測速度上超越了傳統(tǒng)模型。正如我們下面將要展開的,使用AI預(yù)測天氣變量也可以幫助減輕和應(yīng)對氣候變化。例如,當(dāng)飛行員飛越潮濕地區(qū)時(shí),可能會(huì)導(dǎo)致凝結(jié)尾跡,這有助于航空對全球變暖的影響。谷歌科學(xué)家最近使用AI預(yù)測何時(shí)何地可能出現(xiàn)潮濕地區(qū),以幫助飛行員避免飛越它們。

在許多情況下,AI將豐富傳統(tǒng)的方法來模擬復(fù)雜系統(tǒng),而不是取代它們。例如,基于代理的建模模擬了個(gè)體行為者之間的相互作用,如公司和消費(fèi)者,以了解這些相互作用可能如何影響一個(gè)更大的更復(fù)雜的系統(tǒng),如經(jīng)濟(jì)。傳統(tǒng)的方法要求科學(xué)家事先指定這些計(jì)算代理應(yīng)該如何行為。我們的研究團(tuán)隊(duì)最近概述了科學(xué)家如何使用LLM創(chuàng)建更靈活的生成代理,它們可以通信和采取行動(dòng),如搜索信息或進(jìn)行購買,同時(shí)也推理和記住這些行動(dòng)。科學(xué)家還可以使用強(qiáng)化學(xué)習(xí)來研究這些代理如何在更動(dòng)態(tài)的模擬中學(xué)習(xí)和適應(yīng)他們的行為,例如在引入新的能源價(jià)格或大流行應(yīng)對政策時(shí)。

5. 解決方案

識(shí)別具有大搜索空間問題的新解決方案

許多重要的科學(xué)問題伴隨著實(shí)際上難以理解的潛在解決方案數(shù)量。例如,生物學(xué)家和化學(xué)家的目標(biāo)是確定分子的結(jié)構(gòu)、特性和功能,如蛋白質(zhì)。這樣的工作的一個(gè)目標(biāo)是幫助設(shè)計(jì)這些分子的新版本,作為抗體藥物、塑料降解酶或新材料。然而,要設(shè)計(jì)一個(gè)小分子藥物,科學(xué)家面臨著超過10^60個(gè)潛在選項(xiàng)。要設(shè)計(jì)一個(gè)具有400個(gè)標(biāo)準(zhǔn)氨基酸的蛋白質(zhì),他們面臨著2^400個(gè)選項(xiàng)。這些大搜索空間不僅限于分子,而是許多科學(xué)問題的常見現(xiàn)象,如尋找數(shù)學(xué)問題的最好證明,計(jì)算機(jī)科學(xué)任務(wù)的最有效算法,或計(jì)算機(jī)芯片的最佳架構(gòu)。

傳統(tǒng)上,科學(xué)家依賴于直覺、試錯(cuò)、迭代或蠻力計(jì)算的某種組合來找到最好的分子、證明或算法。然而,這些方法難以利用潛在解決方案的巨大空間,留下更好的未被發(fā)現(xiàn)。AI可以開辟這些搜索空間的新部分,同時(shí)也更快地鎖定最有可能可行和有用的解決方案——這是一個(gè)微妙的平衡行為。例如,在7月,我們的AlphaProof和AlphaGeometry 2系統(tǒng)正確解決了國際數(shù)學(xué)奧林匹克競賽中的六個(gè)問題中的四個(gè),這是一個(gè)精英高中競賽。這些系統(tǒng)利用我們的Gemini LLM架構(gòu)為給定的數(shù)學(xué)問題生成大量新的想法和潛在解決方案,并結(jié)合在數(shù)學(xué)邏輯基礎(chǔ)上的系統(tǒng),可以迭代地朝著最有可能正確的候選解決方案工作。

AI科學(xué)家或AI賦能的科學(xué)家?

AI在科學(xué)中的日益增長的使用,以及早期AI科學(xué)助手的出現(xiàn),引發(fā)了關(guān)于AI的能力將如何快速發(fā)展以及對人類科學(xué)家意味著什么的疑問。當(dāng)前基于LLM的AI科學(xué)助手對相對較窄范圍的任務(wù)做出了相對較小的貢獻(xiàn),例如支持文獻(xiàn)綜述。在不久的將來,它們有可能在這些任務(wù)上變得更好,并且能夠承擔(dān)更有意義的任務(wù),如幫助生成有力的假設(shè)或幫助預(yù)測實(shí)驗(yàn)結(jié)果。然而,當(dāng)前的系統(tǒng)仍然難以處理人類科學(xué)家依賴于這些任務(wù)的更深層次的創(chuàng)造力和推理。正在努力提高這些AI能力,例如通過將LLM與邏輯推理引擎結(jié)合,如我們的AlphaProof和AlphaGeometry 2示例,但需要進(jìn)一步的突破。加速或自動(dòng)化實(shí)驗(yàn)的能力對于那些需要在濕實(shí)驗(yàn)室中進(jìn)行復(fù)雜操作、與人類參與者互動(dòng)或漫長過程(如監(jiān)測疾病進(jìn)展)的實(shí)驗(yàn)來說將更加困難。盡管如此,這些領(lǐng)域的工作正在進(jìn)行中,例如新型實(shí)驗(yàn)室機(jī)器人和自動(dòng)化實(shí)驗(yàn)室。

即使AI系統(tǒng)的能力得到提高,最大的邊際收益也將來自于將它們部署在發(fā)揮其相對優(yōu)勢的用例中——例如,從大型數(shù)據(jù)集中快速提取信息的能力——以及幫助解決真正的科學(xué)進(jìn)步瓶頸,如上述五個(gè)機(jī)會(huì),而不是自動(dòng)化人類科學(xué)家已經(jīng)做得很好的任務(wù)。隨著AI使科學(xué)變得更便宜、更強(qiáng)大,對科學(xué)和科學(xué)家的需求也將增長。

例如,最近的突破已經(jīng)導(dǎo)致在蛋白質(zhì)設(shè)計(jì)、材料科學(xué)和天氣預(yù)報(bào)等領(lǐng)域出現(xiàn)了許多新的初創(chuàng)公司。與其他部門不同,盡管過去有相反的說法,但對未來科學(xué)的需求似乎是實(shí)際上無限的。新的進(jìn)展總是打開了科學(xué)知識(shí)地圖中新的、不可預(yù)測的區(qū)域,AI也將如此。正如赫伯特·西蒙所設(shè)想的,AI系統(tǒng)也將成為科學(xué)研究的對象,科學(xué)家將發(fā)揮領(lǐng)導(dǎo)作用,評估和解釋他們的科學(xué)能力,以及開發(fā)新型的人類-AI科學(xué)系統(tǒng)。

Part B: 要素

我們對AI for Science努力成功的要素感興趣——這些要素既涉及單個(gè)研究工作層面,也涉及科學(xué)生態(tài)系統(tǒng)層面,政策制定者在后者中有更大的影響力來塑造它們。我們采訪的專家們經(jīng)常引用幾個(gè)要素,我們將它們組織成一個(gè)玩具模型,我們稱之為AI for Science生產(chǎn)函數(shù)。這個(gè)生產(chǎn)函數(shù)并不意味著是全面的、規(guī)定的或一個(gè)整潔的線性過程。這些要素對許多人來說是直觀的,但我們的采訪揭示了它們在實(shí)踐中的樣子的一些教訓(xùn),我們在下面分享。

640 (6).png

1. 問題選擇

追求雄心勃勃的、AI塑造的問題

科學(xué)進(jìn)步取決于能夠識(shí)別一個(gè)重要的問題以及提出關(guān)于如何解決它的正確問題。在他們對科學(xué)突破起源的探索中,Venkatesh Narayanamurti和Jeffrey Y. Tsao記錄了問題和答案之間相互和遞歸關(guān)系的重要性,包括提出雄心勃勃的新問題的重要性。

我們的科學(xué)團(tuán)隊(duì)首先考慮一個(gè)潛在的研究問題是否足夠重要,以證明投入大量時(shí)間和資源的合理性。我們的首席執(zhí)行官Demis Hassabis有一個(gè)心理模型來指導(dǎo)這個(gè)評估:將所有科學(xué)視為知識(shí)樹。我們特別感興趣的是根——基本的“根節(jié)點(diǎn)問題”,如蛋白質(zhì)結(jié)構(gòu)預(yù)測或量子化學(xué),如果解決了,可以解鎖全新的研究和應(yīng)用分支。

為了評估AI是否合適和附加,我們尋找具有某些特征的問題,如巨大的組合搜索空間、大量的數(shù)據(jù)和明確的客觀函數(shù)來衡量性能。通常,一個(gè)問題原則上適合AI,但輸入尚未到位,需要稍后存儲(chǔ)。AlphaFold的一個(gè)最初靈感是Demis多年前作為學(xué)生時(shí)與一個(gè)對蛋白質(zhì)折疊問題著迷的朋友的對話。最近的許多突破也以重要的科學(xué)問題和剛剛成熟的AI方法的結(jié)合為特色。例如,我們的聚變工作得益于一種名為最大后驗(yàn)策略優(yōu)化的新強(qiáng)化學(xué)習(xí)算法,該算法剛剛發(fā)布。與我們的合作伙伴EPFL剛剛開發(fā)的新的快速準(zhǔn)確模擬器一起,使團(tuán)隊(duì)能夠克服數(shù)據(jù)匱乏的挑戰(zhàn)。除了選擇正確的問題,還重要的是以正確的難度級別明確它。我們的采訪對

象強(qiáng)調(diào),一個(gè)強(qiáng)大的AI問題陳述通常是適合中間結(jié)果的問題。如果你選擇的問題太難,你將無法產(chǎn)生足夠的信號來取得進(jìn)展。正確做到這一點(diǎn)依賴于直覺和實(shí)驗(yàn)。

2. 評估

投資于能夠提供穩(wěn)健性能信號并得到社區(qū)認(rèn)可的評估方法

科學(xué)家使用評估方法,如基準(zhǔn)測試、指標(biāo)和競賽,來評估AI模型的科學(xué)能力。做得好,這些評估提供了跟蹤進(jìn)展的方式,鼓勵(lì)方法上的創(chuàng)新,并激發(fā)研究人員對科學(xué)問題的興趣。通常,需要各種評估方法。例如,我們的天氣預(yù)報(bào)團(tuán)隊(duì)首先使用基于幾個(gè)關(guān)鍵變量的初始“進(jìn)度指標(biāo)”,如表面溫度,他們用來“爬山”或逐漸改進(jìn)他們的模型性能。當(dāng)模型達(dá)到一定的性能水平時(shí),他們進(jìn)行了更全面的評估,使用了超過1300個(gè)指標(biāo),這些指標(biāo)受到了歐洲中期天氣預(yù)報(bào)中心的評估記分卡的啟發(fā)。在以前的工作中,團(tuán)隊(duì)了解到AI模型有時(shí)可以以不希望的方式在這些指標(biāo)上取得好成績。例如,“模糊”預(yù)測——例如預(yù)測在一個(gè)大的地理區(qū)域內(nèi)的降雨——比“尖銳”預(yù)測——例如預(yù)測風(fēng)暴在一個(gè)與實(shí)際位置略有不同的地點(diǎn)——受到的懲罰要小,即所謂的“雙重懲罰”問題。為了提供進(jìn)一步的驗(yàn)證,團(tuán)隊(duì)評估了他們的模型在下游任務(wù)中的有用性,如其預(yù)測氣旋軌跡的能力,以及表征可能導(dǎo)致洪水的“大氣河流”——集中的水分帶——的強(qiáng)度。

最有影響力的AI for Science評估方法通常是社區(qū)驅(qū)動(dòng)或認(rèn)可的。黃金標(biāo)準(zhǔn)是蛋白質(zhì)結(jié)構(gòu)預(yù)測的關(guān)鍵評估競賽。自1994年由John Moult教授和Krzysztof Fidelis教授建立以來,每兩年舉行一次的CASP競賽挑戰(zhàn)研究小組將他們的蛋白質(zhì)結(jié)構(gòu)預(yù)測模型的準(zhǔn)確性與真正的、未發(fā)布的實(shí)驗(yàn)蛋白質(zhì)結(jié)構(gòu)進(jìn)行對比。它還成為了一個(gè)獨(dú)特的全球社區(qū)和研究進(jìn)展的催化劑,盡管很難迅速復(fù)制。對社區(qū)認(rèn)可的需求也提供了一個(gè)理由,即為什么基準(zhǔn)測試應(yīng)該被發(fā)布,以便研究人員可以使用、批評和改進(jìn)它們。然而,這也帶來了基準(zhǔn)測試將“泄露”到AI模型的訓(xùn)練數(shù)據(jù)中,減少其跟蹤進(jìn)展的有用性的風(fēng)險(xiǎn)。沒有完美的解決方案來解決這種權(quán)衡,但至少需要定期發(fā)布新的公共基準(zhǔn)測試。科學(xué)家、AI實(shí)驗(yàn)室和政策制定者還應(yīng)該探索新的方法來評估AI模型的科學(xué)能力,例如建立新的第三方評估組織、競賽,并使科學(xué)家能夠更開放地探索AI模型的能力。

3. 計(jì)算

跟蹤計(jì)算使用的發(fā)展,并投資于專業(yè)技能

多次政府審查認(rèn)識(shí)到計(jì)算對AI、科學(xué)和更廣泛經(jīng)濟(jì)進(jìn)展的日益增長的重要性。正如我們下面將進(jìn)一步討論的,對計(jì)算的能源消耗和溫室氣體排放的關(guān)注也在增長。AI實(shí)驗(yàn)室和政策制定者應(yīng)該采取一個(gè)腳踏實(shí)地的長期觀點(diǎn),考慮計(jì)算需求如何在不同的AI模型和用例中變化,潛在的乘數(shù)效應(yīng)和效率增益,以及這與不使用AI的科學(xué)進(jìn)展的替代方法相比如何。

例如,一些最先進(jìn)的AI模型,如蛋白質(zhì)設(shè)計(jì),相對較小。像LLM這樣的大型模型訓(xùn)練起來計(jì)算密集,但通常需要較少的計(jì)算來微調(diào),或者運(yùn)行推理,這可以為科學(xué)研究開辟更有效的途徑。一旦訓(xùn)練了LLM,也更容易使其更有效,例如通過更好的數(shù)據(jù)管理,或者通過將大型模型“蒸餾”成小型模型。計(jì)算需求也應(yīng)該與其他科學(xué)進(jìn)展模型進(jìn)行評估。例如,AI天氣預(yù)報(bào)模型訓(xùn)練起來計(jì)算密集,但仍然可能比傳統(tǒng)技術(shù)更計(jì)算效率高。這些細(xì)微差別強(qiáng)調(diào)了AI實(shí)驗(yàn)室和政策制定者需要實(shí)證跟蹤計(jì)算使用,了解其發(fā)展趨勢,并預(yù)測這些趨勢對未來需求意味著什么。除了確保獲得正確類型的芯片外,計(jì)算策略還應(yīng)該優(yōu)先考慮管理訪問和確保可靠性所需的關(guān)鍵基礎(chǔ)設(shè)施和工程技能。這在學(xué)術(shù)界和公共研究機(jī)構(gòu)中通常資源不足。

4. 數(shù)據(jù)

混合自上而下和自下而上的努力來收集、管理、存儲(chǔ)和訪問數(shù)據(jù)

與計(jì)算類似,數(shù)據(jù)可以被視為AI for Science努力的關(guān)鍵基礎(chǔ)設(shè)施,需要隨著時(shí)間的推移進(jìn)行開發(fā)、維護(hù)和更新。討論通常集中在確定政策制定者和從業(yè)者應(yīng)該創(chuàng)建的新數(shù)據(jù)集上。自上而下的努力有其作用。在2012年,奧巴馬政府啟動(dòng)了材料項(xiàng)目,以繪制已知和預(yù)測的材料,如在電池、太陽能板和計(jì)算機(jī)芯片中發(fā)現(xiàn)的無機(jī)晶體硅。我們最近的GNoME努力使用這些數(shù)據(jù)預(yù)測了220萬個(gè)新的無機(jī)晶體,包括380,000個(gè)模擬表明在低溫下穩(wěn)定的晶體,使它們成為新材料的候選者。

然而,通常很難事先預(yù)測哪些科學(xué)數(shù)據(jù)集將最重要,許多AI for Science突破依賴于更有機(jī)地出現(xiàn)的數(shù)據(jù),這要感謝有進(jìn)取心的個(gè)人或小團(tuán)隊(duì)的努力。例如,丹尼爾·麥克阿瑟,當(dāng)時(shí)是Broad Institute的研究員,領(lǐng)導(dǎo)了gnomAD遺傳變異數(shù)據(jù)集的開發(fā),我們的AlphaMissense工作隨后借鑒了這些數(shù)據(jù)。類似地,數(shù)學(xué)證明助手和編程語言Lean最初是由程序員萊昂納多·德·莫拉開發(fā)的。它不是一個(gè)數(shù)據(jù)集,但現(xiàn)在許多AI實(shí)驗(yàn)室使用它來幫助訓(xùn)練他們的AI數(shù)學(xué)模型,包括我們的AlphaProof系統(tǒng)。像gnomAD或Lean這樣的努力突出了自上而下的數(shù)據(jù)工作需要與更好的激勵(lì)措施相結(jié)合,以激勵(lì)數(shù)據(jù)管道各個(gè)階段的個(gè)人。例如,一些來自戰(zhàn)

略性濕實(shí)驗(yàn)室實(shí)驗(yàn)的數(shù)據(jù)目前被丟棄,但如果有穩(wěn)定的資金,可以收集和存儲(chǔ)。數(shù)據(jù)管理也可以更好地激勵(lì)。我們的AlphaFold模型是在蛋白質(zhì)數(shù)據(jù)銀行的數(shù)據(jù)上訓(xùn)練的,這些數(shù)據(jù)的質(zhì)量特別高,因?yàn)槠诳髮⒌鞍踪|(zhì)結(jié)構(gòu)作為發(fā)表的先決條件,PDB的專業(yè)數(shù)據(jù)管理者為此數(shù)據(jù)開發(fā)了標(biāo)準(zhǔn)。在基因組學(xué)中,許多研究人員也有義務(wù)在序列讀取存檔中存放原始測序數(shù)據(jù),但不一致的標(biāo)準(zhǔn)意味著各個(gè)數(shù)據(jù)集通常仍然需要重新處理和組合。一些其他高質(zhì)量的數(shù)據(jù)集根本沒有使用,因?yàn)樵S可條件限制,如在生物多樣性中,或者因?yàn)閿?shù)據(jù)集沒有發(fā)布,如幾十年來由公共資金資助的聚變實(shí)驗(yàn)的數(shù)據(jù)。這些情況可能有邏輯原因,如缺乏時(shí)間、資金、放置數(shù)據(jù)的地方,或研究人員需要臨時(shí)禁運(yùn)期來開發(fā)數(shù)據(jù)。但在總體上,這些數(shù)據(jù)訪問問題構(gòu)成了使用AI推進(jìn)科學(xué)進(jìn)展的關(guān)鍵瓶頸。

5. 組織設(shè)計(jì)

在自下而上的創(chuàng)造力和自上而下的協(xié)調(diào)之間找到正確的平衡

一個(gè)簡單的啟發(fā)式方法是,學(xué)術(shù)界和工業(yè)界在科學(xué)研究方向上處于兩個(gè)極端。學(xué)術(shù)界往往更自下而上,工業(yè)實(shí)驗(yàn)室往往更自上而下。實(shí)際上,在最成功的實(shí)驗(yàn)室之間,尤其是貝爾實(shí)驗(yàn)室和施樂帕克研究中心這樣的黃金時(shí)代,它們以藍(lán)天研究而聞名,并在DeepMind的創(chuàng)立中激發(fā)了靈感,一直有很多空間。最近,一波新的科學(xué)研究機(jī)構(gòu)出現(xiàn)了,它們試圖從這些異常例子中學(xué)習(xí)。這些組織在目標(biāo)、資金模式、學(xué)科重點(diǎn)和工作組織上有所不同。但總的來說,它們希望提供更多的高風(fēng)險(xiǎn)、高回報(bào)的研究,更少的官僚主義,以及更好的科學(xué)家激勵(lì)。

許多組織有一個(gè)強(qiáng)烈的焦點(diǎn),即應(yīng)用AI,如英國高級研究與發(fā)明機(jī)構(gòu)、Arc研究所,以及越來越多的專注于解決科學(xué)中特定問題的專注研究組織,這些問題對于學(xué)術(shù)界來說太大,對于工業(yè)來說不夠有利可圖,如負(fù)責(zé)擴(kuò)展對AI數(shù)學(xué)研究至關(guān)重要的Lean證明助手的組織。

在它們的核心,這些新機(jī)構(gòu)希望找到自上而下的協(xié)調(diào)和自下而上的科學(xué)家賦權(quán)之間的更好融合。對于一些組織來說,這意味著專注于一個(gè)特定的問題,并預(yù)先指定里程碑。對于其他人來說,這意味著向主要研究者提供更多的不受限制的資金。正確地平衡這一點(diǎn)對于吸引和留住研究領(lǐng)導(dǎo)者至關(guān)重要,他們也必須接受它才能成功——Demis Hassabis將其視為成功協(xié)調(diào)大規(guī)模尖端研究的最重要因素。在單個(gè)研究工作內(nèi)正確平衡這一點(diǎn)也很重要。在Google DeepMind的情況下,努力通常在更多的非結(jié)構(gòu)化“探索”階段和更快的“開發(fā)”階段之間轉(zhuǎn)換,團(tuán)隊(duì)在“探索”階段尋找新的想法,在“開發(fā)”階段專注于工程和擴(kuò)展性能。知道何時(shí)在這些模式之間切換以及如何相應(yīng)地調(diào)整項(xiàng)目團(tuán)隊(duì),是一門藝術(shù)。

6. 跨學(xué)科

將科學(xué)視為團(tuán)隊(duì)合作,資助被忽視的角色,并促進(jìn)可爭議性的文化

許多最困難的科學(xué)問題需要在領(lǐng)域之間的進(jìn)步。然而,當(dāng)從業(yè)者聚集在一起時(shí),例如在Covid-19期間,他們通常難以從多學(xué)科團(tuán)隊(duì)——他們各自保留自己的學(xué)科角度——轉(zhuǎn)變?yōu)檎嬲目鐚W(xué)科,他們集體開發(fā)共享的想法和方法。這一挑戰(zhàn)反映了科學(xué)知識(shí)的日益專業(yè)化,以及通常主要根據(jù)他們的核心專業(yè)知識(shí)評估從業(yè)者的激勵(lì)措施,如資金。

AI for Science努力通常默認(rèn)是多學(xué)科的,但要成功,他們需要成為真正的跨學(xué)科。一個(gè)起點(diǎn)是選擇一個(gè)需要每種專業(yè)知識(shí)的問題,然后提供足夠的時(shí)間和重點(diǎn)來培養(yǎng)圍繞它的團(tuán)隊(duì)動(dòng)態(tài)。例如,我們的伊薩卡項(xiàng)目使用AI恢復(fù)和歸因損壞的古希臘銘文,這可能幫助從業(yè)者研究過去文明的思想、語言和歷史。要成功,項(xiàng)目共同領(lǐng)導(dǎo)Yannis Assael不得不發(fā)展對碑文學(xué)的了解——古代銘文文本的研究。項(xiàng)目的碑文學(xué)家,反過來,不得不了解AI模型的工作方式,鑒于直覺對他們的工作的重要性。培養(yǎng)這些團(tuán)隊(duì)動(dòng)態(tài)需要正確的激勵(lì)措施。授權(quán)一個(gè)小型、緊密的團(tuán)隊(duì)專注于解決問題,而不是論文的作者身份,是AlphaFold 2突破的關(guān)鍵。這種類型的專注可以更容易地在工業(yè)實(shí)驗(yàn)室中實(shí)現(xiàn),但再次強(qiáng)調(diào)了長期公共研究資金的重要性,這些資金與出版壓力較少相關(guān)。

640 (7).png

為了實(shí)現(xiàn)真正的跨學(xué)科,組織還需要為個(gè)人創(chuàng)建角色和職業(yè)道路,他們可以幫助融合學(xué)科。在Google DeepMind,我們的研究工程師鼓勵(lì)研究和工程之間的正反饋循環(huán),而我們的項(xiàng)目經(jīng)理幫助培養(yǎng)研究工作內(nèi)的團(tuán)隊(duì)動(dòng)態(tài),并在它們之間創(chuàng)建聯(lián)系。我們還優(yōu)先雇傭喜歡發(fā)現(xiàn)和連接領(lǐng)域之間聯(lián)系的個(gè)人,以及那些有動(dòng)力在新領(lǐng)域迅速提高技能的人。為了鼓勵(lì)思想的交叉?zhèn)鞑ィ覀冞€鼓勵(lì)科學(xué)家和工程師定期更換項(xiàng)目。最終的目標(biāo)是創(chuàng)建一個(gè)鼓勵(lì)好奇心、謙遜以及經(jīng)濟(jì)歷史學(xué)家Joel Mokyr所稱的“可爭議性”的文化——不同背景的從業(yè)者都感到有權(quán)力以公開講座和討論線索的形式提出和建設(shè)性地批評彼此的工作。

7. 采用

仔細(xì)考慮最佳訪問選項(xiàng),并聚焦AI模型的不確定性

許多AI for Science模型,如AlphaFold或我們的天氣預(yù)報(bào)工作,就它們執(zhí)行的任務(wù)數(shù)量而言是專業(yè)的。但從它們被許多科學(xué)家使用的角度來看,它們也是通用的,用于從理解疾病到改進(jìn)捕魚計(jì)劃等一切事物。這種影響遠(yuǎn)非保證。疾病的細(xì)菌理論花了很長時(shí)間才傳播開來,而科學(xué)突破可能帶來的下游產(chǎn)品,如新抗生素,通常缺乏正確的市場激勵(lì)。

在決定如何發(fā)布我們的模型時(shí),我們試圖平衡對科學(xué)家廣泛采用和驗(yàn)證的渴望與商業(yè)目標(biāo)和其他考慮,如潛在的安全風(fēng)險(xiǎn)。我們還創(chuàng)建了一個(gè)專門的Impact Accelerator,以推動(dòng)突破的采用,并鼓勵(lì)可能不會(huì)發(fā)生的社會(huì)有益應(yīng)用,包括通過與Drugs for Neglected Diseases Initiative和Global Antibiotic Research & Development Partnership等組織的合作伙伴關(guān)系,這些組織有類似的任務(wù)。

為了鼓勵(lì)可能從新模型或數(shù)據(jù)集中受益的科學(xué)家使用它,開發(fā)人員需要使科學(xué)家盡可能容易地使用和集成到他們的工作流程中。考慮到這一點(diǎn),對于AlphaFold 2,我們開源了代碼,還與EMBL-EBI合作開發(fā)了一個(gè)數(shù)據(jù)庫,科學(xué)家,包括那些計(jì)算技能和基礎(chǔ)設(shè)施較少的科學(xué)家,可以搜索和下載現(xiàn)成的2億個(gè)蛋白質(zhì)結(jié)構(gòu)。AlphaFold 3擴(kuò)展了模型的能力,導(dǎo)致了潛在預(yù)測數(shù)量的組合爆炸。這創(chuàng)造了一個(gè)新的界面AlphaFold Server的需求,它允許科學(xué)家按需創(chuàng)建結(jié)構(gòu)。科學(xué)界還開發(fā)了自己的AlphaFold工具,如ColabFold,展示了存在的多樣化需求,以及培養(yǎng)科學(xué)界計(jì)算技能的價(jià)值,以解決這些需求。

640 (8).png

科學(xué)家還需要信任一個(gè)AI模型,以便使用它。我們在下面將更詳細(xì)地討論可靠性問題,但一個(gè)有用的起點(diǎn)是主動(dòng)表明科學(xué)家應(yīng)該如何使用一個(gè)模型,以及它的不確定性。以AlphaFold為例,在與科學(xué)家的對話之后,團(tuán)隊(duì)開發(fā)了不確定性指標(biāo),這些指標(biāo)傳達(dá)了模型對于給定蛋白質(zhì)結(jié)構(gòu)預(yù)測的“信心”程度,并通過直觀的可視化支持。我們還與EMBL-EBI合作開發(fā)了一個(gè)培訓(xùn)模塊,提供如何最佳使用AlphaFold的指導(dǎo),包括如何解釋這些信心指標(biāo),以及其他科學(xué)家如何使用它的實(shí)際例子。同樣,我們的Med-Gemini系統(tǒng)最近在回答健康相關(guān)問題上實(shí)現(xiàn)了最先進(jìn)的性能。它采用了一種由不確定性引導(dǎo)的方法,通過生成多個(gè)“推理鏈”來回答一個(gè)問題。然后,它使用這些初始答案之間的相對差異來計(jì)算答案的不確定性。當(dāng)不確定性很高時(shí),它會(huì)調(diào)用網(wǎng)絡(luò)搜索來整合最新、最準(zhǔn)確的信息。

640 (9).png

8. 合作伙伴關(guān)系

旨在早期對齊和明確的值交換

AI for Science努力需要多樣性的專業(yè)知識(shí),這創(chuàng)造了強(qiáng)烈的合作伙伴需求——無論是正式的還是非正式的——在公共和私人組織之間。這些合作伙伴關(guān)系在項(xiàng)目生命周期中都是需要的,從創(chuàng)建數(shù)據(jù)集到分享研究。特別是,AI實(shí)驗(yàn)室通常需要科學(xué)家?guī)椭u估AI模型的輸出。例如,最近的研究強(qiáng)調(diào)了擁有豐富領(lǐng)域?qū)I(yè)知識(shí)的高級材料科學(xué)家在評估AI模型預(yù)測的新材料是否可行方面的重要性。同樣,我們的蛋白質(zhì)設(shè)計(jì)團(tuán)隊(duì)與弗朗西斯·克里克研究所的研究小組合作,進(jìn)行濕實(shí)驗(yàn)室實(shí)驗(yàn),測試我們的AI設(shè)計(jì)的蛋白質(zhì)是否結(jié)合到目標(biāo)上,以及這是否具有期望的功能,如阻止SARS-CoV-2感染細(xì)胞。我們的FunSearch方法能夠?yàn)镃ap Set問題開發(fā)新的構(gòu)造,這曾經(jīng)是著名數(shù)學(xué)家Terence Tao最喜歡的開放問題。這得益于與威斯康星大學(xué)麥迪遜分校的數(shù)學(xué)教授和Cap Set專家Jordan Ellenberg的合作。鑒于行業(yè)實(shí)驗(yàn)室在推進(jìn)AI能力方面的中心作用,以及對豐富領(lǐng)域?qū)I(yè)知識(shí)的需求,這些公私合作伙伴關(guān)系可能對推進(jìn)AI for Science前沿越來越重要,可能需要更大的投資,如為大學(xué)和公共研究機(jī)構(gòu)中的合作伙伴團(tuán)隊(duì)提供更多資金。

發(fā)展合作伙伴關(guān)系是困難的。在開始討論時(shí),重要的是要早期對齊總體目標(biāo),并解決可能棘手的問題,如各方應(yīng)對輸出擁有什么權(quán)利,是否應(yīng)該有出版物,模型或數(shù)據(jù)集是否應(yīng)該開源,以及應(yīng)該適用什么類型的許可。意見分歧是自然的,通常反映了公共和私人組織的激勵(lì)措施,這些激勵(lì)措施因研究的成熟度或其商業(yè)潛力等因素而大不相同。最成功的合作伙伴關(guān)系涉及明確的值交換,利用每個(gè)組織的優(yōu)勢。例如,來自190多個(gè)國家的200多萬用戶已經(jīng)使用了AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫。這需要密切合作,將我們的AI模型與EMBL-EBI的生物策展專業(yè)知識(shí)和科學(xué)網(wǎng)絡(luò)配對。

9. 安全與責(zé)任

使用評估來探索權(quán)衡,并激發(fā)新類型的評估方法

科學(xué)家經(jīng)常對AI模型可能對科學(xué)以及更廣泛社會(huì)帶來的潛在好處和風(fēng)險(xiǎn)持不同意見,有時(shí)意見非常強(qiáng)烈。進(jìn)行倫理和安全評估可以幫助框架討論,并使科學(xué)家能夠決定是否以及如何開發(fā)給定的AI模型。起點(diǎn)是確定最重要的影響領(lǐng)域,并在正確的抽象層次上指定這些領(lǐng)域。有越來越復(fù)雜的框架來識(shí)別和分類不同的AI風(fēng)險(xiǎn),如促進(jìn)錯(cuò)誤和虛假信息。但這些框架很少在同一領(lǐng)域考慮AI的潛在好處,如改善對高質(zhì)量信息綜合的訪問,或者可能發(fā)生的權(quán)衡,例如,如果你限制對AI模型的訪問或限制其能力。評估還應(yīng)該澄清它們的時(shí)間范圍,任何影響的相對確定性,以及AI的相對重要性或額外性,以實(shí)現(xiàn)它。例如,擔(dān)心AI和氣候變化的人通常關(guān)注立即需要的電力來訓(xùn)練大型AI模型,而AI支持者通常關(guān)注不那么直接、不那么清晰但可能大得多的下游好處,即未來的AI應(yīng)用對氣候的好處。在進(jìn)行評估時(shí),AI從業(yè)者還應(yīng)該避免過分關(guān)注模型的能力,這些能力他們會(huì)更接近,更好地理解第三方實(shí)際上會(huì)使用它或受到它影響的程度,這通常需要外部專家的投入才能做得好。

從業(yè)者還需要新的方法來更好地評估在科學(xué)中使用AI的潛在風(fēng)險(xiǎn)和好處。目前,許多AI安全評估依賴于指定模型不應(yīng)輸出的內(nèi)容類型,并量化模型遵循此政策的程度。這些評估對于某些使用AI在科學(xué)中造成的風(fēng)險(xiǎn)是有用的,例如生成不準(zhǔn)確的內(nèi)容。但對于其他風(fēng)險(xiǎn),如生物安全,我們可以可靠地事先指定某些類型的科學(xué)知識(shí)為危險(xiǎn)的想法已經(jīng)受到挑戰(zhàn),因?yàn)榭茖W(xué)知識(shí)的雙重用途性質(zhì),但也因?yàn)檫@些努力往往關(guān)注歷史上造成的傷害,如過去疫情的病毒,而不是新的風(fēng)險(xiǎn)。更好的方法可能是評估AI模型的危險(xiǎn)能力,或AI模型在多大程度上提升了人類的危險(xiǎn)性能力。在許多情況下,這些能力也將是雙重用途的,如幫助設(shè)計(jì)或執(zhí)行實(shí)驗(yàn)協(xié)議的能力。這些AI能力在多大程度上指向風(fēng)險(xiǎn)或機(jī)會(huì),將取決于對潛在威脅行為者的評估以及對模型的訪問治理。除了安全外,評估使用AI在科學(xué)中的其他風(fēng)險(xiǎn),如對科學(xué)創(chuàng)造力或可靠性的風(fēng)險(xiǎn)(我們在下面討論),將需要全新的評估方法。鑒于研究和執(zhí)行這些評估的難度,最好在社區(qū)層面上追求它們,而不是每個(gè)實(shí)驗(yàn)室追求孤立的努力。

Part C: 風(fēng)險(xiǎn)

政策文件、政府文件和科學(xué)家調(diào)查經(jīng)常提到人工智能在科學(xué)中日益增長的使用所帶來的某些風(fēng)險(xiǎn)。其中三個(gè)風(fēng)險(xiǎn)——對科學(xué)創(chuàng)造力、可靠性和理解的風(fēng)險(xiǎn)——主要與科學(xué)實(shí)踐的方式有關(guān)。另外兩個(gè)風(fēng)險(xiǎn)——對公平和環(huán)境的風(fēng)險(xiǎn)——主要與科學(xué)如何代表和影響更廣泛的社會(huì)有關(guān)。使用人工智能通常被獨(dú)家呈現(xiàn)為對這些領(lǐng)域的風(fēng)險(xiǎn),而這些領(lǐng)域,如科學(xué)可靠性或環(huán)境,通常被描繪成穩(wěn)定、有些理想化的術(shù)語,這可能忽視了它們面臨的更廣泛的挑戰(zhàn)。我們認(rèn)為,在科學(xué)中使用人工智能最終將惠及這五個(gè)領(lǐng)域,因?yàn)橛袡C(jī)會(huì)減輕人工智能所帶來的風(fēng)險(xiǎn),并使用人工智能幫助解決這些領(lǐng)域的更廣泛挑戰(zhàn),在某些情況下是深刻的。對于不公平而言,實(shí)現(xiàn)有益的結(jié)果可能更難,因?yàn)椴还奖磺度氲饺斯ぶ悄芎涂茖W(xué)的多個(gè)層面,從勞動(dòng)力的構(gòu)成到支撐研究的數(shù)據(jù),而對于科學(xué)創(chuàng)造力而言,這是高度主觀的,所以個(gè)人可能會(huì)合理地對某個(gè)結(jié)果是否積極有不同的看法。這些細(xì)微差別增加了科學(xué)家、政策制定者和其他人闡明他們對如何使用人工智能在科學(xué)中將影響這5個(gè)領(lǐng)域期望的價(jià)值。

640 (10).png

1. 創(chuàng)造力

人工智能會(huì)導(dǎo)致較少的新穎、違反直覺的突破嗎?

科學(xué)創(chuàng)造力描述了創(chuàng)造新事物的能力。在實(shí)踐中,科學(xué)家將一個(gè)新想法、方法或產(chǎn)出視為創(chuàng)造性的程度通常取決于更主觀的因素,如其感知的簡單性、違反直覺性或美感。今天,科學(xué)創(chuàng)造力受到科學(xué)勞動(dòng)力的相對同質(zhì)性的影響,這縮小了想法的多樣性。對研究人員“發(fā)表或消亡”的壓力也激勵(lì)了“跟隨人群”的出版物,而不是通常支撐創(chuàng)造性突破的深入工作或跨學(xué)科的概念橋梁。這可能解釋了為什么導(dǎo)致一個(gè)領(lǐng)域轉(zhuǎn)向新方向的顛覆性科學(xué)想法的比例似乎在下降,超出了科學(xué)擴(kuò)展可能預(yù)期的正常范圍。

一些科學(xué)家擔(dān)心,使用人工智能可能會(huì)加劇這些趨勢,破壞人類科學(xué)家更直觀、非正統(tǒng)和偶然的方法,如伽利略假設(shè)地球自轉(zhuǎn)的假設(shè)。這可能以不同的方式發(fā)生。一個(gè)擔(dān)憂是,AI模型被訓(xùn)練為在其訓(xùn)練數(shù)據(jù)中最小化異常值,而科學(xué)家通常會(huì)通過關(guān)注一個(gè)令人困惑的數(shù)據(jù)點(diǎn)來放大異常值。其他人擔(dān)心,AI系統(tǒng)被訓(xùn)練來執(zhí)行特定任務(wù),因此依賴它們將放棄更偶然的突破,例如研究人員意外地找到他們沒有研究的問題的解決方案。在社區(qū)層面上,一些人擔(dān)心,如果科學(xué)家大規(guī)模擁抱AI,它可能導(dǎo)致輸出的逐漸同質(zhì)化,例如如果LLM對不同科學(xué)家的查詢產(chǎn)生類似的建議。或者,如果科學(xué)家過度關(guān)注最適合AI的學(xué)科和問題。維持對探索性研究和非AI研究的支持可能有助于減輕其中一些風(fēng)險(xiǎn)。科學(xué)家也可以調(diào)整他們使用AI的方式,以便它增強(qiáng)而不是削弱他們自己的創(chuàng)造力,例如通過微調(diào)LLM來提出更個(gè)性化的研究想法,或幫助科學(xué)家更好地引出自己的想法,類似于我們早期開發(fā)AI導(dǎo)師的努力,這些導(dǎo)師可以幫助學(xué)生更好地反思問題,而不僅僅是輸出問題的答案。AI也可以使新的科學(xué)創(chuàng)造力類型成為可能,這些類型可能不會(huì)以其他方式發(fā)生。一種類型的AI創(chuàng)造力是插值,其中AI系統(tǒng)在其訓(xùn)練數(shù)據(jù)中識(shí)別新穎的想法,特別是當(dāng)人類在這方面的能力有限時(shí),如努力使用AI檢測大型強(qiáng)子對撞機(jī)實(shí)驗(yàn)的大規(guī)模數(shù)據(jù)集中的異常。第二種類型是外推,AI模型概括出更新穎的解決方案超出了它們的訓(xùn)練數(shù)據(jù),如我們的AlphaGo系統(tǒng)提出的第37個(gè)動(dòng)作,震驚了人類圍棋專家,或我們的AlphaProof和AlphaGeometry 2系統(tǒng)產(chǎn)生的新穎數(shù)學(xué)證明和非明顯構(gòu)造。第三種類型是發(fā)明,AI系統(tǒng)提出了一個(gè)完全新的理論或科學(xué)體系,與其訓(xùn)練數(shù)據(jù)完全無關(guān),類似于最初發(fā)展廣義相對論或創(chuàng)造復(fù)數(shù)。AI系統(tǒng)目前沒有表現(xiàn)出這種創(chuàng)造力,但新的方法可能會(huì)解鎖這一點(diǎn),例如優(yōu)化不同目標(biāo)的多代理系統(tǒng),如新穎性和違反直覺性,或訓(xùn)練AI模型以生成新的科學(xué)問題,以激發(fā)新的解決方案。

2. 可靠性

人工智能會(huì)使科學(xué)變得不那么自我修正嗎?

可靠性描述了科學(xué)家依賴彼此的發(fā)現(xiàn),并相信它們不是由于偶然或錯(cuò)誤。今天,一系列相互關(guān)聯(lián)的挑戰(zhàn)削弱了科學(xué)的可靠性,包括p-hacking和出版偏見,這可能導(dǎo)致研究人員報(bào)告陰性結(jié)果不足;科學(xué)家執(zhí)行日常科學(xué)任務(wù)時(shí)缺乏標(biāo)準(zhǔn)化;錯(cuò)誤,例如科學(xué)家使用統(tǒng)計(jì)方法時(shí)的錯(cuò)誤;科學(xué)欺詐;以及同行評審過程的挑戰(zhàn),包括缺乏合格的同行評審員。

一些科學(xué)家擔(dān)心,人工智能會(huì)加劇這些挑戰(zhàn),因?yàn)橐恍〢I研究也具有不良實(shí)踐,例如從業(yè)者挑選他們用來評估模型性能的評估。AI模型,特別是LLM,也容易“幻覺”輸出,包括科學(xué)引用,這些輸出是錯(cuò)誤的或誤導(dǎo)性的。其他人擔(dān)心LLM可能導(dǎo)致類似“論文工廠”生產(chǎn)的低質(zhì)量論文泛濫。社區(qū)正在努力解決這些問題,包括為研究人員提供良好實(shí)踐清單以遵守,以及不同類型的AI事實(shí)性研究,例如訓(xùn)練AI模型將其輸出與可信來源的基礎(chǔ),或幫助驗(yàn)證其他AI模型的輸出。

科學(xué)家也可能使用AI來提高更廣泛研究基礎(chǔ)的可靠性。例如,如果AI可以幫助自動(dòng)化數(shù)據(jù)注釋或?qū)嶒?yàn)設(shè)計(jì)的方面,這可能為這些領(lǐng)域提供急需的標(biāo)準(zhǔn)化。隨著AI模型變得更擅長將其輸出與引用基礎(chǔ)聯(lián)系起來,它們也可以幫助科學(xué)家和政策制定者更系統(tǒng)地審查證據(jù)基礎(chǔ),例如在氣候變化方面,政府間氣候變化專門委員會(huì)等團(tuán)體已經(jīng)在努力跟上出版物的無情上升。從業(yè)者還可以使用AI幫助檢測錯(cuò)誤或欺詐性圖像,或誤導(dǎo)性的科學(xué)聲明,如科學(xué)雜志最近試用的AI圖像分析工具的試驗(yàn)。更投機(jī)地,鑒于一些科學(xué)家已經(jīng)使用LLM來幫助批評他們自己的論文,并幫助驗(yàn)證AI模型的輸出,例如在定理證明中,AI可能潛在地幫助同行評審的某些方面。然而,對于保密性、AI系統(tǒng)檢測真正新穎工作的能力,以及考慮到同行評審在批準(zhǔn)資助等過程中的重要作用,科學(xué)家的接受度也有合理的擔(dān)憂。

3. 理解

人工智能會(huì)導(dǎo)致有用的預(yù)測以犧牲更深層次的科學(xué)理解為代價(jià)嗎?

在最近的一項(xiàng)自然調(diào)查中,科學(xué)家提到依賴于模式匹配以犧牲更深層次理解為代價(jià),是從使用AI在科學(xué)中獲得的最大風(fēng)險(xiǎn)。理解并非總是發(fā)現(xiàn)新的科學(xué)現(xiàn)象或開發(fā)有用應(yīng)用的必要條件,例如超導(dǎo)性或藥物。但大多數(shù)科學(xué)家將理解視為他們的主要目標(biāo),作為人類知識(shí)的最深層次。關(guān)于AI破壞科學(xué)理解的擔(dān)憂包括認(rèn)為現(xiàn)代深度學(xué)習(xí)方法是無理論的,并且不包含或?yàn)樗鼈冾A(yù)測的現(xiàn)象提供理論。科學(xué)家還擔(dān)心AI模型是不解釋的,在這個(gè)意義上,它們不是基于明確的一組方程和參數(shù)。還有一個(gè)擔(dān)憂是,任何對AI模型輸出的解釋對科學(xué)家來說都不會(huì)是可訪問的或有用的。總而言之,AI模型可能提供有關(guān)蛋白質(zhì)結(jié)構(gòu)或天氣的有用預(yù)測,但它們能夠幫助科學(xué)家理解蛋白質(zhì)為什么以某種方式折疊,或者大氣動(dòng)力學(xué)如何導(dǎo)致天氣變化嗎?

關(guān)于用“低級……計(jì)算”取代“真正的、理論科學(xué)”的擔(dān)憂并不是新的,曾經(jīng)針對過蒙特卡洛方法等過去技術(shù)。將工程和科學(xué)結(jié)合起來的領(lǐng)域,如合成生物學(xué),也面臨著優(yōu)先考慮有用應(yīng)用而不是更深層次科學(xué)理解的指責(zé)。這些方法和技術(shù)導(dǎo)致了科學(xué)理解的增長,我們相信AI也會(huì)如此,即使其中一些增長難以提前預(yù)測。首先,大多數(shù)AI模型并非無理論,而是以不同的方式構(gòu)建在先前的知識(shí)上,如在它們的數(shù)據(jù)集和評估中的構(gòu)造。一些AI模型也有可解釋的輸出。例如,我們的FunSearch方法輸出計(jì)算機(jī)代碼,也描述了它如何到達(dá)解決方案。

研究人員還在研究可解釋性技術(shù),這些技術(shù)可以揭示AI系統(tǒng)如何工作,例如努力識(shí)別模型學(xué)習(xí)的概念。這些可解釋性技術(shù)的許多都有重要的局限性,但它們已經(jīng)使科學(xué)家能夠從AI模型中提取新的科學(xué)假設(shè)。例如,轉(zhuǎn)錄因子是蛋白質(zhì),它們綁定到DNA序列上激活或抑制附近基因的表達(dá)。一項(xiàng)AI研究努力能夠預(yù)測DNA序列中每個(gè)堿基對不同轉(zhuǎn)錄因子的結(jié)合的相對貢獻(xiàn),并使用生物學(xué)家熟悉的概念來解釋這一結(jié)果。一個(gè)更大的機(jī)會(huì)可能是基于AI系統(tǒng)學(xué)習(xí)的方式學(xué)習(xí)全新的概念。例如,我們的研究人員最近展示了我們的AlphaZero系統(tǒng)學(xué)習(xí)了關(guān)于下棋的“超人”知識(shí),包括非傳統(tǒng)的動(dòng)作和策略,并使用另一個(gè)AI系統(tǒng)提取這些概念并教給人類象棋專家。

即使沒有可解釋性技術(shù),AI也會(huì)通過開辟新的研究方向來提高科學(xué)理解,這些方向否則將是禁止的。例如,通過解鎖生成大量合成蛋白質(zhì)結(jié)構(gòu)的能力,AlphaFold使科學(xué)家能夠跨蛋白質(zhì)結(jié)構(gòu)而不是僅僅跨蛋白質(zhì)序列進(jìn)行搜索。一個(gè)團(tuán)隊(duì)利用這種方法發(fā)現(xiàn)了一個(gè)古老的Cas13蛋白質(zhì)家族成員,它為編輯RNA提供了希望,包括幫助診斷和治療疾病。這一發(fā)現(xiàn)還挑戰(zhàn)了之前關(guān)于Cas13如何進(jìn)化的假設(shè)。相反,努力修改AlphaFold模型架構(gòu)以包含更多先驗(yàn)知識(shí),導(dǎo)致性能更差。這突出了準(zhǔn)確性和可解釋性之間可能發(fā)生的權(quán)衡,但也展示了AI系統(tǒng)如何推進(jìn)科學(xué)理解,不是盡管它們的不透明性,而是因?yàn)樗鼈兊牟煌该餍裕驗(yàn)檫@種不透明性可能源于它們在高維空間中操作的能力,這可能對人類來說是不可解釋的,但對科學(xué)突破是必要的。

4. 公平

人工智能會(huì)使科學(xué)對邊緣群體的代表性和有用性減少嗎?

不公平在科學(xué)勞動(dòng)力中明顯可見,在他們研究的問題中,在他們開發(fā)的數(shù)據(jù)和模型中,以及在結(jié)果的好處和傷害中。這些不公平是相關(guān)的,并且可以隨著時(shí)間的推移而復(fù)合。例如,少數(shù)實(shí)驗(yàn)室和個(gè)人在高收入城市占了科學(xué)產(chǎn)出的不成比例的份額。確定與疾病相關(guān)的遺傳變異的研究嚴(yán)重依賴于歐洲血統(tǒng)群體的數(shù)據(jù),而忽視了熱帶疾病,這些疾病在貧窮國家中的比例過高。在農(nóng)業(yè)方面,作物創(chuàng)新集中在高收入國家最常見的害蟲上,然后不恰當(dāng)?shù)赜糜诓煌οx的低收入國家,損害了產(chǎn)量。盡管有積極的趨勢,女性僅占科學(xué)家的33%,在臨床試驗(yàn)中長期代表性不足,特別是有色女性。

觀察家擔(dān)心,AI在科學(xué)中的日益增長的使用可能加劇這些不公平。AI和計(jì)算機(jī)科學(xué)勞動(dòng)力在性別、種族和領(lǐng)先實(shí)驗(yàn)室的位置方面比許多其他科學(xué)學(xué)科更不具代表性,因此AI的日益增長的使用可能會(huì)損害科學(xué)中的更廣泛代表性。作為一種數(shù)據(jù)驅(qū)動(dòng)的技術(shù),AI也冒著繼承和加劇科學(xué)數(shù)據(jù)集中的偏見的風(fēng)險(xiǎn)。

然而,也有機(jī)會(huì)使用AI減少科學(xué)中的不公平,盡管這不是系統(tǒng)性變化的替代品。如果AI模型通過低成本服務(wù)器或數(shù)據(jù)庫提供,它們可以更容易、更便宜地讓科學(xué)家,包括來自邊緣群體的科學(xué)家,研究傳統(tǒng)上被忽視的問題,類似于釋放更多衛(wèi)星數(shù)據(jù)導(dǎo)致來自邊緣社區(qū)的更多研究。通過吸收更多的數(shù)據(jù),AI模型也可能能夠?qū)W習(xí)科學(xué)家研究的復(fù)雜系統(tǒng)的更普遍模式,使這些模型更健壯,更不容易受到偏見的影響。例如,由于它們的非代表性數(shù)據(jù),確定與疾病相關(guān)的遺傳變異的研究可能會(huì)挑選出混雜的,而不是因果的變異。相反,一些早期嘗試在更大的蛋白質(zhì)結(jié)構(gòu)和遺傳變異數(shù)據(jù)集上訓(xùn)練AI模型,包括跨物種的數(shù)據(jù),表現(xiàn)更好,在預(yù)測個(gè)體疾病風(fēng)險(xiǎn)方面差異較小,跨人群群體。最終,改善公平將需要長期的努力,如基因組學(xué)中的H3Africa倡議和AI的深度學(xué)習(xí)Indaba倡議,旨在在最缺乏的地方建立科學(xué)基礎(chǔ)設(shè)施、社區(qū)和教育。

5. 環(huán)境

人工智能會(huì)傷害還是幫助實(shí)現(xiàn)凈零努力?

鑒于他們對自然世界的理解愿望,許多科學(xué)家長期以來一直活躍在保護(hù)環(huán)境的努力中,從提供關(guān)于氣候變化的早期證據(jù)到開發(fā)光伏電池。近年來,越來越多的科學(xué)家對AI對環(huán)境的潛在影響表示擔(dān)憂,并開發(fā)了方法來嘗試量化這些影響。大多數(shù)關(guān)注集中在訓(xùn)練和使用LLM對溫室氣體排放的潛在影響上,以及與此相關(guān)的擔(dān)憂,如冷卻數(shù)據(jù)中心所需的水資源。思考這些影響的一種方式是生命周期方法,它涵蓋了直接和間接影響。直接影響包括建造和為AI模型訓(xùn)練和運(yùn)行的數(shù)據(jù)中心和設(shè)備供電的排放。沒有全面的估計(jì)所有直接排放來自AI。

然而,2021年的一項(xiàng)估計(jì)表明,云和超大規(guī)模數(shù)據(jù)中心,許多大型AI模型在這里訓(xùn)練和部署,占全球排放量的0.1-0.2%。

隨著LLM的規(guī)模繼續(xù)增長,觀察家警告說,這些數(shù)字可能會(huì)增加,可能顯著增加。然而,包括科學(xué)家在內(nèi)的許多LLM用戶將能夠微調(diào)它們,或者以相對較低的計(jì)算成本使用它們的預(yù)測,而不是從頭開始訓(xùn)練它們。還在進(jìn)行努力使LLM更有效,數(shù)字技術(shù)的歷史表明,可能獲得相當(dāng)大的增益,尤其是由于提供更快、更便宜的AI模型的商業(yè)壓力。在某些情況下,AI模型的排放將低于其他方法。例如,我們的內(nèi)部分析表明,實(shí)驗(yàn)確定少量(<10)蛋白質(zhì)的結(jié)構(gòu)使用的能源與AlphaFold 2的完整訓(xùn)練運(yùn)行大致相同。這些結(jié)果需要仔細(xì)解釋,因?yàn)锳I模擬依賴于,并通知物理實(shí)驗(yàn),而不是替代它們。但它們也展示了AI如何使更多的科學(xué)活動(dòng)以更低的平均能源成本成為可能。

至關(guān)重要的是,AI對排放的直接影響,無論是積極的還是消極的,可能與AI啟用的應(yīng)用程序?qū)ε欧诺拈g接影響相比都是次要的。在科學(xué)中使用AI開辟了三個(gè)主要機(jī)會(huì)來減少排放。首先,AI、數(shù)學(xué)和計(jì)算機(jī)科學(xué)之間的進(jìn)展可能顯著提高互聯(lián)網(wǎng)的效率,從設(shè)計(jì)更有效的芯片到尋找例行任務(wù)的更有效算法。隨著越來越多的經(jīng)濟(jì)體在線移動(dòng),這應(yīng)該有助于抵消這些部門的排放。AI可以加速可再生能源的開發(fā)和使用,例如通過設(shè)計(jì)新材料,如電池或太陽能電池板,通過優(yōu)化電網(wǎng)的運(yùn)行以及它如何整合可再生能源,以及通過更變革性但不確定的機(jī)會(huì),如聚變。最后,世界已經(jīng)變得更暖和,AI可以幫助更好地準(zhǔn)備極端天氣事件。例如,我們的天氣預(yù)報(bào)模型最近正確預(yù)測,七天前,致命的颶風(fēng)Beryl將在德克薩斯州登陸。非AI模型最初預(yù)測在墨西哥登陸,然后在它發(fā)生前三天糾正他們的預(yù)測到德克薩斯州。

Part D: 政策響應(yīng)

鑒于科學(xué)進(jìn)展對幾乎每一個(gè)主要的經(jīng)濟(jì)、環(huán)境和安全目標(biāo)都至關(guān)重要,因此科學(xué),以及AI加速它的潛力,應(yīng)該是任何政府的首要任務(wù)。一個(gè)新的AI for Science政策議程應(yīng)該是什么樣子?政策制定者可以開始實(shí)施許多已經(jīng)存在的良好科學(xué)和創(chuàng)新政策理念,在AI啟用的科學(xué)時(shí)代,這些理念甚至更有意義。例如,AI將提高科學(xué)研究資金的回報(bào),因此它為投資更多提供強(qiáng)有力的理由,并嘗試新的想法,以加快和實(shí)驗(yàn)如何分配這些資金。在計(jì)算方面,政府可以實(shí)施英國獨(dú)立審查中提出的想法,授權(quán)一個(gè)專門機(jī)構(gòu)不斷評估和建議政府可能的投資。為了支持AI for Science初創(chuàng)公司,政策制定者可以改善他們的衍生政策,并支持管理良好的初創(chuàng)公司孵化器和獎(jiǎng)學(xué)金。

但也需要雄心勃勃的新政策來利用AI for Science的機(jī)會(huì)。我們下面分享四個(gè)想法。它們旨在廣泛適用,盡管確切的細(xì)節(jié)需要根據(jù)國家的具體背景進(jìn)行調(diào)整,考慮到國家優(yōu)先事項(xiàng)、獨(dú)特優(yōu)勢和制度環(huán)境。

1. 為AI在科學(xué)中定義“希爾伯特問題”

科學(xué)進(jìn)展取決于選擇正確的問題。在1900年,德國數(shù)學(xué)家大衛(wèi)·希爾伯特發(fā)表了23個(gè)未解決的問題,這些問題被證明對20世紀(jì)數(shù)學(xué)的方向產(chǎn)生了巨大影響。作為即將到來的國際事件的一部分,如巴黎的AI行動(dòng)峰會(huì),政策制定者、AI實(shí)驗(yàn)室和科學(xué)資助者可以發(fā)起一個(gè)公眾呼吁,讓科學(xué)家和技術(shù)專家識(shí)別最重要的AI塑造的科學(xué)問題,由一個(gè)新的全球基金支持,以推動(dòng)這些問題的進(jìn)展。提交應(yīng)該指定為什么問題很重要,為什么它適合現(xiàn)代AI系統(tǒng),為什么它可能被忽視,存在的數(shù)據(jù)瓶頸,以及如何評估近期技術(shù)進(jìn)展。

最佳理念可以形成新的科學(xué)競賽的基礎(chǔ),科學(xué)家們競爭使用AI解決這些問題,支持新的數(shù)據(jù)集、評估方法和競爭基準(zhǔn)。這些可以建立在最近出現(xiàn)的評估AI模型科學(xué)能力的競賽的熱潮之上,并包括一個(gè)新的AI for Science奧林匹克,吸引來自世界各地的杰出年輕人才進(jìn)入該領(lǐng)域。除了其直接影響,AI for Science“希爾伯特問題”倡議可以為國際科學(xué)合作和資助提供一個(gè)受歡迎的焦點(diǎn),并激勵(lì)新一代的跨學(xué)科科學(xué)家識(shí)別和追求AI塑造的問題。

2. 使世界對科學(xué)家可讀

大多數(shù)科學(xué)數(shù)據(jù)未被收集、部分、未管理或無法訪問,使其無法用于訓(xùn)練AI模型。沒有單一的政策回應(yīng)遠(yuǎn)遠(yuǎn)不是統(tǒng)一的挑戰(zhàn)。政策制定者和資助者需要將少數(shù)自上而下的舉措與擴(kuò)大有希望的基層努力的支持相結(jié)合。應(yīng)該建立一個(gè)新的AI for Science Data Observatory國際網(wǎng)絡(luò),以幫助解決這些目標(biāo)。這些天文臺(tái)可以長期支持,并任務(wù)是運(yùn)行快速的AI for Science“數(shù)據(jù)庫存”,其中專家團(tuán)隊(duì)繪制優(yōu)先學(xué)科和應(yīng)用領(lǐng)域的數(shù)據(jù)狀態(tài)。庫存可以識(shí)別現(xiàn)有的數(shù)據(jù)集,如序列讀取存檔,其質(zhì)量可以進(jìn)一步提高,以及未開發(fā)或未充分利用的數(shù)據(jù)集,如目前對科學(xué)家或領(lǐng)先的生物多樣性數(shù)據(jù)不可用的數(shù)十年的實(shí)驗(yàn)聚變數(shù)據(jù),這些數(shù)據(jù)受到限制性許可條件的制約。庫存還可以包括新的“數(shù)據(jù)愿望清單”。例如,我們的內(nèi)部分析表明,不到7%的關(guān)鍵環(huán)境研究領(lǐng)域的論文使用AI。我們最近資助了Climate Change AI,以識(shí)別如果可用或改進(jìn),可以消除更多AI使用瓶頸的數(shù)據(jù)集。為確保這一分析導(dǎo)致行動(dòng),政策制定者應(yīng)指定和授權(quán)組織負(fù)責(zé)解決數(shù)據(jù)庫存的結(jié)果。

天文臺(tái)還可以規(guī)劃創(chuàng)建新的數(shù)據(jù)庫,包括確保充分考慮其長期存儲(chǔ)、維護(hù)和激勵(lì)措施。這可能包括新數(shù)據(jù)庫,以安全存儲(chǔ)當(dāng)前丟棄的戰(zhàn)略濕實(shí)驗(yàn)室實(shí)驗(yàn)的結(jié)果,輔以使這些實(shí)驗(yàn)結(jié)果的沉積成為公共研究資金的要求。或數(shù)字化更多的公共檔案,遵循英國政府和自然歷史博物館最近合作數(shù)字化其自然歷史收藏的例子,其中包含超過1.37億件物品,從蝴蝶到豆科植物,跨越46億年的歷史。政策制定者還可以授權(quán)科學(xué)家使用LLM創(chuàng)建和改進(jìn)自己的數(shù)據(jù)集,確保公共資助的研究默認(rèn)情況下是開放的,盡可能,建立在英國、美國和日本最近的示例之上,包括通過預(yù)印本服務(wù)器發(fā)布研究的授權(quán)。政策制定者可以尋求與行業(yè)和慈善事業(yè)共同資助最雄心勃勃的數(shù)據(jù)集舉措。

3. 教授AI作為下一個(gè)科學(xué)儀器

在過去的半個(gè)世紀(jì)中,隨著科學(xué)技術(shù)的數(shù)量增長,大多數(shù)科學(xué)家與它們的距離也在增長。許多技術(shù)是科學(xué)的產(chǎn)物,但越來越少的科學(xué)家接受過如何有效地開發(fā)和使用它們的培訓(xùn)。迫切的近期需求是資助和激勵(lì)更短的、更戰(zhàn)術(shù)性的AI培訓(xùn)計(jì)劃和獎(jiǎng)學(xué)金,針對現(xiàn)有的科學(xué)家和研究領(lǐng)導(dǎo)者。政策制定者可以通過設(shè)定一個(gè)明確的目標(biāo)來激勵(lì)這些努力,即每個(gè)研究生科學(xué)學(xué)生都應(yīng)該能夠接受有關(guān)在科學(xué)中使用AI的入門課程,包括他們領(lǐng)域最重要的工具,就像今天通常教授基礎(chǔ)統(tǒng)計(jì)學(xué)一樣。所需的培訓(xùn)類型和深度將取決于個(gè)人的學(xué)科和個(gè)人資料,可能從基本的入門課程,了解如何可靠地使用LLM進(jìn)行日常研究任務(wù),到更高級的課程,了解如何在科學(xué)數(shù)據(jù)上微調(diào)AI模型,以及如何解決更復(fù)雜的挑戰(zhàn),如評估他們用來測試模型性能的數(shù)據(jù)是否故意或無意地“泄露”到用于訓(xùn)練它的數(shù)據(jù)中。

這些計(jì)劃可以建立在既定的例子之上,如劍橋大學(xué)的Accelerate計(jì)劃,為博士和博士后研究人員提供結(jié)構(gòu)化的AI培訓(xùn),或The Carpentries提供的短期課程,涵蓋進(jìn)行研究所需的編程、數(shù)據(jù)和計(jì)算技能。

政策制定者還需要迅速采取行動(dòng),確保下一代科學(xué)家擁有他們需要的技能。這意味著將AI培訓(xùn)和技能發(fā)展納入所有級別的科學(xué)教育主流。中學(xué)科學(xué)學(xué)生將需要早期接觸AI的影響,而大學(xué)生將需要獲得新的跨學(xué)科AI科學(xué)學(xué)位的機(jī)會(huì),如我們與非洲數(shù)學(xué)科學(xué)研究所合作開發(fā)的泛非AI for Science碩士課程。還可以提供專門的獎(jiǎng)學(xué)金。例如,英國的BIG獎(jiǎng)學(xué)金計(jì)劃為高中學(xué)生提供了杰出的機(jī)會(huì),重點(diǎn)是那些在國際科學(xué)奧林匹克競賽中表現(xiàn)出色的來自代表性不足群體的學(xué)生,他們希望繼續(xù)在領(lǐng)先的科學(xué)中心學(xué)習(xí),但缺乏資金。

4. 建立證據(jù)并嘗試新的科學(xué)組織方式

科學(xué)家對AI的使用呈指數(shù)級增長,但政策制定者幾乎沒有證據(jù)表明誰做得最好,他們?nèi)绾巫觯约白璧K他人的障礙。這種證據(jù)差距是確定最佳AI for Science政策理念并有效針對它們的障礙。歷史上,這些問題的答案通常來自經(jīng)濟(jì)學(xué)或創(chuàng)新研究領(lǐng)域,但結(jié)果可能需要數(shù)年才能到來。我們使用引文數(shù)據(jù)分析、訪談和社區(qū)參與來了解科學(xué)家如何使用我們的AI模型。政府也在投資這些元科學(xué)能力,以改善他們資助、共享和評估科學(xué)研究的方式。在此基礎(chǔ)上,科學(xué)家可以被賦予一個(gè)任務(wù),快速評估基礎(chǔ)政策問題,包括:最有影響力的AI for Science研究發(fā)生在哪里,哪些類型的組織、人才、數(shù)據(jù)集和評估使其成為可能?科學(xué)家在多大程度上使用和微調(diào)LLM與更專業(yè)的AI模型,以及他們?nèi)绾卧L問這些模型?AI實(shí)際上在多大程度上有益于或損害了科學(xué)創(chuàng)造力、可靠性、環(huán)境或其他領(lǐng)域?AI如何影響科學(xué)家對他們的工作的看法,以及哪些技能、知識(shí)差距或其他障礙阻止了他們更廣泛地使用AI?

除了為堅(jiān)實(shí)的政策回應(yīng)提供信息外,這個(gè)證據(jù)基礎(chǔ)還將為政策制定者提供他們需要的先見之明,以預(yù)測AI如何轉(zhuǎn)變科學(xué)和社會(huì),類似于他們通過不斷增長的AI安全研究所網(wǎng)絡(luò)為AI安全風(fēng)險(xiǎn)發(fā)展的先見之明。證據(jù)還將突出重新構(gòu)想科學(xué)在AI時(shí)代所需的激勵(lì)和機(jī)構(gòu)的機(jī)會(huì)。特別是,科學(xué)家和政策制定者只探索了一小部分可能的科學(xué)研究組織和執(zhí)行方法。AI的興起提供了一個(gè)受歡迎的強(qiáng)制功能,以嘗試新的機(jī)構(gòu)類型,從那些有更多自由追求高風(fēng)險(xiǎn)、高回報(bào)研究的機(jī)構(gòu),到旨在解決特定瓶頸的專注研究組織。以及新的跨學(xué)科AI科學(xué)研究所在優(yōu)先領(lǐng)域,如氣候或糧食安全,以及我們尚未想象的完全新型機(jī)構(gòu)。那些更快嘗試的人將從新的發(fā)現(xiàn)黃金時(shí)代中獲益最多。

.END.

圖片來源|網(wǎng)絡(luò)

聲明:該文章版權(quán)歸原作者所有,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問題,請?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系。
您閱讀這篇文章花了0
轉(zhuǎn)發(fā)這篇文章只需要1秒鐘
喜歡這篇 194
評論一下 0
凱派爾知識(shí)產(chǎn)權(quán)全新業(yè)務(wù)全面上線
相關(guān)文章
評論
登錄后發(fā)表評論
凱派爾知識(shí)產(chǎn)權(quán)全新業(yè)務(wù)全面上線
寧波城市站
金華城市站
×
#熱門搜索#
精選雙創(chuàng)服務(wù)
歷史搜索 清空

Tel:18514777506

關(guān)注微信公眾號

創(chuàng)頭條企服版APP

china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网
99视频有精品| 欧美一级一区二区| 91精品国产美女浴室洗澡无遮挡| 精品成人一区二区三区| 一区二区成人在线视频| 国产一区二区女| 欧美挠脚心视频网站| 国产精品色噜噜| 久久精品99久久久| 欧美午夜精品久久久久久孕妇| 久久久久国产成人精品亚洲午夜| 偷拍一区二区三区四区| 91网站视频在线观看| 久久综合成人精品亚洲另类欧美 | 亚洲在线视频网站| 国产成都精品91一区二区三| 制服丝袜一区二区三区| 一区二区三区在线播| 成人精品视频.| 久久久噜噜噜久久人人看 | 欧美亚洲图片小说| 国产精品狼人久久影院观看方式| 激情综合色播五月| 91精品综合久久久久久| 亚洲伦在线观看| 成人高清免费观看| 国产欧美日韩不卡| 韩国av一区二区三区在线观看| 91精品欧美一区二区三区综合在| 亚洲一区二区高清| 91福利在线导航| 中文字幕综合网| 国产99久久久国产精品 | 黄页视频在线91| 欧美一级黄色片| 日韩av一区二区在线影视| 欧美精品久久99| 日韩中文欧美在线| 在线不卡免费欧美| 日本午夜精品一区二区三区电影 | 一区二区三区加勒比av| 91久色porny | 精品国产三级电影在线观看| 免费av成人在线| 欧美变态口味重另类| 九色综合狠狠综合久久| 久久综合久久鬼色中文字| 国产美女精品一区二区三区| 久久久久久亚洲综合| 国产精品一二三| 欧美国产日韩精品免费观看| 福利一区二区在线观看| 国产精品久久久久久久岛一牛影视 | 国产精品一卡二卡在线观看| 久久久久久久久岛国免费| 国产精品综合av一区二区国产馆| 精品人在线二区三区| 韩国理伦片一区二区三区在线播放| 精品精品国产高清一毛片一天堂| 国模一区二区三区白浆| 国产视频一区不卡| 99麻豆久久久国产精品免费| 亚洲免费毛片网站| 欧美四级电影网| 日本不卡视频一二三区| 日韩三级免费观看| 国产一区激情在线| 国产精品色哟哟| 91久久精品一区二区| 午夜成人免费视频| 欧美电视剧在线观看完整版| 国产精选一区二区三区| 国产精品电影院| 欧美优质美女网站| 琪琪久久久久日韩精品| 久久夜色精品国产欧美乱极品| 国产一区二区三区免费| 国产精品久久久久久久第一福利| 欧美做爰猛烈大尺度电影无法无天| 午夜伦欧美伦电影理论片| 日韩视频一区二区| 粉嫩嫩av羞羞动漫久久久| 一区二区三区日韩欧美| 欧美肥大bbwbbw高潮| 国产一区视频网站| 亚洲精品乱码久久久久久久久| 在线播放91灌醉迷j高跟美女| 精品一区二区精品| 中文字幕欧美一区| 91精品在线观看入口| 国产传媒久久文化传媒| 一区二区三区国产精华| 精品国免费一区二区三区| 波多野结衣中文字幕一区| 亚洲国产aⅴ天堂久久| 精品国产乱码久久久久久1区2区 | 欧美日韩一卡二卡| 久久不见久久见免费视频1| 国产精品人成在线观看免费| 欧美三级中文字幕| 国产最新精品精品你懂的| 亚洲视频一二三区| 日韩视频在线一区二区| 99久久99久久精品国产片果冻| 亚洲成av人片在线观看无码| 久久久久国产精品免费免费搜索| 91久久精品一区二区二区| 国内外成人在线| 亚洲精品国产一区二区精华液 | 亚洲国产精品欧美一二99| 精品国产91久久久久久久妲己 | 久久女同性恋中文字幕| 在线视频欧美精品| 国产精品中文欧美| 亚洲成人1区2区| 中文天堂在线一区| 欧美一区二区日韩一区二区| 99vv1com这只有精品| 久久99久久99小草精品免视看| 亚洲激情图片一区| 久久精品亚洲麻豆av一区二区 | 日韩电影一区二区三区| 成人免费在线视频| 精品少妇一区二区三区 | 亚洲男人都懂的| 久久综合狠狠综合久久综合88| 欧美三日本三级三级在线播放| 成人午夜在线免费| 另类小说综合欧美亚洲| 亚洲一区二区五区| 国产精品久久久久久久第一福利| 日韩久久久精品| 欧美日韩一区在线| 91丨porny丨国产入口| 国产一区二区在线影院| 日本女优在线视频一区二区| 亚洲精品欧美激情| 亚洲欧洲在线观看av| 久久综合999| 日韩欧美视频一区| 欧美日本在线播放| 欧洲激情一区二区| 色域天天综合网| eeuss鲁片一区二区三区在线观看| 久久精品国产99| 免费av网站大全久久| 午夜电影久久久| 日韩欧美的一区| 亚洲精品一区二区三区影院| 色欧美片视频在线观看| 国产99精品国产| 久久福利资源站| 亚洲成人精品在线观看| 中文字幕亚洲一区二区va在线| 久久综合久久综合亚洲| 日韩免费电影一区| 欧美一级欧美三级在线观看| 91传媒视频在线播放| 99视频精品免费视频| 成人免费视频免费观看| 国产高清精品网站| 国产一区二区0| 国产一区中文字幕| 国产精品综合网| 国产一区二区福利视频| 激情成人午夜视频| 国模少妇一区二区三区| 国产一区二区看久久| 国产黄色成人av| 国产精品888| 国产成人夜色高潮福利影视| 国产精品影视在线观看| 国产精品白丝av| 国产视频一区二区在线| 5858s免费视频成人| 欧美日韩一区二区三区四区| 欧美在线一二三| 欧美综合视频在线观看| 欧洲另类一二三四区| 欧美日韩视频第一区| 欧美美女激情18p| 欧美一区午夜视频在线观看| 欧美一区二区视频在线观看2020| 欧美日韩三级一区| 在线观看91av| 日韩欧美卡一卡二| 欧美精品一区二区在线观看| 久久日一线二线三线suv| 久久精品亚洲精品国产欧美 | 中文字幕在线不卡一区 | 99久久久精品免费观看国产蜜| 99精品视频一区| 欧美中文一区二区三区| 欧美日韩成人综合天天影院| 欧美顶级少妇做爰| 久久美女艺术照精彩视频福利播放| 欧美经典一区二区| 亚洲欧美一区二区三区孕妇| 亚洲国产精品影院| 久久国内精品自在自线400部|