圖片來源@視覺中國
文丨學術頭條,作者丨朱哼哼,編審丨王新凱
提到人工智能機器人,大家會想到什么?
也許很多人會想到谷歌阿爾法狗,作為第一個擊敗人類職業圍棋選手、第一個戰勝人類圍棋世界冠軍的人工智能機器人,阿爾法狗當年可謂是火遍全球,“阿爾法圍棋”也成功入選了當年的中國媒體十大新詞。
相比于阿爾法狗,2008 年安德魯·斯坦頓編導、皮克斯動畫工作室制作的電影《機器總動員》中,可以像人類一樣獨立思考甚至自由戀愛的機器人瓦力和伊娃,或許更符合人們對人工智能的期待。
圖 | 瓦力(來源:disney)
值得關注的是,近日,來自日本東京大學的研究人員利用活體神經元開發的物理儲備池計算技術,就成功開發出了一款可以自主走迷宮的機器人。整個實驗過程,研究人員不斷通過電脈沖刺激機器人自主糾正方向,直至它成功走出迷宮。
與谷歌的阿爾法狗不同,這個機器人無法看到環境、無法感知環境也沒有經過任何走迷宮的學習,而完全是依賴干擾信號就可以完成走迷宮的目標。
對次,本研究通訊作者東京大學信息科學與技術研究院副教授 Hirokazu Takahashi表示,“這一研究結果表明,生命系統的智能或是一種自無序狀態或混亂狀態中提取的連續輸出機制。而通過提取混亂的神經元信號找到解決方案并儲存在儲備池中就是所謂的物理儲備池計算。一個小學生無法解決大學的數學問題,就是因為他們的’儲備池’不夠豐富。
相關研究以“Physical reservoir computing with FORCE learning in a living neuronal culture?”為題,發表在最新一起的?Applied Physics Letters?雜志上。
長期以來,人們一直認為智能并不是人類獨有,像人類一樣可以自主學習和推理的機器人是可以被制作出來的。然而,事情卻并沒有想象中的那么簡單。
所謂人工智能,也就是可以智能工作的機器。例如,阿爾法狗可以自主下棋并輕易擊敗人類圍棋冠軍。那么,阿爾法狗算是人工智能嗎?
顯然還不能夠,雖然它可以學習無數的棋譜,進行無數的訓練,輕易戰勝所有人類圍棋選手。但是,人類想要戰勝它也很簡單,就如網友評價那樣,直接拔掉它的電源就好了。畢竟它除了下圍棋,其他啥也不會。不像人類,在面對生命危險時會做出反抗或逃跑。
而之所以目前的人工智能都無法像人類一樣獨立學習和思考,很大程度上與目前人們開發人工智能的模式有關。
(來源:Pixabay)
一般情況下,在給電腦編寫程序之前,程序員知道他想讓電腦做的任務是什么。可是,在人工智能領域,程序員要求電腦做正確的事情,可同時又不是很清楚事情到底是什么。比如我們讓電腦去識別人臉,可是我們人類自己也不是完全清楚大腦是如何識別人臉的。
在現實世界中,人類不僅要面對還要處理種種不確定性事件。比如你在達到一個目標前,受到諸多困難,你需要排除萬難;你在駕車時,前方沖出一輛車,你需要轉動方向盤避免撞車;你在處理一項任務時,突然接到另一項重要任務,你需要隨機應變。一個智能的電腦程序不僅能夠按照既定計劃完成任務,還能確保在不確定事件發生的情況下完成任務。
所以,真正的人工智能,必須能夠不斷感知周圍環境的變化,并對此做出反應,適時改變和調整自己的行動,以期出色完成任務。
儲備池計算(Reservoir Computing)是近年來人工智能領域的一個新型概念,也叫 Echo state network,被視為是神經網絡(Neural Network)的一種拓展框架。
而所謂的物理儲備池計算,就是將給定物理系統(例如光子系統、神經系統、機械系統等)中的內在非線性動力學用作計算資源儲存。儲備池計算的一個神奇之處在于,中間層的儲備池矩陣是隨機生成的且生成后就保持不變,真正需要訓練的只有輸出層,這也使它比傳統的方法快很多。
圖 | 物理儲備池實驗系統示意圖(來源:AIP)
因此,簡單來說,物理儲備池計算就是給一個隨機鏈接的脈沖神經網絡(物理儲備池)一些輸入,然后用現有的機器學習的方法來學習這個網絡對于特定的輸入的模式,從而達到模式識別的目的。可以做一個類比,如果把脈沖神經網絡等同于大腦的神經回路的話,那么儲備池計算就是從大腦神經回路里接出幾個輸出,然后判斷這些連接輸出的神經元都以怎樣的模式活動并歸類,從而判別輸入端接受到了怎樣的信息。
為了在活的神經元中進行物理儲備池計算,研究人員開發了一個閉環系統來從自發活躍的神經元培養物中產生相干信號,操作移動機器人。神經元培養物在微電極陣列上生長,以方便細胞外信號測量。尖峰事件與半高斯核進行卷積以平滑信號,并將信號加權用于 FORCE 學習的輸出。
而反饋信號由光活性籠狀谷氨酸和 Rubi- 谷氨酸產生,使用 473 nm 藍光照射會打破籠裝結構,激活神經元細胞。在 FORCE 學習中通過 RLS 算法調整權重,使輸出信號變成目標常數信號。輸出信號與目標之間的偏差用于機器人控制,如果誤差為 0 則機器人向前移動,否則要么左轉、要么右轉。
此外,研究人員還開發了一套定制的程序,來處理尖峰數據以執行 FORCE 學習,并與機器人進行雙向通信。該程序可以根據 FORCE 學習的輸出調整藍光照射的時間,對神經元施加電刺激。最終,研究人員證實,通過 FORCE 學習不斷干擾神經元信號后,移動機器人成功走出了迷宮。
這一研究結果表明,通過向混沌的具體系統發送干擾信號,而無需任何額外的學習就可以生成目標導向行為,機器人無需感知環境,完全依賴電刺激也能出色的完成迷宮任務。
對于這一研究成果 Hirokazu Takahashi 教授表示,“物理儲備池計算可以幫助我們更好地了解人類大腦的工作機制,有利于創造像人類一樣思考的人工智能機器人。”
參考資料:
https://aip.scitation.org/doi/full/10.1063/5.0064771
https://www.eurekalert.org/news-releases/932479
更多精彩內容,關注鈦媒體微信號(ID:taimeiti),或者下載鈦媒體App
2022-09-14 鈦媒體 App發布了 《星巴克加碼中國市場,未來三年要新增開3000家門店|鈦快訊》的文章
2022-08-11 鈦媒體 App發布了 《白云山麾下公司虛抬藥價“把戲”,被拆穿了》的文章
2022-07-06 鈦媒體 App發布了 《為了幫00后卷王找到工作,簡歷修改師們拼了》的文章
2022-07-06 鈦媒體 App發布了 《威尼斯向游客收“進城費”,國內城市如何借鑒?》的文章
2022-03-25 鈦媒體 App發布了 《蔚來2021年財報發布:年營收361億元,整車毛利率達到20.1%》的文章