原標題:AI發(fā)展的過程
我們知道,如今AI技術(shù)在各國科學界都有著很高的人氣,幾乎所有的科技界都在研究AI技術(shù),那我們今天就來探討AI之路的發(fā)展歷程。在這里我們首要要知道首輪AI熱潮是什么時候開始的?第一輪的AI熱潮起源于2006年,當時多倫多大學的杰弗里教授發(fā)表了三篇關(guān)于人工智能領(lǐng)域深度學習的論文,并且提出了深度信念網(wǎng)絡(luò)。雖然迄今為止該網(wǎng)絡(luò)結(jié)構(gòu)的應(yīng)用項目并不太多,但是在當時卻可以打破了神經(jīng)網(wǎng)絡(luò)聯(lián)結(jié)主義高達十年的消沉,并且開啟了神經(jīng)網(wǎng)絡(luò)的新時代"深度學習"的時代 。
說到深度學習我們必須要提一下AlphaGo,在2016年谷歌公司研發(fā)的機器人的圍棋程序AlphaGo以4:1的結(jié)果大勝了韓國著名的圍棋高手李世石,這個新聞引起了媒體和大眾對人工智能的極大關(guān)注。這個新聞幾乎是人工智能最火爆的一次亮相,但是很少有人知道Alpha Go的歷史和它是如何被研發(fā)出來的。
AlphaGo起源于Atari一個古老的電視機游戲,在2012年,Deepmind用攝像頭對準了電視機讓人工智能程序玩Atari并通過計算機視覺和強化學習讓機器學習控制這個游戲,并且盡量得到更多的得分。而這個游戲的得分要求只要將球反彈到消除色磚就能夠獲得獎勵。為了讓程序得分,當時的工程師讓這個AI程序訓練了四個小時,在訓練完之后AI已經(jīng)發(fā)現(xiàn)了一個贏球的秘訣就是將左邊磚塊打破,再讓其反彈就可以消除大量的磚塊得分。結(jié)果,這個AI程序打贏了人類玩家,這個消息一出引起了大量計算機科學家對AI技術(shù)的研究。
其實在上述這個AI程序中,工程師在訓練的時候運用到了行為主義的強化學習。那何為行為主義呢?大家都知道一個實驗叫做"巴甫洛夫的狗"實驗,在這個實驗中,同時也放進了一個貓作為實驗的個體。在這個實驗中,狗是完全被動的測試對象,它的工作只是聽聲音當聽到聲音的時候就會流口水。而貓的選擇則是被關(guān)在一個籠子里,而這個籠子里面有個開關(guān),當貓按下這個按鈕后,籠子的門就會被打開。當?shù)谝淮呜埍魂P(guān)進籠子之后,它花了很長的時間才按動了開關(guān),逃出籠子。而當?shù)诙畏胚M去之后,貓直接按下了開關(guān),逃出了籠子。
從以上的例子,我們引申到人工智能領(lǐng)域可以得出這么一個結(jié)論:在一個人工智能的世界里面,我們無法通過語言來理解一個人在想什么,而只有行為才能夠被客觀的研究和觀察。換言之,在研發(fā)AI技術(shù)的時候我們工程師并不關(guān)心AI有什么想法,而應(yīng)該關(guān)注AI是怎么做的。而在未來的機器學習發(fā)展過程中,可能是以強化學習和非監(jiān)督學習為主,而一些深度學習的模型中已經(jīng)融入到了非監(jiān)督的機器學習里面,而AlphaGO則是強化學習和深度學習的產(chǎn)物。
歡迎關(guān)注MiHomes,將持續(xù)為您推送高質(zhì)量科技資訊。返回搜狐,查看更多
責任編輯: