原創(chuàng) AI發(fā)展的過程

搜狐財經(jīng) 2019-09-14 14:00 搶發(fā)第一評

原標題：AI發(fā)展的過程

我們知道，如今AI技術(shù)在各國科學界都有著很高的人氣，幾乎所有的科技界都在研究AI技術(shù)，那我們今天就來探討AI之路的發(fā)展歷程。在這里我們首要要知道首輪AI熱潮是什么時候開始的？第一輪的AI熱潮起源于2006年，當時多倫多大學的杰弗里教授發(fā)表了三篇關(guān)于人工智能領(lǐng)域深度學習的論文，并且提出了深度信念網(wǎng)絡(luò)。雖然迄今為止該網(wǎng)絡(luò)結(jié)構(gòu)的應(yīng)用項目并不太多，但是在當時卻可以打破了神經(jīng)網(wǎng)絡(luò)聯(lián)結(jié)主義高達十年的消沉，并且開啟了神經(jīng)網(wǎng)絡(luò)的新時代"深度學習"的時代。

說到深度學習我們必須要提一下AlphaGo，在2016年谷歌公司研發(fā)的機器人的圍棋程序AlphaGo以4:1的結(jié)果大勝了韓國著名的圍棋高手李世石，這個新聞引起了媒體和大眾對人工智能的極大關(guān)注。這個新聞幾乎是人工智能最火爆的一次亮相，但是很少有人知道Alpha Go的歷史和它是如何被研發(fā)出來的。

AlphaGo起源于Atari一個古老的電視機游戲，在2012年，Deepmind用攝像頭對準了電視機讓人工智能程序玩Atari并通過計算機視覺和強化學習讓機器學習控制這個游戲，并且盡量得到更多的得分。而這個游戲的得分要求只要將球反彈到消除色磚就能夠獲得獎勵。為了讓程序得分，當時的工程師讓這個AI程序訓練了四個小時，在訓練完之后AI已經(jīng)發(fā)現(xiàn)了一個贏球的秘訣就是將左邊磚塊打破，再讓其反彈就可以消除大量的磚塊得分。結(jié)果，這個AI程序打贏了人類玩家，這個消息一出引起了大量計算機科學家對AI技術(shù)的研究。

其實在上述這個AI程序中，工程師在訓練的時候運用到了行為主義的強化學習。那何為行為主義呢？大家都知道一個實驗叫做"巴甫洛夫的狗"實驗，在這個實驗中，同時也放進了一個貓作為實驗的個體。在這個實驗中，狗是完全被動的測試對象，它的工作只是聽聲音當聽到聲音的時候就會流口水。而貓的選擇則是被關(guān)在一個籠子里，而這個籠子里面有個開關(guān)，當貓按下這個按鈕后，籠子的門就會被打開。當?shù)谝淮呜埍魂P(guān)進籠子之后，它花了很長的時間才按動了開關(guān)，逃出籠子。而當?shù)诙畏胚M去之后，貓直接按下了開關(guān)，逃出了籠子。

從以上的例子，我們引申到人工智能領(lǐng)域可以得出這么一個結(jié)論：在一個人工智能的世界里面，我們無法通過語言來理解一個人在想什么，而只有行為才能夠被客觀的研究和觀察。換言之，在研發(fā)AI技術(shù)的時候我們工程師并不關(guān)心AI有什么想法，而應(yīng)該關(guān)注AI是怎么做的。而在未來的機器學習發(fā)展過程中，可能是以強化學習和非監(jiān)督學習為主，而一些深度學習的模型中已經(jīng)融入到了非監(jiān)督的機器學習里面，而AlphaGO則是強化學習和深度學習的產(chǎn)物。

歡迎關(guān)注MiHomes，將持續(xù)為您推送高質(zhì)量科技資訊。返回搜狐，查看更多

責任編輯：

聲明：該文章版權(quán)歸原作者所有，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責。如涉及作品內(nèi)容、版權(quán)和其它問題，請在30日內(nèi)與本網(wǎng)聯(lián)系。

您閱讀這篇文章花了0秒

轉(zhuǎn)發(fā)這篇文章只需要1秒鐘哦