本文作者ZAVAIN DAR, Lux Capital 投資人。
1. 過去二十年,在大數據集的數字化、建立管理大數據集的基礎框架和大數據計算范式上的進展,是解釋本世紀先后將重點放在數據科學和人工智能上的主要原因。
2. 一旦我們數字化了數據,使得他們可以被程序處理,下一步就是撬動自動化和對未來的預測。隨著預測能力的增加,似乎更多 " 智能 " 的方面展現了出來。于是我們將 " 數據科學 " 這樣的術語改為 " 人工智能 "。事實上這二者之間并沒有什么明顯的差別,只是感覺上的新奇和困難程度不同而已。新奇度和難度隨著時間是呈正態分布。今天 " 人工智能 " 給人的感覺就和昨天的 " 數據科學 " 一樣。
3. 從數據中學習的 AI 叫做機器學習(Machine Learning)。傳統的機器學習從原始數據中提取人們可以識別的特征,然后通過學習這些特征產生一個最終的模型。
4. 過去十年中,神經網絡,一種類似哺乳動物大腦突觸連接關系的機器學習結構,得以復興。神經網絡不需要人為提取特征。原始數據進入學習算法之后不需要任何的人為工作,我們把它稱之為 " 深度學習 "。
5. 盡管深度學習技術和學習模型已經存在了幾十年了,但是我們現在才看到其理論創新和基于經驗的突破,因為基礎架構和數據的實用性才剛剛成熟。2006 年,NVIDIA 推出基于 GPU 的 CUDA 開發平臺,成為了深度學習發展歷史上的風水嶺。
6. 正是由于深度學習脫離了人為構建特征使其得以成為一種自然的學習工具。很多技能,早在有能力以復雜的數學方式提取特征之前,我們就已經學會了。這些技能是我們自然而然學會的,難以用高度的特征歸納。通過傳統的機器學習手段,是很難憑人類的直覺得出,或是構造出高維的精確特征的。
7. 早在我們有能力構建復雜的語義(semantic)之前,我們就已經在機器視覺和自然語言處理等方面取得了很好的成績。但是學會這些技能不需要我們有數學推理的能力,更不要說人為有意構建的高層語義了。
8. 深度學習在廣義的高維機器學習問題上已經展現了突破性的成果。其中覆蓋的領域包括基因組學,油氣,數位病理學甚至是公共市場。
9. 近期關于人工智能的不實傳言引發了人們對于 AGI 的爭論。AGI 是人們假設出的擁有像人一樣的智慧的計算機,各方面都能和人類比肩的強人工智能。
10. 這很大程度上得益于深度學習在基本的人類技能上取得的重大突破和進展。比如機器視覺和自然語言處理等。
11. 在未來一段時間內,這些努力都會被存于各個筒倉之內,也就是說不同小組之間相互獨立地在各自領域內努力著。
12. 會使我們開發 AGI 的速度遭遇瓶頸的,并不是任何一個筒倉,而是讓他們彼此協作的能力,和建立合適的聯系外界的輸入輸出通道。第一款 AGI 不會是一個有人類實體的機器人,而會出現在網上,這樣它就可以接收世界上的知識,擁有通過網絡的交流能力。
13.AGI 會擁有類似人類的智力,但是卻不會有類似人類的外表,因為我們并不了解自己內在的 " 目標函數 "。目前,我們在特定的領域內訓練計算機,使他們犯的錯誤最小化。除非我們知道我們自己的目標函數是如何校準的,否則,即使 AGI 會很智能甚至有可能會有意識的展現,但也絕對不會完全像人一樣。
14.2025 年以后出生的小孩會認為軟件是有自己的意識的。這比大多數人想的都要來的更加突然和迅速。
15. 人們會通過輸入輸出的通道來限制和規范 AGI 的行為。未來會有很多關于 AGI 善惡的爭論,關于增加其好的能力是否會同時使其產生潛在的惡意行為。無人駕駛汽車是一個早期、但是很有力的例子。
16.AI 創業公司正處在創新和獲得資金增長周期之中。
17.AI 學習技術和算法的商品化速度遠比我們想象的快。目前比較成功的創業公司,都獲取到了獨特的數據,并且不斷地利用 AI 模型從用戶和企業之間的交互學習,加強他們的初期優勢。比較著名的例子是 Google 通過點擊率數據,將其作為一個私有的數據源和一種學習交互方式來幫助他們改進排名。
18. 我們仍然在人工智能的春天。大科技公司會付大筆的錢收購那些有新成果的小團隊。這些新的成果,如果最后在外部成熟,對大科技公司來說會產生生存危機,這為我們看到的這些高價收購提供了合理的解釋。
19. 提供人工智能工具的公司需要建立更有吸引力的平臺來對抗 " 商品化 ",從而獲得值得資本投入的成果。
20. 未來五年,硅谷的言論會發生改變,從 Marc Andreessen 的 " 思達派專注創業干貨分享,歡迎各位創業者和投資人聯系我們: 1、分享創業干貨(投稿&申請新聞報道) 2、專業團隊提供免費公關咨詢服務 相關需求,發送相關內容至ganhuo@startup-partner.com,我們會第一時間與你聯系。 本文轉自36氪