大數據與人工智能結合在一起,會碰撞出什么樣的火花?7月3日,思達派&創頭條在俠客島聯合辦公室舉辦的“創派對第二期之人工智能的文藝復興”活動上,來自納人的葉思和來自百度的夏粉兩位專家,就大數據+人工智能的現狀與未來進行了分享。
夏粉向大家介紹,了解人工智能的前提是了解機器學習。
機器學習主要經歷了兩個發展階段:第一個階段稱為“演繹學習”——通過人給出的一些啟發性的規則,讓機器進行邏輯推理,再產生新的規則并加以使用;第二個階段稱為“統計機器學習”,是指通過建造很多樣本,讓機器從中發現并學習規律,再利用規律對未知事情進行推測。
“所以我們認為機器學習要解決的真正問題是預測,而不是經驗的分布。”夏粉說。超越人的思維,想到人未想到的事情,這才是真正意義上的智能。這種技術在行業應用當中也可以得到廣泛應用,比如預估廣告點擊率。
事實上,第二個階段中機器學習所需的樣本的來源,以及在已知規律對未來進行預測的基礎,都來自大數據。
一、人工智能的精準分析,幫助HR輕松招聘
以招聘為例,篩選簡歷時,人崗不匹配的問題很嚴重。優秀的企業簡歷多但質量都不高,不夠優秀的企業簡歷嚴重不足,招聘信息基本全公開、但信息嚴重不對等等方面。對此,除利用技術對海量簡歷和招聘職位進行篩選和匹配,分別向甲方和乙方推送合適的簡歷和職位以外,納人還自主研發招聘領域的垂直應用——機器學習。通過機器學習,動態地模擬,使得應用因甲方的重復使用變得越來越接近甲方的需求。
葉思是納人的產品專家,他向大家介紹說,機器學習加上對大數據的精準分析,使得企業在招聘過程中變得更高效,節省時間的同時降低成本,除此之外,精準的分析和推送還能為企業的招聘提供參考決策。
二、最廣泛的應用行業——廣告
據夏粉介紹,早在2008年,百度就已經把機器學習的算法用在廣告變現上。當然,對廣告的投放,也離不開對大數據的正確分析。
百度的機器學習讓數據產生價值主要經過三個環節:首先數據要在開放云當中進行存儲和運算;儲存之后的第一件事是通過數據工廠對數據源進行加工,讓數據變得計算機可認識,便于查找等;之后,百度大腦用來對數據做感知——比如圖像檢索等。
簡單說,這個大數據引擎對整個行業和應用的服務流程就是:百度數據+行業數據經過數據工廠和百度大腦的運算,產生行業價值,最終應用到行業當中去。
關于大數據的發展趨勢,夏粉認為主要是個性化和產業化兩個方面。
個性化主要是TO C方向,包括個性化營銷、個性化醫療、個性化服務等。
他認為未來人工智能技術可能比每個使用者都更了解自己,因為大數據的個性化可以為用戶“繪制”多維度畫像——比如通過對一個人經常購物的位置、家庭住址等大數據的分析,可以猜出一個人的收入等。所以“你是誰,你想干什么”這種哲學問題未來可能會被大數據加人工智能解決。個性化主要還是投入到廣告行業——根據用戶興趣和需求等展現廣告。
另一方面,產業化主要指TO B方向,包括智能連接(主要是實現人和信息的連接,比如O2O線上和線下的連接)、人機互補(表現在人與機器取長補短的過程,比如在計算方面人不如計算機,人們可以利用機器的計算能力獲得決策輔助)、數據創新(主要是針對如何更好的開發和利用數據)等。產業化趨勢的主要核心是為了提高效率。
三、大數據分析觸及到生活的方方面面
對大數據行業創新的探索還有許多,夏粉列舉了百度智慧城市管理的定位數據案例——通過對人群的定位分析等實現對人口的管理、城市規劃的優化等。除此之外,還可以用來做公共安全中的人群預警——比如防止踩踏事件的發生等。
另一個案例是智能選址——比如一個用戶在某地區搜索附近是否有麥當勞,事實上這位用戶已經在當前位置為麥當勞開店投了一票,票數越多了,說明此地對麥當勞的需求越強,諸如此類。
除以上這些案例,大數據還廣泛應用于旅游、智慧醫療、零售等行業。未來,更加高效和精準的服務將不斷通過人工智能加大數據來實現。