china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网

公眾號
關注微信公眾號
移動端
創頭條企服版APP

AI產品經理的好幫手——樸素貝葉斯

4439
頑皮木偶 2019-09-11 20:40 搶發第一評

貝葉斯定理相信不少人都接觸過,這個看似只屬于數學領域的定理,在AI產品經理看來有怎樣的魅力呢?

我們常常遇到這樣的場景。與友人聊天時,一開始可能不知道他要說什么,但是他說了一句話之后,你就能猜到接下來他要講什么內容。友人給的信息越多,我們越能夠推斷出他想表達的含義,這也是貝葉斯定理所闡述的思考方式。

貝葉斯定理得以廣泛應用是因為它符合人類認知事物的自然規律。

我們并非生下來就知道一切事情的內在的規律,大多數時候,我們面對的是信息不充分、不確定的情況。這個時候我們只能在有限資源的情況下,作出決定,再根據后續的發展進行修正。

一、樸素貝葉斯登場

貝葉斯分類是一類分類算法的總稱,這類算法均以“貝葉斯定理”為基礎,以“特征條件獨'立假設”為前提。而樸素貝葉斯分類是貝葉斯分類中常見的一種分類方法,同時它也是經典的機器學習算法之一。

在很多場景下處理問題直接又高效,因此在很多領域有著廣泛的應用,如垃圾郵件過濾、文本分類與拼寫糾錯等。同時對于產品經理來說,貝葉斯分類法是一個很好的研究自然語言處理問題的切入點。

樸素貝葉斯分類是一種十分簡單的分類算法,說它十分簡單是因為它的解決思路非常簡單。即對于給出的待分類項,求解在此項出現的條件下各個類別出現的概率,哪個大,就認為此待分類項屬于哪個類別。

舉個形象的例子,若我們走在街上看到一個黑皮膚的外國友人,讓你來猜這位外國友人來自哪里。十有八九你會猜是從非洲來的,因為黑皮膚人種中非洲人的占比多,雖然黑皮膚的外國人也有可能是美洲人或者是亞洲人。但是在沒有其它可用信息幫助我們判斷的情況下,我們會選擇可能出現的概率高的類別,這就是樸素貝葉斯的基本思想。

值得注意的是,樸素貝葉斯分類并非是瞎猜,也并非沒有任何理論依據。它是以貝葉斯理論和特征條件獨'立假設為基礎的分類算法。

想要弄明白算法的原理,首先需要理解什么是“特征條件獨'立假設”以及“貝葉斯定理”,而貝葉斯定理又牽涉到“先驗概率”、“后驗概率”及“條件概率”的概念。

如下圖所示,雖然概念比較多但是都比較容易理解,下面我們逐個詳細介紹。

特征條件獨'立假設是貝葉斯分類的基礎,意思是假定該樣本中每個特征與其他特征之間都不相關。

例如在預測信用卡客戶逾期的例子中,我們會通過客戶的月收入、信用卡額度、房車情況等不同方面的特征綜合判斷。兩件看似不相關的事情實際上可能存在內在聯系,就像蝴蝶效應一樣。普遍情況下,銀行批給收入較高的客戶的信用卡額度也比較高。

同時收入高也代表這個客戶更有能力購買房產,所以這些特征之間存在一定的依賴關系,某些特征是由其他特征決定的。

然而在樸素貝葉斯算法中,我們會忽略這種特征之間的內在關系,直接認為客戶的月收入、房產與信用卡額度之間沒有任何關系,三者是各自獨'立的特征。

接下來我們重點講解什么是“理論概率”與“條件概率”,以及“先驗概率”與“后驗概率”之間的區別。

二、真假概率

首先我們進行一個小實驗。

假設將一枚質地均勻的硬幣拋向空中,理論上,因為硬幣的正反面質地均勻,落地時正面朝上或反面朝上的概率都是50%。這個概率不會隨著拋擲次數的增減而變化,哪怕拋了10次結果都是正面朝上,下一次是正面朝上的概率仍然是50%。

但在實際測試中,如果我們拋100次硬幣,正面朝上和反面朝上的次數通常不會恰好都是50次。有可能出現40次正面朝上和60次反面朝上的情況,也有可能出現35次正面朝上和65次反面朝上的情況。

只有我們一直拋,拋了成千上萬次,硬幣正面朝上與反面朝上的次數才會逐漸趨向于相等。

因此,我們說“正面朝上和反面朝上各有50%的概率”這句話所指的概率是理論上的客觀概率。只有當拋擲次數接近無數次時,才會達到這種理想中的概率。在理論概率下,盡管拋10次硬幣,前面5次都是正面朝上,第6次是反面朝上的概率仍然是50%。

但是在實際中,拋過硬幣的人都有這樣的感覺——如果出現連續5次正面朝上的情況,下一次是反面朝上的可能性極大。大到什么程度?有沒有什么方法可以求出實際的概率呢?

為了解決這個問題,一位名叫托馬斯·貝葉斯(ThomasBayes)的數學家發明了一種方法用于計算“在已知條件下,另外一個事件發生”的概率。該方法要求我們先預估一個主觀的先驗概率,再根據后續觀察到的結果進行調整。隨著調整次數的增加,真實的概率會越來越細微。

這句話怎么理解呢?

我們通過一個坐地鐵的例子解釋這句話的含義。深圳地鐵一號線從車公廟出發至終點站共有18站,每天早上小林要從車公廟出發經過5個站到高新園上班,如下圖所示:

某天早高峰,小林被站立的人群遮擋住視線并且戴著耳機聽不到報站的內容,因此他不知道列車是否到達高新園站。

如果下一站列車到站時,他直接出站,理論上他正好到高新園站的概率只有1/18,出對站的概率非常小。這時候小林恰巧在人群中看到一個同事,他正走出站臺。

小林心想,盡管不知道這個同事要去哪里,但在早高峰時段,同事去公司的概率顯然更高。因此在獲得這個有效信息后,小林跟隨出站,正好到達高新園站——這種思考方式就是貝葉斯定理所闡述的思考方式。

三、引入貝葉斯定理

在概率論與統計學中,貝葉斯定理描述了一個事件發生的可能性,這個可能性是基于事先掌握了一些與該事件相關的情況從而推測的。

假設癌癥是否會發病與每個人的年齡有關。如果使用貝葉斯定理,當我們知道一個人的年齡,可以用于更準確地評估他得癌癥是否會發病的概率。也就是說,貝葉斯理論是指根據一個已發生事件的概率,計算另一個事件的發生概率。

從數學上貝葉斯理論可以表示為:

  • P(B)表示發生B事件的概率,即小林到高新園站的概率;
  • P(A)表示發生A事件的概率,即小林的同事出站的概率;
  • P(B|A)表示在A事件已經發生的情況下B事件會發生的概率,即同事出站的時候,小林正好到高新園站的概率;
  • P(A|B)表示在B事件已經發生的情況下A事件會發生的概率,即小林到達高新園站,同事出站的概率。

這時候我們再來看貝葉斯定理,這個公式說明了兩個互換的條件概率之間的關系,它們通過聯合概率關聯起來。在這種情況下,若知道P(A|B) 的值,就能夠計算P(B|A)的值。

因此貝葉斯公式實際上闡述了這么一個事情,如下圖所示:

我們可以用文氏圖可以加深對貝葉斯定理的理解,如下圖所示:

上述例子中小林剛好在早高峰時段看到同事出站,代表出現了新的信息。就像是上圖中已知黑點已經落入A區域了,由于A區域大部分區域與B區域相交,因此推斷黑點也在B區域的概率會變大。我們想獲得的結果其實是P(B|A),即我們想知道,在考慮了一些現有的因素后,這個隨機事件會以多大概率出現。

參考這個概率結果,在很多事情上我們可以有針對性地作出決策。我們需要同時知道P(B)、P(A|B)與P(A)才能算出目標值P(B|A),但是P(A)的值似乎比較難求。

仔細想一想,P(A)與P(B)之間似乎沒有任何關聯,兩者本身就是獨'立事件,無論P(B)的值是大還是小,P(A)都是固定的分母。也就是說我們計算P(A)各種取值的可能性并不會對各結果的相對大小產生影響,因此可以忽略P(A)的取值。

假設P(A)的取值為m,P(B)的可能取值為b1、b2或者是b3,已知:

那么計算P(B|A)時,分別會得到結果:

且由于P(b1|A)、P(b2|A)與P(b3|A)三者之和一定為1,因此可以得出ox+py+qz=m。即使m的值不知道也沒關系,因為ox,py,qz的值都是可以計算出來的,m自然也就知道了。剩下的工作就是計算P(B)、P(A|B),而這兩個概率必須要通過我們手上有的數據集來進行估計。

關于貝葉斯算法有一段小插曲。貝葉斯算法被發明后,曾有接近200年的時間無人問津。

因為經典統計學在當時完全能夠解決客觀上能夠解釋的簡單概率問題;而且相比需要靠主觀判斷的貝葉斯算法,顯然當時的人們更愿意接受建立在客觀事實上的經典統計學,他們更愿意接受一個硬幣無論拋多少次后正反面朝上的概率都是50%的事實。

但我們生活中還存在很多無法預知概率的復雜問題,例如臺風侵襲、地震規律等等。經典統計學在面對復雜問題時,往往無法獲得足夠多的樣本數據,導致其無法推斷總體規律。總不能說每天預測臺風來的概率都是50%,只有來或者不來兩種情況。

數據的稀疏性令貝葉斯定理頻頻碰壁。隨著近代計算機技術的飛速發展后,數據的大量運算不再是困難的事情,貝葉斯算法這才被人們重新重視起來。

四、貝葉斯定理有什么用

講到這里部分讀者可能會問,雖然貝葉斯定理模擬了人類思考的過程,但是它又能夠幫助我們解決什么樣的問題呢?我們先來看一個幾乎是講到貝葉斯定理時必定會提到的經典案例。

在疾病檢測領域,假設某種疾病在所有人群中的感染率是0.1%,醫院現有的技術對于該疾病檢測準確率能夠達到99%。也就是說,在已知某人已經患病情況下,有99%的可能性檢查出陽性;而正常人去檢查有99%的可能性是正常的。如果從人群中隨機抽一個人去檢測,醫院給出的檢測結果為陽性,這個人實際得病的概率是多少?

也許很多讀者都會脫口而出 “99%”。但真實的得病概率其實遠低于此,原因在于很多讀者將先驗概率和后驗概率搞混了。

如果用A表示這個人患有該疾病,用B表示醫院檢測的結果是陽性,那么 P(B|A)=99%表示的是“已知一個人已經得病的情況下醫院檢測出陽性的概率”。而我們現在問的是“對于隨機抽取的這個人,已知檢測結果為陽性的情況下這個人患病的概率”,即P(A|B),通過計算可得P(A|B)=9%。所以即使被醫院檢測為陽性,實際患病的概率其實還不到10%,有很大可能是假陽性。因此需要通過復診,引入新的信息,才有更大把握確診。

通過以上例子可以看出,生活中我們經常會把先驗概率與后驗概率弄混淆,從而得出錯誤的判斷。貝葉斯定理正是幫我們理清概率的先后條件之間的邏輯關系,并得到更細微的概率。

實際上,這個定理所闡述的核心思想對產品經理的思考方式也有很大的啟發:

一方面是我們要搞清楚需求場景中的先驗概率是什么?后驗概率是什么?不要被數據的表象蒙蔽了雙眼;

另一方面我們可以借助貝葉斯定理搭建一個思考的框架——在這個框架中需要不斷調整我們對某事物的看法,在經過一系列的新的事情被證實后,才形成比較穩定、正確的看法。

當我們的腦子里有新想法出現時,大多數情況下,我們只能根據經驗大概判斷某個產品靠譜不靠譜,投入到市場中反響有多大沒有人能夠說清楚。

因此很多時候我們需要嘗試,需要做一個簡單的版本投入到市場上快速驗證自己的想法;然后不斷想辦法獲得“事件B”,不斷增加新產品的成功率——這樣我們的產品才有可能獲得成功。

因此“小步快跑,快速迭代”才是提升容錯率出類拔萃的辦法。

愛盈利-運營小咖秀(www.aiyingli.com) 始終堅持研究分享移動互聯網App運營推廣經驗、策略、全案、渠道等純干貨知識內容;是廣大App運營從業者的知識啟蒙、成長指導、進階學習的集聚平臺;

想了解更多移動互聯網干貨知識,請關注微信公眾號運營小咖秀(ID: yunyingshow)

轉載請注明:愛盈利 ? AI產品經理的好幫手——樸素貝葉斯

聲明:該文章版權歸原作者所有,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請在30日內與本網聯系。
您閱讀這篇文章花了0
轉發這篇文章只需要1秒鐘
喜歡這篇 0
評論一下 0
凱派爾知識產權全新業務全面上線
相關文章
評論
試試以這些內容開始評論吧
登錄后發表評論
凱派爾知識產權全新業務全面上線
寧波城市站
金華城市站
×
#熱門搜索#
精選雙創服務
歷史搜索 清空

Tel:18514777506

關注微信公眾號

創頭條企服版APP

china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网
欧美成人a视频| 亚洲欧美日韩国产另类专区| 1000部国产精品成人观看| 青青国产91久久久久久| www.日本不卡| 欧美精品一区二区三区很污很色的| 亚洲九九爱视频| 国产成人在线视频网址| 欧美一区二区三区四区五区 | 亚洲乱码日产精品bd| 国产一区福利在线| 欧美三级中文字幕| 中文字幕中文字幕在线一区 | 成人免费看的视频| 精品国产乱码久久久久久免费| 亚洲成人一区在线| 一本色道a无线码一区v| 国产精品色哟哟| 国产福利一区在线| 精品少妇一区二区三区日产乱码 | 久久66热偷产精品| 777欧美精品| 亚洲午夜久久久| 日本精品一级二级| 亚洲男女一区二区三区| 97精品久久久久中文字幕| 国产精品毛片久久久久久久| 国产成人av一区二区三区在线观看| 精品国产凹凸成av人导航| 久久精品国产久精国产| 欧美一区二区黄色| 日本v片在线高清不卡在线观看| 欧美日韩高清影院| 水蜜桃久久夜色精品一区的特点| 欧美日韩在线三区| 午夜精品一区在线观看| 欧美人与性动xxxx| 日韩精品一级二级| 日韩一区二区三区高清免费看看| 日韩国产精品91| 3atv一区二区三区| 免费在线观看精品| 欧美成人一区二区三区| 激情伊人五月天久久综合| 精品国产乱码91久久久久久网站| 国产综合色视频| 久久亚洲精华国产精华液 | 日韩一级视频免费观看在线| 日韩综合在线视频| 日韩欧美一级二级| 激情伊人五月天久久综合| 久久亚洲综合av| 国产91精品欧美| 亚洲国产精品成人综合| 成人福利视频网站| 亚洲人亚洲人成电影网站色| 一本到一区二区三区| 亚洲综合激情网| 欧美精品在线视频| 久久99这里只有精品| 久久精品视频一区二区| 成人高清免费观看| 一区二区三区精品久久久| 欧美欧美欧美欧美| 国产在线看一区| 中文成人综合网| 色综合一区二区三区| 亚洲二区视频在线| 日韩精品一区二区三区在线观看 | 久久这里只有精品首页| 粉嫩欧美一区二区三区高清影视 | 国产精品一区在线观看你懂的| 国产日韩欧美制服另类| 91蜜桃视频在线| 午夜精品久久久久久久99樱桃| 88在线观看91蜜桃国自产| 国产一区二区三区美女| 综合网在线视频| 欧美精品xxxxbbbb| 国产黑丝在线一区二区三区| 亚洲乱码国产乱码精品精可以看| 欧美精品在线视频| 国产高清不卡一区| 一区二区三区在线看| 日韩情涩欧美日韩视频| 北条麻妃国产九九精品视频| 天堂蜜桃91精品| 亚洲国产精品99久久久久久久久 | 亚洲婷婷综合久久一本伊一区| 欧美天堂一区二区三区| 国产又粗又猛又爽又黄91精品| 亚洲人精品午夜| 精品三级av在线| 色域天天综合网| 久久精品国产免费看久久精品| 国产精品高潮呻吟久久| 4438x成人网最大色成网站| 国产成人av电影在线| 天天综合日日夜夜精品| 亚洲国产成人一区二区三区| 精品视频一区二区三区免费| 国产丶欧美丶日本不卡视频| 亚洲午夜三级在线| 国产网站一区二区| 欧美日本乱大交xxxxx| 国产成人av一区二区三区在线观看| 亚洲电影在线播放| 欧美国产精品久久| 日韩一级大片在线观看| 一本到一区二区三区| 国产一区二区三区蝌蚪| 午夜精品一区二区三区三上悠亚 | 99久久伊人网影院| 久久成人综合网| 亚洲综合清纯丝袜自拍| 国产欧美在线观看一区| 91精品国产综合久久精品性色| 成人av资源站| 美女视频网站黄色亚洲| 一区二区三区在线免费视频| 国产欧美日韩视频在线观看| 欧美一级日韩免费不卡| 一本色道久久综合亚洲aⅴ蜜桃| 国产麻豆视频一区| 天堂在线一区二区| 亚洲精品高清在线观看| 国产午夜精品在线观看| 日韩一二三区不卡| 欧美三级视频在线| 99久久精品国产麻豆演员表| 国产乱妇无码大片在线观看| 日日夜夜免费精品视频| 亚洲精品欧美综合四区| 日本一二三不卡| 久久新电视剧免费观看| 日韩一区二区三区视频在线观看| 欧美影院一区二区| 91视频国产资源| 国产福利一区在线| 精品亚洲成a人| 奇米色一区二区| 亚洲午夜一二三区视频| 亚洲男女毛片无遮挡| 国产精品国产三级国产三级人妇| 久久精品一区二区三区不卡| 欧美xxxxxxxxx| 欧美一区二区三区免费观看视频| 欧美日韩在线三级| 欧洲人成人精品| 日本韩国欧美一区二区三区| 99视频精品全部免费在线| 国产91丝袜在线观看| 国产精一区二区三区| 寂寞少妇一区二区三区| 免费成人av在线播放| 日韩福利视频网| 日韩高清中文字幕一区| 日韩中文字幕麻豆| 首页亚洲欧美制服丝腿| 午夜精品123| 日韩精品每日更新| 日韩av在线免费观看不卡| 五月天激情小说综合| 亚洲成人av免费| 亚洲第一狼人社区| 日韩精品久久久久久| 日韩二区三区四区| 午夜视频一区二区三区| 天天综合天天综合色| 日产精品久久久久久久性色| 日本欧美久久久久免费播放网| 全国精品久久少妇| 老司机精品视频导航| 久久99精品国产.久久久久久| 久久99精品国产91久久来源| 国产在线精品一区二区不卡了| 国产美女在线精品| 成人av网站在线观看| 91在线一区二区三区| 色狠狠色狠狠综合| 欧美日韩免费在线视频| 5月丁香婷婷综合| 精品国偷自产国产一区| 国产欧美一区二区三区鸳鸯浴 | 久久精品国产99国产精品| 另类人妖一区二区av| 国模大尺度一区二区三区| 国产盗摄一区二区三区| 99精品欧美一区二区蜜桃免费 | 国产日产精品1区| 国产精品毛片a∨一区二区三区| **网站欧美大片在线观看| 亚洲一区在线观看网站| 日韩中文欧美在线| 国内精品国产成人国产三级粉色| 国产成人av网站| 日本二三区不卡| 欧美一级理论片| 国产农村妇女毛片精品久久麻豆| 亚洲人精品午夜|