china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网

公眾號
關注微信公眾號
移動端
創頭條企服版APP

數據分析師必看,你認識AB常見的10個錯誤

5459
網絡大數據 2019-09-18 12:08 搶發第一評
這是 W Edwards 的依據名言,它表明,A B 測試對于做出良好的商業決策來說至關重要。在 Manomano,我們向數百萬用戶展示數百萬 DIY 和園藝產品,并每天進行數十個 A B 測試,以改善我們網站的用戶體驗。
數據分析師必看,你認識AB常見的10個錯誤

?

「沒有數據,你只是一個有想法的人。」

這是 W. Edwards 的依據名言,它表明,A/B 測試對于做出良好的商業決策來說至關重要。在 Manomano,我們向數百萬用戶展示數百萬 DIY 和園藝產品,并每天進行數十個 A/B 測試,以改善我們網站的用戶體驗。

?

?

ManoMano 花園大棚分類頁面上的產品排名算法 A/B 測試示例

然而,運行 A/B 測試和解釋結果可能非常困難,如果做得不對,可能會得到錯誤的結論。這篇博文的目的不是要說明在運行 A/B 測試時應該做什么,而是要告訴你不應該做什么。下面是我們在進行 A/B 測試時經常會犯的 10 個常見錯誤。

1.在僅當一部分人受到影響時,觀察所有人

示例:你想測試你的搜索引擎相關性,但在分析 A/B 測試結果時,你查看整個總體,而不僅僅是使用搜索引擎的用戶。雖然這在科學的角度來說不是錯誤的,但是達到統計顯著性需要更長的時間,因為在分析的數據中添加了一些噪聲:

?

?

經驗 1:為了更快地達到統計顯著性,應該只觀察與測試功能交互用戶(這里是搜索引擎)的結果。

2.在沒有任何業務直覺的情況下進行測試

不能使用太多變量(A/B/C/../N)進行測試。例如,如果使用 α=5% 顯著性閾值并決定測試 20 個不同的場景,則其中每個場景是正樣本的機會是偶然的。這是多重比較問題的一個例子。因此,業務直覺對于決定啟動哪個 A/B 測試至關重要。為了說明這一點,我們可以修改 W.Edwards Deming 的名言:

「沒有想法,你只是一個有數據的人 」

?

?

經驗 2:用你的直覺(或者更好的方法——做用戶調查)來決定啟動哪一個 A/B 測試。

3.對人口進行分段以達到統計顯著性

這是多重比較問題的另一個例子:「我的 A/B 測試不顯著,因此我將在設備上對數據進行分段以獲得顯著結果」。在進行數據分割時必須非常小心。事實上,你比較的片段越多,結果中出現錯誤的幾率就越大。

以 country * device 為例,我們在 Manomano 有 n=15 個細分市場(5 個國家*3 個設備:法國/手機、法國/桌子、西班牙/平板電腦等)。讓我們計算在其中一個分段上偶然出現至少一個重要結果的概率:

?

?

我們有超過 50% 的機會出現這種偶然性,因此,從分割數據的測試中得出結論并采取行動是非常危險的。但也有一些技術可以緩解這一問題,比如 Bonferroni 校正。

經驗 3:不要為了達到統計顯著性而分割你的數據。

4.查看幾個指標以達到統計顯著性

多重比較問題的另一個例子是:「我的 A/B 測試在轉換率、平均購物籃和跳出率上都沒有顯著結果。但這對每類購物籃的數量來說是很重要的!如果你觀察足夠多的指標,你最終會發現其中一個指標碰巧顯示了一個重要的結果:

?

?

A/B 測試結果說明

經驗 4:堅持測試設計的標準。

5.達到統計顯著性時停止測試

統計顯著性不能告訴你什么時候應該停止測試。在停止測試之前,你需要等待以達到計算出的樣本大小。使用 A/B 測試計算器計算測試所需的樣本大小。有關這種偏差的更多細節,請閱讀這里的問題說明。你還可以在此處模擬 A/A 測試,以查看在測試早期達到統計顯著性的頻率,即使在測試結束時結果不顯著:

?

?

使用 james lutrek 工具,根據樣本數量觀察 A/A 測試實驗的顯著性

經驗 5:即使你的測試有統計學意義(統計顯著性),也要繼續測試,直到測試結束。

6.在達到統計顯著性之前不要停止測試

同樣,統計顯著性不能告訴你什么時候可以停止測試,或者繼續測試。你不應該等待一個測試變得有意義,因為它可能永遠不會發生。如果你已經達到了在測試前計算出的樣本量,這就意味著你的測試有足夠的統計能力得出結論。

?

?

Evan Miller 的 A/B 測試持續時間計算器

經驗 6 :一旦達到所需的樣本量,停止測試。

7.將(1-p 值)當做 B 優于 A 的概率

這是一個很常見的錯誤。p 值為 2% 并不意味著 B 有 98% 的機會比 A 好。這個假設在數學上是錯誤的,因為它還取決于基準率,即你所做的測試中,有積極影響的百分比(只有上帝知道這個數字!)。這個數字反映了你的商業直覺水平。

假設我們是上帝,我們知道 ManoMano 的基準率是 20%。這意味著我們 20% 的測試都是陽性的:

?

?

80% 的陽性測試(灰色)拒絕零假設(統計能力):

?

?

5% 的陰性測試(白色)拒絕零假設(顯著性閾值):

?

?

結論:在 80% 的統計能力、5% 的顯著性閾值和 20% 的基準率,當檢驗被認為是陽性(p 值<0.05)時,我們只有 16/(16+4)=80% 的機會是真陽性,而不是 95%。

在這種情況下(統計能力=80%,顯著性閾值=5%),知道你的 A/B 測試結果是有意義的,下面是一些概率,你的測試實際上是陽性的,這取決于基準率:

?

?

經驗 7:(1-p 值)不是檢驗為陽性的概率。如果你還想計算這個概率,使用貝葉斯 A/B 測試方法。

8.認為觀察到的增量是特征帶來的增量

測試所觀察到的增量允讓你可以計算統計顯著性,但將觀察到的增量視為特征帶來的實際增量是錯誤的,這通常需要更多的用戶或會話。

如果不能證明 B 優于 A ,則選擇傳遞置信區間而不是原始增量。為了說明這一點,我們以 A/B 測試為例:

?

?

p 值為 0.014,可接受的顯著性水平為 95%,此 A/B 檢驗為陽性,這意味著測試組顯著好于對照組。可以很容易地計算出觀察到的跳出率相對增量:

?

?

但將觀測到的增量視為特征帶來的實際增量是不正確的。你應該使用標準誤差計算每組的置信區間:

?

?

其中 p 是觀察到的組跳出率,n 是池樣本大小,zα 是對應于置信水平 α 的 z 值(在本例中為 95%)。你可以在這里找到通常置信水平的 z 值。

使用此公式,你最終可以計算兩個組的 95% 置信區間(CI)跳出率:

?

?

也可以反計算相對增量(pctdiff)的置信區間,但它更復雜。如果需要更多詳細信息,請參閱這個調查的第 3.3.2 節。

經驗 8:當你的測試為顯著陽性時,應該傳遞置信區間而不是原始增量。

9.當 A/B 測試結果違背你的直覺時,忽略它們

如果你(和你的組織)還沒有準備好用新的版本更新你的產品,除了確認你的偏見,啟動 A/B 測試是沒有意義的。直覺在選擇測試內容時至關重要,但它不應與 A/B 測試的結果相抵觸。

?

?

經驗 9:與利益相關者確定測試前的閾值和相關行動。

10.忘記檢查 A/B 測試系統是否可靠

為了保證你的 A/B 測試結果的可靠性,你的 A/B 測試系統必須經過校準并正常工作。確保這種可靠性的一種方法是持續進行 A/A 測試,并檢查這兩種人群之間沒有顯著差異:

?

?

Manomano 的連續 A/A 測試允許我們快速檢測 8 月份遇到的緩存錯誤,由于該錯誤,8 月 20 日到 8 月 22 日之間進行的所有測試無效。

經驗 10:持續進行 A/A 測試,以檢測可靠性。

結論

如你所見,在分析 A/B 測試結果時出錯的風險非常高,而在測試之后所做的決策對你的公司來說至關重要。因此,你應該對給到你的 A/B 測試結果持懷疑態度,特別是當這個結果來自于一個對取得積極結果有強烈興趣的人(例如,一個想賣給你東西的人)時尤其如此。在 ManoMano,我們有一個值得信賴的委員會,幫助分析所有內部和外部 A/B 測試的結果,并對結論有著公正的看法。

via:https://medium.com/manomano-tech/a-b-testing-10-common-mistakes-we-all-make-97a5030f1d44

分享到:0收藏

上一篇:谷歌開始收集面部數據,隱私問題再度引爆 國家級數據泄露發生了,原來這就叫世界末日下一篇:

聲明:該文章版權歸原作者所有,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請在30日內與本網聯系。
您閱讀這篇文章花了0
轉發這篇文章只需要1秒鐘
喜歡這篇 0
評論一下 0
凱派爾知識產權全新業務全面上線
相關文章
評論
試試以這些內容開始評論吧
登錄后發表評論
凱派爾知識產權全新業務全面上線
寧波城市站
金華城市站
×
#熱門搜索#
精選雙創服務
歷史搜索 清空

Tel:18514777506

關注微信公眾號

創頭條企服版APP

china0114.com-日韩欧美中文免费,免费视频一区,免费视频一区,国产精品色网
国产一区亚洲一区| 5858s免费视频成人| 欧美少妇一区二区| 国产欧美一区二区在线| 亚洲一区二区三区国产| 国产69精品久久777的优势| 欧美男人的天堂一二区| 1区2区3区精品视频| 激情六月婷婷久久| 欧美人牲a欧美精品| 成人免费一区二区三区视频| 国产在线视视频有精品| 欧美电影影音先锋| 亚洲综合在线电影| 99久久综合精品| 国产视频在线观看一区二区三区| 日韩av不卡一区二区| 欧美四级电影在线观看| 亚洲视频免费在线| 波多野结衣中文字幕一区| 26uuu国产在线精品一区二区| 日韩精品免费专区| 欧美日韩亚洲另类| 夜夜精品视频一区二区 | 91一区在线观看| 国产亚洲精品bt天堂精选| 精品一区二区三区欧美| 欧美一卡二卡在线观看| 五月天久久比比资源色| 欧美三级欧美一级| 一区二区三区四区蜜桃| 色综合中文字幕国产 | 91麻豆精品在线观看| 国产视频亚洲色图| 国产一区在线观看视频| 日韩欧美区一区二| 麻豆成人久久精品二区三区小说| 91精品一区二区三区久久久久久 | 麻豆精品视频在线观看视频| 69av一区二区三区| 日韩福利视频导航| 欧美精品aⅴ在线视频| 午夜免费欧美电影| 欧美日韩一区高清| 亚洲国产成人av| 欧美日韩一区二区三区高清| 亚洲午夜精品久久久久久久久| 色婷婷香蕉在线一区二区| 亚洲欧美色一区| 91女神在线视频| 亚洲欧美另类久久久精品2019| 91一区二区在线| 国产精品黄色在线观看| 99国产一区二区三精品乱码| 亚洲欧美中日韩| 91麻豆成人久久精品二区三区| 亚洲色图20p| 欧洲精品在线观看| 午夜精品成人在线| 日韩免费性生活视频播放| 国产一区二区三区久久悠悠色av| 久久久亚洲欧洲日产国码αv| 国产精品香蕉一区二区三区| 国产精品久久久久久久午夜片| 91丨九色porny丨蝌蚪| 亚洲永久精品国产| 91精品国产免费久久综合| 黄页视频在线91| 国产精品久久久久久久久久久免费看 | 五月天国产精品| 日韩一级片网址| 国产综合久久久久影院| 国产精品丝袜一区| 在线观看日韩毛片| 日本成人在线网站| 久久精品人人爽人人爽| 91在线免费播放| 亚洲国产sm捆绑调教视频 | 亚洲成人黄色小说| 91精品久久久久久久99蜜桃| 精品亚洲成a人在线观看| 欧美国产丝袜视频| 色婷婷综合五月| 日本vs亚洲vs韩国一区三区 | 亚洲精品中文在线观看| 欧美麻豆精品久久久久久| 国内精品国产成人| 亚洲天堂av老司机| 欧美精品第1页| 国产精品911| 夜夜嗨av一区二区三区中文字幕| 日韩欧美视频一区| 99视频一区二区三区| 丝袜诱惑亚洲看片| 日本一区二区三区视频视频| 欧美综合视频在线观看| 蜜桃久久av一区| 国产精品久久久久影院亚瑟| 欧美日韩电影一区| 国产一区二区精品久久91| 亚洲女厕所小便bbb| 日韩欧美国产综合在线一区二区三区| 国产91精品免费| 亚洲精品日产精品乱码不卡| 日韩欧美一级片| 99国产精品国产精品毛片| 免费欧美在线视频| 亚洲欧美日韩国产手机在线| 日韩欧美色综合网站| 91一区二区三区在线观看| 久久成人综合网| 亚洲精品网站在线观看| 亚洲精品在线三区| 欧美性xxxxxx少妇| 国产 日韩 欧美大片| 日韩精品一卡二卡三卡四卡无卡| 国产精品久久网站| 精品久久久久久久久久久久久久久久久 | 国产二区国产一区在线观看| 亚洲成人av在线电影| 中日韩av电影| 日韩免费成人网| 欧美午夜影院一区| 成人国产精品免费| 精品影视av免费| 亚洲成人动漫在线免费观看| 国产精品另类一区| 精品国产91洋老外米糕| 欧美日韩国产经典色站一区二区三区| 成人国产电影网| 国产一区二区三区免费在线观看 | 欧美综合色免费| 成人亚洲一区二区一| 久久精品国产网站| 亚洲va欧美va人人爽| 日韩毛片在线免费观看| 久久久久88色偷偷免费| 日韩一区二区精品在线观看| 91国偷自产一区二区三区观看| 成人一级黄色片| 国产精品自拍在线| 久久电影网站中文字幕| 首页综合国产亚洲丝袜| 综合欧美一区二区三区| 国产欧美一区二区精品性色| 精品欧美一区二区久久| 这里只有精品免费| 精品婷婷伊人一区三区三| 色诱视频网站一区| a亚洲天堂av| 成人激情开心网| 国产成人午夜精品5599| 国模套图日韩精品一区二区| 奇米色777欧美一区二区| 天堂va蜜桃一区二区三区 | 99精品欧美一区二区三区综合在线| 狠狠色伊人亚洲综合成人| 日韩va欧美va亚洲va久久| 性感美女极品91精品| 亚洲一区二三区| 亚洲精品你懂的| 亚洲欧美国产高清| 亚洲伦理在线精品| 亚洲图片你懂的| 自拍视频在线观看一区二区| 国产精品久久久久久久久免费丝袜 | 中文字幕在线一区二区三区| 国产亚洲一区二区三区在线观看 | 亚洲一区在线视频| 亚洲激情自拍视频| 亚洲精品高清视频在线观看| 亚洲精品大片www| 亚洲一区二区在线播放相泽| 亚洲一线二线三线久久久| 亚洲精品日日夜夜| 夜夜精品视频一区二区| 亚洲一区免费在线观看| 亚洲成人自拍一区| 天堂蜜桃一区二区三区| 日韩不卡在线观看日韩不卡视频| 日本少妇一区二区| 九色综合国产一区二区三区| 狠狠色2019综合网| 国产成人在线影院| 成人免费黄色大片| 91丨porny丨在线| 日本电影亚洲天堂一区| 欧美性大战久久久| 制服丝袜av成人在线看| 精品国产91九色蝌蚪| 欧美国产1区2区| 亚洲欧美另类图片小说| 亚洲高清在线精品| 免费观看日韩电影| 国产精品影音先锋| 972aa.com艺术欧美| 欧美日韩一区久久| 欧美大片顶级少妇| 国产区在线观看成人精品| 椎名由奈av一区二区三区|