056統計基礎中的機率、機率分佈及AB測試
2021-12-07由 踐行力 發表于 林業
統計學中b代表什麼
你好,感謝開啟產品Desginer
今天是2020年2月16日星期日,農曆正月廿三
今天,與你分享的是統計基礎:機率、機率分佈與AB測試
什麼是機率?
前置學習:隨機事件
在一個隨機事件裡,我們知道可能的結果是什麼,但是不知道哪一個特定的結果會發生
機率是統計的一個基本概念,它是一個0到1之間的數字,是對隨機事件發生可能性的測量
P(A)=事件A發生的機率可能性(0 ≤ P(A) ≤ 1)
如何理解機率:如我們可以觀察同樣的隨機事件發生無數次,這個隨機事件某一個結果發生的機率,就是這個特定結果在所有結果中所佔的比
大數定律:在隨機事件中的大量重複出現中,往往呈現幾乎必然規律,這個規律就是大數定律
(通俗地說,這個定律就是,在實驗不變的條件下,重複試驗多次,隨機事件某一個結果(擲硬幣正面朝上)發生的頻率近似於它的機率。偶然中包含著某種必然)
頻率是試驗事實的記錄
例如,擲了100次硬幣,正面朝上的有49次。
我們可以說擲這100次硬幣,正面朝上的頻率是49%
條件機率:是指時間A在另外一個事件B已經發生條件下的發生機率
條件機率表示為:P(A丨B),讀作“在B的條件下A的機率”
P(A丨B)= P(AB)/ P(B)
獨立事件:兩個事件的發生有相互影響的,叫相關事件,沒有影響的是獨立事件
定義:事件B發生或不發生對事件A不產生影響,反之亦然,我們就說兩個事件A和B互為獨立事件。
公式表示,基於:
P(A丨B)= P(A)
P(B丨A)= P(B)
P(A丨B)= P(AB)/ P(B)
可以推出對於兩個獨立事件同時發生機率的計算公式:P(A丨B)= P(A)x P(B)
機率分佈
樣本空間:是一次隨機實驗中可能出現的所有結果集合
例如:使用者連續兩次嘗試使用共享單車,兩輛單車故障情況的機率分佈是?
S = {1故障&2故障,1故障&2正常,1正常&2故障,1正常&2正常}
機率分佈:一個“實驗”的“機率分佈”列出樣本空間裡的所有可能結果和其發生機率
例如:使用者連續兩次嘗試使用共享單車,這兩輛單車故障情況的機率分佈是?
(假設每次使用單車的故障率為25%&兩次的故障率互為獨立事件)
規則:所有可能的結果沒有交集,每一個結果的機率值在0和100%之間,所有結果的機率值和為100%
A/B測試
定義:統計學裡雙樣品假設檢驗的一個應用
簡單說,就是為了一個目標制定兩個方案,讓一部分使用者使用A方案,另一部分使用者使用B方案,記錄下使用者的使用情況,看哪個方案的效果更好。
實驗組和對照組
事件:9158美女直播APP,操作介面更新,老闆覺得公司使用IOS系統的人較多,想把直播作業系統統一改為IOS版本的
實驗組:是指隨機選擇的實驗物件的子集—安卓使用者使用IOS版的9158直播操作介面
對照組:實驗物件中一個被隨機選擇的子集,其中個體沒有特殊待遇—安卓使用者使用安卓版9158直播操作介面
應用場景:網站設計最佳化、測試新專案、產品最佳化(新改進)
A/B測試思路
1、原假設成立—>假設9158美女直播安卓端使用者希望使用IOS的作業系統
2、虛擬實驗—>100安卓使用者使用IOS作業系統一週,100安卓使用者使用Android作業系統一週
3、與觀測結果比較—>使用IOS作業系統的100安卓使用者中,有55人表示不適應,不習慣,操作介面垃圾
4、做判斷—>安卓使用者和IOS使用者,各自使用各自的作業系統為最好結果