農林漁牧網

您現在的位置是:首頁 > 農業

白話統計閱讀筆記:認識迴歸分析及迴歸模型好壞

2021-07-12由 不愛說話的PhD 發表于 農業

迴歸分析結果怎麼看

什麼情況下使用線性迴歸:

1。 知道了某一結果或現象,想要了解影響該結果發生的因素主要有哪些,如想了解哪些因素會影響到血糖值的變化。

2。 想驗證某一結果與研究變數之間的真實關係,但又覺得可能會有混雜因素的干擾,想排除這些混雜因素,

3。 已經知道了有幾個因素可能會影響結果,想綜合利用這些因素來預測結果出現的情況。

在理解線性迴歸模型之前,一定要理解因變數y是一個隨機變數,所以對於每一個特定的自變數取值,因變數y並不會只對應一個值,而是可能有無數個取值,這些取值服從某一均值和標準差的分佈,在樣本資料中,觀測值得到的因變數是一系列的點,而估計值得到的因變數是迴歸線,二者的差別稱為殘差,也就是樣本估計值和樣本觀測值的差值就是殘差,每個點都與估計值有一個差值,如果殘差越小,說明擬合的迴歸模型越好,因為它更貼近實際值。

殘差可以告訴我們這些係數的估計值是否可靠,這一點實際上更為重要,因為即使迴歸係數再大,如果不能保證可靠性,則依然無法說明別人接受你的結果,因此,在資料分析中一定要學會觀察殘差圖,任何模型擬合的問題基本上都能在殘差圖中體現出來。所以得到的殘差圖應該是圍繞0上下波動的點,如果殘差有趨勢說明擬合有問題。

Ref: 《白話統計》 馮國雙著