農林漁牧網

您現在的位置是:首頁 > 農業

機器學習中的迴歸是什麼意思?

2022-05-12由 聖普倫數字科技 發表于 農業

線性迴歸是什麼意思

機器學習中的迴歸

迴歸分析是一種統計方法,於對具有一個或多個自變數的因變數(目標變數)和自變數(預測變數)之間的關係進行建模。具體地說,迴歸分析有助於我們理解在其他自變數保持固定的情況下,自變數的值對應於自變數的變化方式。它可以預測連續/實際值,例如溫度,年齡,工資,價格等。

迴歸是一種有監督的學習技術,有助於發現變數之間的相關性,並使我們能夠基於一個或多 個預測變數來預測連續輸出變數。它主要用於預測,預測,時間序列建模以及確定變數之間的因果關係。

在迴歸中,我們在最適合給定資料點的變數之間繪製圖形,使用此圖形,機器學習模型可以對資料進行預測。用簡單的話說,“迴歸顯示一條線或曲線, 它穿過目標預測圖上的所有資料點,以使資料點和迴歸線之間的垂直距離最小。“資料 點和線之間的距離表明模型是否已捕獲牢固的關係。

迴歸的型別

●線性迴歸

●邏輯迴歸

●多項式迴歸

●支援向量迴歸

●決策樹迴歸

●森林隨機迴歸

線性迴歸

線性迴歸顯示自變數(X軸)和因變數(Y軸)之間的線性關係,因此稱為線性迴歸。如果只有一個輸入變數(x),則這種線性迴歸稱為簡單線性迴歸。如果輸入變數不止一個,則這種線性迴歸稱為多元線性迴歸。

機器學習中的迴歸是什麼意思?

邏輯迴歸

邏輯迴歸,通常作為分類演算法,只可以解決二分類問題。最終得出的結果是一個機率值。邏輯迴歸使用S型函式或logistic 函式,它是一個複雜的成本函式。

機器學習中的迴歸是什麼意思?

多項式迴歸

多項式迴歸,迴歸函式是迴歸變數多項式的迴歸。多項式迴歸模型是線性迴歸模型的一種,此時迴歸函式關於迴歸係數是線性的。使用多項式迴歸可以使迴歸模型擬合得更好。

機器學習中的迴歸是什麼意思?

支援向量迴歸

支援向量機是具有相關學習演算法的監督學習模型,用於分析用於分類和迴歸分析的資料。在支援向量迴歸中,擬合數據所需的直線稱為超平面。 支援向量機演算法的目標是在 n 維空間中找到一個對資料點進行明確分類的超平面。超平面兩側最接近超平面的資料點稱為支援向量。這些影響超平面的位置和方向,從而有助於構建 SVM。

在SVR中,我們總是嘗試確定具有最大餘量的超平面,以便在該餘量中覆蓋最大數量的資料點。SVR的主要 目標是考慮邊界線內的最大資料點,並詛超平面(最佳擬合線)必須包含最大數量的資料點。考慮下圖(藍線稱為超平面,其他兩線稱為邊界線):

機器學習中的迴歸是什麼意思?

決策樹迴歸

與線性迴歸不同,迴歸樹是將“空間”進行劃分,每個空間則對應一個統一的預測值。決策樹迴歸構建樹狀結構,其中每個內部節點代表一個屬性的”測試” ,每個分支代表測試的結果,每個葉子節點代表最終的決策或結果。從根節點/父節點(資料集)開始構建決策樹,該樹分為左右子節點(資料集的子集)。這些子節點進一步分為其子節點, 它們本身成為這些節點的父節點。如下圖:

機器學習中的迴歸是什麼意思?

森林隨機迴歸

隨機森林是一種監督學習演算法。 就像你所看到的它的名字一樣,它建立了一個森林,並使它擁有某種方式的隨機性。 所構建的“森林”是決策樹的整合,大部分時候都是用“bagging”方法訓練的。 bagging方法,即bootstrap aggregating,採用的是隨機有放回的選擇訓練資料然後構造分類器,最後組合學習到的模型來增加整體的效果。

簡而言之:隨機森林建立了多個決策樹,並將它們合併在一起以獲得更準確和穩定的預測。隨機森林的一大優勢在於它既可用於分類,也可用於迴歸問題,這兩類問題恰好構成了當前的大多數機器學習系統所需要面對的。 接下來,將探討隨機森林如何用於分類問題,因為分類有時被認為是機器學習的基石。 下圖,你可以看到兩棵樹的隨機森林是什麼樣子的:

機器學習中的迴歸是什麼意思?

或者這個樣子

機器學習中的迴歸是什麼意思?

機器學習雖然聽起來難度很大,還有各類迴歸演算法要學,各種庫要學習,但只要你擁有一點計算機基礎,其實學起來是非常有趣和有成就感的。

如果你計劃在機器學習領域深耕,可以參加simplilearn聖普倫的機器學習訓練營,課程包括58小時的應用學習、互動實驗室、4個實踐專案和指導,透過聖普倫機器學習認證培訓,你將會掌握機器學習認證考試所需的機器學習知識,比如資料預處理、監督學習和無監督學習、時間序列建模、迴歸以及文字挖掘等。

在Simplilearn聖普倫學「機器學習」,是一種怎樣的體驗?