農林漁牧網

您現在的位置是:首頁 > 林業

重視描述性統計在社科研究中的價值

2022-09-28由 中國社會科學網 發表于 林業

描述型研究是指什麼

統計學方法在社會科學研究中發揮著重要作用。作為統計學分析方法的兩大主要分支,描述性統計與推斷性統計在社科研究中的應用也發生了變化。近日,愛爾蘭利莫瑞克大學商學院榮譽教授凱文·墨菲(Kevin Murphy)在倫敦政治經濟學院官網撰文提出,隨著資料量不斷增大,量化社會研究已越來越依賴複雜的推斷性統計方法,但同時也不應忽視相對簡單的描述性統計。

重視描述性統計在社科研究中的價值

不同統計方法各有所長

描述性統計是指運用製表和分類、圖形以及計算概括性資料來描述資料特徵的各項活動,是社會科學研究中的常用方法。英國學者約翰·格朗特的《關於死亡公報的自然與政治觀察》可視為描述性統計的開山之作。在書中,格朗特首次將大量資料呈現在一些表格中,讓人更容易理解相關資訊。

透過統計資料進行推論可以追溯到公元前5世紀。在希臘伯羅奔尼撒戰爭中,雅典人讓士兵數城牆磚的層數,以此計算雲梯所需長度。所以推斷性統計是藉助抽樣調查,從區域性推斷總體,並以此對不確定的事物做出決策的一種統計方法。

描述性統計和推斷性統計各有千秋,各有其合理的適用範圍。山東大學新聞與傳播學院副院長、大資料與精確傳播實驗室建設專案執行主任倪萬表示,描述性統計的應用對社科研究有一定的顛覆性作用,可以幫助研究人員在大資料的基礎上更清晰地認知研究問題的整體脈絡和樣貌,但這不足以支撐甚至代替推斷性統計研究。描述性統計和推斷性統計不會因為大資料的普遍應用而降低各自的作用,兩者各有所長。

避免過於依賴推斷性統計

倪萬表示,對社科研究而言,大資料生成主要靠文獻資訊資料化、日常行為的資料化和觀點、意見、態度的資料化。其中,文獻資訊的資料由研究者設計資料採集指標體系,利用相關軟體生成,滿足研究者描述性分析的目標;日常行為的資料由系統監測自然流動的社會情境而生成,比較容易確證及結構化;而有關觀點、意見、態度的資料相對而言有一定採集難度,主要為非結構化資料或半結構化資料,而且這些資料難以結構化。

墨菲認為,當研究人員開始把大資料納入他們的研究時,用複雜的推斷性統計方法來過濾和分析資料的傾向就變得越來越嚴重。這種統計複雜度的提升可以幫助研究人員探究傳統資料分析工具不能充分揭示的問題,但也帶來了諸多挑戰。首先,當某些研究的統計分析變得愈發複雜,研究人員或研究成果的使用者就越難以理解該研究的內容。其次,有明確證據表明,統計分析越複雜,資料分析和解釋中出現重大偏差的可能性就越大。最後,社會與行為科學研究人員常用的許多方法非常依賴“零假設顯著性檢驗”進行統計推斷,而這個方法在科學界已越來越不受用。零假設顯著性檢驗是社會科學研究常用的統計推斷方法。何為零假設?比如政府針對緩解就業難問題推出了一項政策,零假設就是先假設這種政策是無效的,而顯著性檢驗就是用來推翻零假設的。假設政府的政策無效,那透過畢業生調查得到的就業情況應不樂觀,但最後事實是就業率上升了,那麼政策無效的可能性就很低了。然而,這種方法已備受研究者質疑,因為統計顯著性具有一定的不確定性,不能簡單根據顯著性結果而判定存在真實的效應。

墨菲表示,統計分析中的關鍵決策往往取決於一個複雜統計模型中的特殊引數是否具有統計顯著性。但統計顯著性測試在簡單統計中易於理解,當分析變得複雜後,統計測試的關鍵要素也變得愈發複雜。

倪萬提出,過於依賴推斷性統計容易陷入盲人摸象的境地,而描述性統計恰好在大資料的支撐下可以與推斷性統計結合,避免研究一葉障目。

 積極使用描述性統計

倪萬認為,在大資料時代,對文獻資料進行描述性統計研究不但方便而且對研究物件的分析更為全面,行為資料也會更為精確,對整體社科研究有著基礎性作用。對描述性統計而言,大樣本量的價值在確定資料分佈和相關關係方面作用突出,無論對文獻資料、行為資料還是態度資料,整體趨勢的分析都比較準確。

墨菲表示,複雜推斷性統計方法的缺陷在於,研究人員很難簡潔、準確地向研究結果的使用者做出解釋,以便幫助他們制定干預措施或政策。在這個意義上,描述性統計體現出其作為交流工具的優勢。社科研究人員應充分使用完善的圖表等工具,實現與政策制定者和大眾的良好交流。此外,準確、全面、正確地描述是所有實證分析的基礎。越重視描述性統計,研究產生有益影響的可能性就越高。