農林漁牧網

您現在的位置是:首頁 > 農業

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

2022-02-26由 高考自主學習課堂 發表于 農業

莖葉圖怎麼分析

1.

知識要點

統計廣泛應用於工作、生活中,如生產管理、影響管理,具有實用性強的特點。即使在當今的大資料時代,統計學的方法仍是資料分析的靈魂。

高中階段學了用樣本估計整體的兩種方法,它們在整個統計過程的

位置與作用

見下圖:

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

① (直觀的)頻率分佈法——分佈表、直方圖、折線圖、莖葉圖

② (量化的)數字特徵法——眾數、中位數、極差、平均數、方差

2.

基本問題說明

一般地,用樣本估計總體的基本問題有:

① 根據已知樣本資料,求解頻率

分佈表

和/或畫出直方圖、折線圖、莖葉圖,以此估計總體的情況。;

② 根據已知樣本資料,求解眾數、中位數、極差、平均數、方差等

數字特徵

,以此估計總體的情況。

3.

解決問題的一般方法

1) 熟練掌握頻率分佈表、直方圖、折線圖、莖葉圖等概念及其求解一般方法

① 畫頻率分佈直方圖的

一般方法

a) 確定橫座標

求極差(即一組資料中最大值與最小值的差);

定分組數;

得每組資料(即組距。注意,兩組之間的邊界值歸入上或下一組都行,但通常不會同時被包含或不被包含!)

b) 確定縱座標

統計頻數;

算出頻率;

得出縱座標(即頻率/組距);

c) 列頻率分佈表(在解答填空或選擇題時,在草稿紙上簡捷完成即可,目的是為了方便檢查和避免犯錯)

統計頻數;

計算頻率。

d) 畫頻率分佈直方圖。

提示

1:頻率分佈直方圖中小矩形的面積=組距×矩形高度(頻率/組距)=頻率。

提示

2:各組頻率之和為1(可利用此點來演算)。

② 莖葉圖的作圖步驟及要求

a) 先莖後葉;

b) 莖有序,葉無序(按資料出現先後順序依次填入即可)

2) 熟練掌握眾數、中位數、極差、平均數、方差等數字特徵的概念與公式。

4.

典型例題

例1

在生產過程中,測得纖維產品的纖度(表示纖維粗細的一種量)共有 100 個數據,將資料分組如表。

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

(1)完成頻率分佈表,並畫出頻率分佈直方圖。

(2)估計纖度落在[1。38, 1。50]中的機率及纖度小於1。40的機率是多少?

(3)統計方法中,同一組資料常用該組區間的中點值(例如區間[1。30, 1。34]的中點值是1。32)作為代表.據此,估計纖度的期望。

:(1)頻率分佈表如下(

提示

:注意分組邊界處為一開一閉):

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

頻率分佈直方圖如下:

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

(2)纖度落在[1。38, 1。50]中的機率約為:

0。30+0。29+0。10 =0。69;

纖度小於1。40的機率約為:

0。04+0。25+0。5×0。30=0。44;

(3)總體資料的期望約為:

1。32×0。04+1。36×0。25+1。40×0。30+1。44×0。29+1。48×0。10+1。52×0。02=1。4088。

講解

① 如還未學到數學期望的概念,可跳過最後一問。不過,也可參照基礎知識中的“加權平均數”概念現學現賣:當統計物件為樣本值、權為其頻率時,此時的加權平均數成為

數學期望。

例2 (

山東文14)如圖是根據部分城市某年6月份的平均氣溫(單位: “C)資料得到的樣本頻率分佈直方圖,其中平均氣溫的範圍是[20。5, 26。5], 樣本資料的分組為[20。5, 21。5), [21。5, 22。5), [22。5, 23。5), [23。5, 24。5), [24。5, 25。5), [25。5, 26。5]。 已知樣本中平均氣溫低於22。5”C 的城市個數為11, 則樣本中平均氣溫不低於25。5“C 的城市個數為___

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

解:

平均氣溫低於22。5℃的頻率,即最左邊兩個矩形面積之和為:

0。10×1+0。12×1=0。22,

所以總城市數(樣本容量)為:

11÷0。22=50,

平均氣溫不低於25。5℃的頻率即為最右面矩形面積為:

0。18×1=0。18,

所以平均氣溫不低於25。5℃的城市個數為:

50×0。18=9.

故所求城市個數為9。

講解

講解

① 本題考查頻率分佈直方圖的應用能力,即根據已知頻率分佈直方圖,閱讀並利用圖形及其資料來分析和解決問題的能力。

② 根據已知的頻率分佈直方圖,可得到以下關係式:

關係式1:頻率=小矩形的面積=組距×矩形高度(頻率/組距)

關係式2:頻數=頻率×樣本容量。

關係式3:各組頻率之和為1(這點除了用來解題,還可用以驗算)。

逆用關係式“頻數=頻率×樣本容量”先求出樣本容量,再正用該關係式求出所求頻數。

本題的解題一般方法

:由“頻數=頻率×樣本容量”可變形為“樣本容量=頻數/頻率”,

解題一般方法

。所以本題也可簡潔地列出以下等式進行求解:11/0。22 = x/0。18。

提示1

出題人也可以

即不同組的頻數/頻率值相等

如各組頻率之和為1來進行題設,分析、求解方法與本題類似。因此,只要熟練掌握頻率分佈直方圖的概念和特性,無論正用或逆用,均能靈活應用、觸類旁通。本文就不應用舉例了。

提示2:

逆用其它關係式

在最近的10次數學考試中,甲同學的成績分別為82,85,73,65,74,91,83,76, 93, 88;乙同學的成績分別為75,68,73,74,84,83,66,87,77,85, 根據以上資料做甲乙兩個人成績的莖葉圖。

:如圖。

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

例3

① 莖葉圖的特性

a) 能讀出原始資料(莖葉拼在一起即可)

b) 莖葉圖逆時針旋轉90度,就成了另類直方圖了

c) 莖葉圖具有易修改、易增添、有原始資料等優點(但不適用於資料量大的情形而直方圖適用)

d) 直觀

甲、乙兩人在10天中每天加工零件的個數用莖葉圖表示如下圖,中間一列的數字表示零件個數的十位數,兩邊的數字表示零件個數的個位數,則這10天甲、乙兩人日加工零件的平均數分別為___和___。

講解

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

例4

:(

:已知莖葉圖的應用,只要能讀懂圖即可解出來。屬送分題,千萬不能算出)

由莖葉圖知,甲加工零件個數的平均數為:

(19+18+20×2+21+22+23+31×2+35)/10=24

乙加工零件個數的平均數為:

(19+17+11+21+22+24×2+30×2+32)/10 = 23

故答案為:24;23.

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

① 本題為統計數字特徵的基礎應用題型。

② 無論何種解法,都必須先掌握準確理解相關基本概念及其應用的一般思路和方法,然後再根據題意靈活選取合適解題路徑或思路。

③ 本題結論意為:=α+(1-α),即與、之間的接近程度不是由其平均值大小決定的,而是由兩組樣本的數量大小決定。

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

提示

① 熟練掌握數字特徵公式及其應用與逆用。

講解

由正整陣列成的一組資料x1,x2,x3,x4,其平均數和中位數都是2,且標準差等於1,則這組資料為______.(從小到大排列)

兩種分析方法,求解“用樣本估計總體”問題,大資料時代實用技能

解得x4=1(捨去)或x4=3,符合題意,由此可得x1=1

故答案為1,1,3,3

溫馨提示:關注百家號“輕快學習課堂”,可查閱更多精彩文章與影片。