《新編高中數(shù)學課本典例改編之選修2-1、2-2、2-3:專題六 隨機變量及其分布列、統(tǒng)計案例 Word版含解析》由會員分享,可在線閱讀,更多相關《新編高中數(shù)學課本典例改編之選修2-1、2-2、2-3:專題六 隨機變量及其分布列、統(tǒng)計案例 Word版含解析(10頁珍藏版)》請在裝配圖網上搜索。
1、
專題六 隨機變量及其分布列、統(tǒng)計案例
一、題之源:課本基礎知識
1.離散型隨機變量
隨著試驗結果變化而變化的變量稱為隨機變量,常用字母X,Y,ξ,η,…表示.所有取值可以一一列出的隨機變量,稱為離散型隨機變量.
2.離散型隨機變量的分布列及其性質
(1)一般地,若離散型隨機變量X可能取的不同值為x1,x2,…,xi,…,xn,X取每一個值xi(i=1,2,…,n)的概率P(X=xi)=pi,則表
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
稱為離散型隨機變量X的概率分布列,簡稱為X的分布列,有時為了表
2、達簡單,也用等式P(X=xi)=pi,i=1,2,…,n表示X的分布列.
(2)離散型隨機變量的分布列的性質
①pi≥0(i=1,2,…,n);
②pi=1.
3.常見離散型隨機變量的分布列
(1)兩點分布:
若隨機變量X服從兩點分布,則其分布列為
X
0
1
P
1-p
p
其中p=P(X=1)稱為成功概率.
(2)超幾何分布
在含有M件次品的N件產品中,任取n件,其中恰有X件次品,則事件{X=k}發(fā)生的概率為P(X=k)=,k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*,稱分布列為超幾何分布列.
X
0
1
…
3、m
P
…
4.條件概率
條件概率的定義
條件概率的性質
設A、B為兩個事件,且P(A)>0,稱P(B|A)=為在事件A發(fā)生的條件下,事件B發(fā)生的條件概率
(1)0≤P(B|A)≤1
(2)如果B和C是兩個互斥事件,則P(B∪C|A)=P(B|A)+P(C|A).
5.事件的相互獨立性
(1)定義:設A,B為兩個事件,如果P(AB)=P(A)P(B),則稱事件A與事件B相互獨立.
(2)性質:
①若事件A與B相互獨立,則P(B|A)=P(B),
P(A|B)=P(A),P(AB)=P(A)P(B).
②如果事件A與B相互獨立,那么A與,與B,與也相互獨立
4、.
6.獨立重復試驗與二項分布
獨立重復試驗
二項分布
定義
在相同條件下重復做的n次試驗稱為n次獨立重復試驗
在n次獨立重復試驗中,用X表示事件A發(fā)生的次數(shù),設每次試驗中事件A發(fā)生的概率是p,此時稱隨機變量X服從二項分布,記作X~B(n,p),并稱p為成功概率
計算公式
用Ai(i=1,2,…,n)表示第i次試驗結果,則P(A1A2A3…An) =P(A1)P(A2)…P(An)
在n次獨立重復試驗中,事件A恰好發(fā)生k次的概率為P(X=k)=Cpk(1-p)n-k(k=0,1,2,…,n)
7.離散型隨機變量的均值與方差
若離散型隨機變量X的分布列為
X
x1
5、
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
(1)均值:稱E(X)=x1p1+x2p2+…+xipi+…+xnpn為隨機變量X的均值或數(shù)學期望,它反映了離散型隨機變量取值的平均水平.
(2)D(X)= (xi-E(X))2pi為隨機變量X的方差,它刻畫了隨機變量X與其均值E(X)的平均偏離程度,其算術平方根為隨機變量X的標準差.
8.均值與方差的性質
(a,b為常數(shù)).
9.兩點分布與二項分布的均值、方差
X
X服從兩點分布
X~B(n,p)
E(X)
p(p為成功概率)
np
D(X)
p(1-p)
np(1-p)
10
6、.正態(tài)曲線的特點
(1)曲線位于x軸上方,與x軸不相交;
(2)曲線是單峰的,它關于直線x=μ對稱;
(3)曲線在x=μ處達到峰值;
(4)曲線與x軸之間的面積為1;
(5)當σ一定時,曲線隨著μ的變化而沿x軸平移;
(6)當μ一定時,曲線的形狀由σ確定.σ越小,曲線越“瘦高”,表示總體的分布越集中;σ越大,曲線越“矮胖”,表示總體的分布越分散.
11.變量間的相關關系
(1)常見的兩變量之間的關系有兩類:一類是函數(shù)關系,另一類是相關關系;與函數(shù)關系不同,相關關系是一種非確定性關系.
(2)從散點圖上看,點分布在從左下角到右上角的區(qū)域內,兩個變量的這種相關關系稱為正相關,點分
7、布在左上角到右下角的區(qū)域內,兩個變量的相關關系為負相關.
12.兩個變量的線性相關
(1)從散點圖上看,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,稱兩個變量之間具有線性相關關系,這條直線叫回歸直線.
(2)回歸方程為=x+,其中=,=-.
(3)通過求Q= (yi-bxi-a)2的最小值而得出回歸直線的方法,即求回歸直線,使得樣本數(shù)據(jù)的點到它的距離的平方和最小,這一方法叫做最小二乘法.
(4)相關系數(shù):
當r>0時,表明兩個變量正相關;
當r<0時,表明兩個變量負相關.
r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0,表明兩個變量之間
8、幾乎不存在線性相關關系,通常|r|大于0.75時,認為兩個變量有很強的線性相關性.
13.獨立性檢驗
假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:
y1
y2
總計
x1
a
b
a+b
x2
c
d
c+d
總計
a+c
b+d
a+b+c+d
K2=(其中n=a+b+c+d為樣本容量).
二、題之本:思想方法技巧
1.求離散型隨機變量的分布列的步驟
(1)明確隨機變量的所有可能取值,以及每個值所表示的意義,判斷一個變量是否為離散型隨機變量,主要看變量的值能否按一定的順序一一列
9、出.
(2)利用概率的有關知識,求出隨機變量取每個值的概率.對于古典概率、互斥事件的概率、相互獨立事件同時發(fā)生的概率、n次獨立重復試驗恰有k次發(fā)生的概率等,都要能熟練計算.
(3)按規(guī)范形式寫出分布列,并用分布列的性質驗證.
2.分布列的結構為兩行,第一行為隨機變量X所有可能的取值,第二行是對應于隨機變量X的值的事件發(fā)生的概率.在每一列中,上為“事件”,下為事件發(fā)生的概率,只不過“事件”是用一個反映其結果的實數(shù)表示的.每完成一列,就相當于求一個隨機事件發(fā)生的概率.
3.可用超幾何分布解決的題目涉及的背景多數(shù)是生活、生產實踐中的問題,且往往由明顯的兩部分組成,如產品中的正品和次品,盒中的
10、白球和黑球,同學中的男生和女生等.注意弄清楚超幾何分布與二項分布的區(qū)別與聯(lián)系.
4.“獨立”與“互斥”的區(qū)別
兩事件互斥是指兩個事件不可能同時發(fā)生,兩事件相互獨立是指一個事件發(fā)生與否對另一事件發(fā)生的概率沒有影響(如有放回的抽取模型).兩事件相互獨立通常不互斥,兩事件互斥通常不獨立.
5.條件概率的求法
(1)利用定義,分別求出P(A),P(AB),得P(B|A)=;
(2)借助古典概型概率公式,先求事件A包含的基本事件數(shù)n(A),再在事件A發(fā)生的條件下求事件B包含的基本事件數(shù)n(AB),即P(B|A)=.
(3)為了求一些復雜事件的條件概率,往往可以先把它分解為兩個(或若干個)互斥
11、事件的和,利用公式P(B∪C|A)=P(B|A)+P(C|A)進行計算,其中B,C互斥.
6.對n次獨立重復試驗的理解
(1)在n次獨立重復試驗中,事件A恰好發(fā)生k次的概率為P(X=k)=Cpk(1-p)n-k,k=0,1,2,…,n,其中p是一次試驗中該事件發(fā)生的概率.實際上,Cpk(1-p)n-k正好是二項式(1-p)+p]n的展開式中的第k+1項.這也是二項分布名稱的由來.
(2)要弄清n次獨立重復試驗中恰好發(fā)生k次的概率與第k次才發(fā)生的概率計算公式Pn(k)=Cpk(1-p)n-k與Pk=(1-p)k-1p的區(qū)別.
7.相互獨立事件同時發(fā)生的概率的求法
(1)利用相互獨立事件
12、的概率乘法公式直接求解;
(2)正面計算較繁或難于入手時,可以從其對立事件入手進行計算.
8.正確理解獨立重復試驗與獨立事件間的關系
獨立重復試驗是指在同樣條件下可重復進行的,各次之間相互獨立的一種試驗,每次試驗都只有兩種結果(即某事件要么發(fā)生,要么不發(fā)生),并且在每次試驗中,事件發(fā)生的概率均相等.獨立重復試驗是相互獨立事件的特例(概率公式也是如此),就像對立事件是互斥事件的特例一樣.一般地,有“恰好”等字眼的用獨立重復試驗的概率公式計算更簡單,就像有“至少”或“至多”等字眼的題目用對立事件的概率公式計算更簡單一樣.
9.均值與方差的常用性質
掌握下述有關性質,會給解題帶來方便:
13、(1)E(aX+b)=aE(X)+b;
E(X+Y)=E(X)+E(Y);
D(aX+b)=a2D(X).
(2)若X~B(n,p),則E(X)=np,D(X)=np(1-p).
10.計算均值與方差的基本方法
(1)已知隨機變量的概率分布求它的均值、方差和標準差,可直接用定義或公式求;
(2)已知隨機變量X的均值、方差,求X的線性函數(shù)Y=aX+b的均值、方差和標準差,可直接用均值及方差的性質求;
(3)如能分析所給隨機變量服從常用的分布(如兩點分布、二項分布等),則可直接利用它們的均值、方差公式來求.
11.(1)在實際中經常用均值來比較平均水平,當平均水平相近時,再用方差比
14、較穩(wěn)定程度;(2)注意離散型隨機變量的均值、方差與樣本數(shù)據(jù)的平均數(shù)、方差的區(qū)別與聯(lián)系.
12.正態(tài)曲線的性質特點可用來求其數(shù)學期望μ和標準差σ:正態(tài)曲線是單峰的,它關于直線x=μ對稱,據(jù)此結合圖象可求μ;正態(tài)曲線在x=μ處達到峰值,據(jù)此結合圖象可求σ.
13.能熟練應用正態(tài)曲線的對稱性解題,并注意以下幾點:
(1)正態(tài)曲線與x軸之間的面積為1;
(2)正態(tài)曲線關于直線x=μ對稱,從而在關于x=μ對稱的區(qū)間上概率相等;
(3)幾個常用公式:
P(X0,則
P(X<μ-b)=.
14.無論是
15、正態(tài)分布的正向或逆向的應用問題,關鍵都是先確定μ,σ,然后利用對稱性,將所求概率轉化到三個特殊區(qū)間.
15.在研究兩個變量之間是否存在某種關系時,必須從散點圖入手.對于散點圖,可以做出如下判斷:
(1)如果所有的樣本點都落在某一函數(shù)曲線上,就用該函數(shù)來描述變量之間的關系,即變量之間具有函數(shù)關系.
(2)如果所有的樣本點都落在某一函數(shù)曲線附近,變量之間就有相關關系.
(3)如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系.
16.分析兩個變量相關關系的常用方法:
(1)利用散點圖進行判斷;
(2)利用相關系數(shù)r進行判斷.
17.
(1)回歸分析是對具有相關關系的兩個
16、變量進行統(tǒng)計分析的方法,只有在散點圖大致呈線性時,求出的回歸直線方程才有實際意義,否則無意義.
(2)根據(jù)回歸方程進行的估計僅是一個預測值,而不是真實發(fā)生的值.
(3)用最小二乘法求回歸方程,關鍵在于正確求出系數(shù),,由于,的計算量較大,計算時應仔細小心.
18.線性回歸分析的方法、步驟
(1)畫出兩個變量的散點圖;
(2)求相關系數(shù)r,并確定兩個變量的相關程度的高低;
(3)用最小二乘法求回歸直線方程=x+,
(4)利用回歸直線方程進行預報.
注:①對于非線性(可線性化)的回歸分析,一般是利用條件及我們熟識的函數(shù)模型,將題目中的非線性關系轉化為線性關系進行分析,最后還原.②
17、利用相關指數(shù)R2=1-刻畫回歸效果時,R2越大,意味著殘差平方和越小,模型的擬合效果越好.
19.獨立性檢驗的一般步驟
(1)假設兩個分類變量x與y沒有關系;
(2)計算出K2的觀測值,其中
K2=;
(3)把K2的值與臨界值比較,作出合理的判斷.
20.獨立性檢驗的注意事項
(1)在列聯(lián)表中注意事件的對應及相關值的確定,不可混淆.
(2)在實際問題中,獨立性檢驗的結論僅是一種數(shù)學關系表述,得到的結論有一定的概率出錯.
(3)對判斷結果進行描述時,注意對象的選取要準確無誤,應是對假設結論進行的含概率的判斷,而非其他.
三、題之變:課本典例改編
1.原題(選修2-3第八十
18、六頁例2)一只紅鈴蟲的產卵數(shù) 和溫度 有關,現(xiàn)收集了 7 組觀測數(shù)據(jù)列于表中,試建立 與 之間的回歸方程。
溫度
21
23
25
27
29
32
35
產卵數(shù)個
7
11
21
24
66
115
325
改編 為了對佛山市中考成績進行分析,在60分以上的全體同學中隨機抽出8位,他們的數(shù)學(已折算為百分制)、物理、化學分數(shù)對應如下表,
學生編號
1
2
3
4
5
6
7
8
數(shù)學分數(shù)x
60
65
70
75
80
85
90
95
物理分數(shù)y
72
77
80
84
88
90
93
9
19、5
化學分數(shù)z
67
72
76
80
84
87
90
92
(1) 若規(guī)定85分(包括85分)以上為優(yōu)秀,求這8位同學中數(shù)學和物理分數(shù)均為優(yōu)秀的概率;
(2) 用變量y與x、z與x的相關系數(shù)說明物理與數(shù)學、化學與數(shù)學的相關程度;
(3) 求y與x、z與x的線性回歸方程(系數(shù)精確到0.01),并用相關指數(shù)比較所求回歸模型的效果.
參考數(shù)據(jù):,,,,,,,,,,.
(3) 設y與x、z與x的線性回歸方程分別是、.
根據(jù)所給的數(shù)據(jù),可以計算出,
.
所以y與x和z與x的回歸方程分別是、.
又y與x、z與x的相關指數(shù)是、.
故回歸模型比回歸模型
20、的擬合的效果好.
2.原題(選修2-3第九十五頁例1)改編 甲乙兩個學校高三年級分別有1100人,1000人,為了了解兩個學校全體高三年級學生在該地區(qū)二模考試的數(shù)學成績情況,采用分層抽樣方法從兩個學校一共抽取了 105名學生的數(shù)學成績,并作出了如下的頻數(shù)分布統(tǒng)計表,規(guī)定考試成績在120,150]內為優(yōu)秀,甲校:
乙校:
(I )計算的值;
(II)由以上統(tǒng)計數(shù)據(jù)填寫右面列聯(lián)表,若按是否優(yōu)秀來判斷,是否有97.5% 的把握認為兩個學校的數(shù)學成績有差異.
(III)根據(jù)抽樣結果分別估計甲校和乙校的優(yōu)秀率;若把頻率作為概率,現(xiàn)從乙校學生中任取3人,求優(yōu)秀學生人數(shù)的分布列和數(shù)學期望;
附:
(III)甲校優(yōu)秀率為乙校優(yōu)秀率為
,
0
1
2
3
分布列:
期望: