14、2 ,,因此 1/2 = P(A) = P( X a ),練習,1.如果隨機變量X的密度函數(shù)為,,,,從密度函數(shù)的意義可知,,三、幾種常見的連續(xù)型分布,,,,,,,,均勻分布的分布函數(shù)為,,,,,,,,,,,X,,,,X,,a,b,x,l,,l,,0,,即,在區(qū)間(a , b) 上服從均勻分布的 隨機變量 X ,落在區(qū)間(a , b)中任意 等長度的子區(qū)間內(nèi)的可能性是相同的,說 明,還可以將密度 寫成,2. 采用 的示性函數(shù),上的均勻分布,1. 類似地,我們可以定義區(qū)間,例4,某公共汽車站從上午7時起,,每15分鐘來一,班車,,即7:00, 7:15, 7:30, 7:45 等時刻有汽車到
15、達,此站,,如果乘客到達此站時間,是7:00到7:30之,間的均勻隨機變量,,試求他候車時間少于5分鐘的,概率.,解,以7:00為起點 0,,以分為單位,,依題意,解,以 7:00 為起點 0,,以分為單位,,依題意,為使候車時間少于 5 分鐘,,乘客必須在 7:10 到,7:15 之間,,或在 7:25 到 7:30 之間到達車站,,故所,求概率為,即乘客候車時間少于5分鐘的概率是 1/3.,例5 設(shè)隨機變量 X 在 2, 5 上服從均勻分布, 現(xiàn) 對 X 進行三次獨立觀測 ,試求至少有兩次觀測值 大于3 的概率.,X 的分布密度函數(shù)為, X 3 表示“對 X 的觀測值大于 3 的概率”,,
16、解,因而有,設(shè)Y 表示3次獨立觀測中觀測值大于3的次數(shù),,則,思考,設(shè)在-1,5上服從均勻分布,求方程,有實根的概率。,解 方程有實數(shù)根,,即,而 的密度函數(shù)為,所求概率為,均勻分布的背景材料,均勻分布在隨機模擬 ( Monte Carlo 方法) 理論中有重要的應(yīng)用。,假設(shè)連續(xù)隨機變量 X 有分布函數(shù) F (x) , 則隨機變量 F (X) U (0,1) ; 反之,如果隨機變量 u U (0,1) , 則隨機變量 F 1(u) 的分布函數(shù)就是 F (x) 。,(0,1) 區(qū)間上的均勻分布 U (0,1) 在概率論的理論研究中具有特殊的意義。,2.如果隨機變量 X的密度函數(shù)為,,則稱X
17、服從參數(shù)為 的指數(shù)分布,,的幾何圖形如圖.,注:,指數(shù)分布常用來描述對某,一事件發(fā)生的等待時間.例如,,乘客在公交車站等車的時間,電子元件的壽命等, 因而它在可靠性理論和排隊論中有廣泛的應(yīng)用.,,指數(shù)分布的重要作用,是常用它來作為各種“壽命”的近似,如通訊、保險、隨機服務(wù)系統(tǒng)等方面,,,,指數(shù)分布在排隊論和可靠性理論中有廣泛的應(yīng)用,常常用它來作為各種“壽命”的分布的近似.例如,電子元件的壽命,機器的維修時間, 生物體的壽命,隨機服務(wù)系統(tǒng)中的服務(wù)時間等都可認為是近似服從指數(shù)分布.,指數(shù)分布的一個重要性質(zhì)就是“無后效性”或“無記憶性”.具體敘述如下:,證,,假如把服從指數(shù)分布的隨機變量解釋為等待時
18、間,則上式表明,在在等待時間已經(jīng)超過s小時的條件下,至少需要再等待時間t 的統(tǒng)計規(guī)律與已經(jīng)等待了多長時間無關(guān),就像重新開始等待一樣,所以統(tǒng)計學中常稱指數(shù)分布為“永遠年青”的分布. . 值得指出的是,我們可以證明,指數(shù)分布是唯一具有“無記憶性”的連續(xù)型分布.,對任意的正數(shù) s 0 ,t 0 ,都有 P X s + t | X s = P X t ,比較,幾何分布的 “無記憶性” : P X = k = P X = m + k | X m ,所有離散分布里只有幾何分布具有 “無記憶性” 所有連續(xù)分布里只有指數(shù)分布才具有“無記憶性” 它們實際上都是某種 “等待分布” 。,補充 指數(shù)分
19、布的“無記憶性”,例6,已知其參數(shù),求 3 個這樣的元件使用 1000 小時,,至,少已有一個損壞的概率.,解,由題設(shè)知,,的分布函數(shù)為,由此得到,各元件的壽命是否超過 1000 小時是獨立的,,用,表示三個元件中使用 1000 小時損壞的元件數(shù),,例6,已知其參數(shù),求 3 個這樣的元件使用 1000 小時,,至,少已有一個損壞的概率.,解,各元件的壽命是否超過1000小時是獨立的,,用,表示三個元件中使用 1000 小時損壞的元件數(shù),,所求概率為,則,例7,,,電話亭時乙人恰好剛剛拿起話筒通話,試求:,(1) 甲人等待時間超過10分鐘的概率; (2) 甲人等待時間在10到20分鐘之間的概率;
20、 (3) 甲等待5分鐘以后至少再等待10分鐘的概率,解,由題意可知,甲人等待的時間與乙人通話的時間是一致的,所以實際上本題分別求的是乙人通話時間超過10分鐘的概率以及乙人通話時間在10到20分鐘之間的概率,由 知X的分布密度為,,(1)“甲人等待時間超過10分鐘”的概率為,(2)“甲人等待時間在10到20分鐘之間”的概率為,(3)“甲等待5分鐘以后至少再等待10分鐘”的概率為,可見,(1)與(3)結(jié)果相同,這恰與指數(shù)分布的“無記憶性”相吻合.,例8 設(shè)時間 內(nèi)有 粒子放射出來,,設(shè)X 為第一個粒子發(fā)射出來的時刻,則,,對任何 有,即X 的概率密度為,3. Gamma 分布,設(shè) 是
21、正常數(shù), 由積分,定義. 如果 X 的密度是,則稱X服從參數(shù) 的Gamma分布,,記作,這正是參數(shù)為 的指數(shù)分布,說 明,1、當 時, 即,此時,我們稱此分布為自由度為 n 的 分布,記作 . 它是數(shù)理統(tǒng)計學中重要的分布之一,2、如果 , ,其中 n 為 自然數(shù),則有,作業(yè),P63 練習2.4 1 2 4,,2.5 正態(tài)分布,一、正態(tài)分布的密度函數(shù)及其特點,二、標準正態(tài)分布,三、一般正態(tài)分布與標準正態(tài)分布的關(guān)系,正態(tài)分布是概率分布中最重要的一種分布,這有實踐與理論兩方面的原因。實踐方面的原因是,正態(tài)分布是自然界最常見的一種分布,例如測量的誤差、炮彈的落點、人
22、的身高與體重、農(nóng)作物的收獲量、波浪的高度等等都近似服從正態(tài)分布。一般來說,如果影響某一隨機變量的因素很多,而每一個因素都不起決定性作用,且這些影響是可以疊加的,則這個隨機變量服從正態(tài)分布,這點可用第5章的中心極限定理來加以證明。從理論方面來說,正態(tài)分布有許多良好的性質(zhì),如正態(tài)分布可以導出一些其它分布,而某些分布(如二項分布、泊松分布等)在一定的條件下可用正態(tài)分布來近似。,若連續(xù)型隨機變量 X 的概率密度函數(shù)為,則稱 X 服從參數(shù)為 和 的正態(tài)分布,,正態(tài)分布是應(yīng)用最廣泛的一種連續(xù)型分布.,十九世紀前葉,高斯加以推廣得到正態(tài)分布,,德莫佛最早發(fā)現(xiàn)了二項概率的一個近似公式,這一公式被認為是正態(tài)分布
23、的首次露面.,定義 (P64),記為 XN( , 2 ).,f (x)所確定的曲線叫作正態(tài)曲線.,其中 - 0 為常數(shù),,一 正態(tài)分布,所以通常稱為高斯分布.,由于連續(xù)型隨機變量唯一地由它的密度函數(shù)所描述,我們來看看正態(tài)分布的密度函數(shù)有什么特點.,在各種分布中具首要地位,正態(tài)分布密度的性質(zhì),(1) 在 x = 處取到最大值,故 f (x) 以為對稱軸,,令 x=+c, x=-c (c0), 分別代入f (x), 可得,且 f (+c)=f (-c),f (+c) f (), f (-c)f (),x =為 f (x) 的兩個拐點的橫坐標.,(2) 正態(tài)分布的密度曲線位于 x 軸的上方,且關(guān)于
24、x = 對稱,,對密度函數(shù)求導:,= 0 ,,(3) 密度曲線 y = f (x) 有拐點,即曲線 y = f (x) 向左右伸展時,越來越貼近 x 軸.,當 x 時,f (x) 0+,, 決定了圖形中峰的陡峭程度,若固定 ,改變 的值,,反之亦然,,則密度曲線左右整體平移.,(4) f (x) 以 x 軸為水平漸近線;,正態(tài)分布 N( , 2 )的密度函數(shù)圖形的特點:,兩頭低,中間高,左右對稱的 “峰” 狀,,若固定 ,改變 的值,, 決定了圖形的中心位置, 決定圖形的中心位置;,大量的隨機變量都服從或者近似服從正態(tài)分布.,但每個因素所起的作用不大.,經(jīng)濟學中的股票價格、產(chǎn)品的銷量等等,都服
25、從或近似服從正態(tài)分布.,正常條件下各種產(chǎn)品的質(zhì)量指標,如零件的尺寸;纖維的強度;,射擊目標的水平或垂直偏差,測量誤差,,,如某地的年降雨量,某地區(qū)成年男子的身高、體重,,農(nóng)作物的產(chǎn)量,小麥的穗長、株高;,生物學中同一群體的形態(tài)指標,,電子元器件的信號噪聲、電壓、電流;,有很多分布還可以用正態(tài)分布近似.,而正態(tài)分布自身還有很多良好的性質(zhì).,若影響某一數(shù)量指標的隨機因素很多,,每一因素獨立,,,服從正態(tài)分布,在自然現(xiàn)象和社會現(xiàn)象中,,若隨機變量 X N( , 2 ), 則,正態(tài)分布的分布函數(shù),X 的分布函數(shù),下面我們介紹一種最重要的正態(tài)分布 標準正態(tài)分布, = 0 , = 1 的正態(tài)分布稱為
26、標準正態(tài)分布.,其密度函數(shù)和分布函數(shù)常用 (x) 和 (x)表示:,可查表得其值,,,,,標準正態(tài)分布的重要性在于,任何一個一般的正態(tài)分布都可以通過線性變換轉(zhuǎn)化為標準正態(tài)分布.,,求 P(X 2. 5)及,Y N(0, 1),設(shè) XN ( , 2 ),,P(-1.64 X < 0.82).,解,P(X 2. 5)= 1-(2. 5),P(X < 0. 5)= F(0. 5),查表得,= 0. 6915 ;,= 1 - 0. 9938 = 0. 0062 ;,P(-1.64 X < 0.82) = (0. 82)- (-1. 64),,= (0. 82)-1- (1. 64),= 0. 7434
27、 ;,,=,,即若 X N( , 2 ),=,只需將標準正態(tài)分布的分布函數(shù)制成表,就可以解決正態(tài)分布的概率計算問題.,,例1,設(shè) XN(0 , 1 ),,,X 的概率密度為,其中 和 2 都是常數(shù), 任意, 0,整個概率密度曲線都在 x 軸的上方 以為對稱軸 在 x=處達到最大值 f ( x)以 x 軸為漸近線 x=為f ( x) 的兩個拐點的橫坐標,正態(tài)分布通過線性變換可轉(zhuǎn)化為標準正態(tài)分布,最重要的正態(tài)分布標準正態(tài)分布X N(0,1),正態(tài)分布,X N( , 2 ),并求該地區(qū)明年 8 月份降雨量超過250mm的概率.,例2 某地區(qū)8月份降雨量 X 服從 =185mm , = 28mm 的正
28、態(tài)分布,, XN (185 , 282),,寫出 X 的概率密度,,解,所求概率為,P(X 250) = 1- P(X 250),= 1-(2. 32),= 1- 0. 9898 = 0. 0102 .,再看幾個應(yīng)用正態(tài)分布的例子,我們已經(jīng)看到,當 n 很大,p 接近 0 或 1 時,二項分布近似泊松分布;,可以證明,如果 n 很大,而 p 不接近于 0 或 1 時,,二項分布近似于正態(tài)分布.,例3 公共汽車車門高度是按男子與車門頂頭碰頭機會在 0.01以下來設(shè)計的.,問門高度應(yīng)如何確定?,解 設(shè)車門高度為 h cm,,按設(shè)計要求應(yīng)有 P(Xh)0.01,或 P(X
29、足上式的最小 h:,若男子身高 XN(170, 62),, XN(170,62),,查表得 (2. 33) = 0. 9901 0. 99 ,, h=170+13.98, 184 .,設(shè)計車門高度為184mm時,可使男子與車門頂碰頭機會不超過0.01.,若 XN( , 2 )時,要求滿足 P(X x0)= p 的 x0 :,P(X x0)= p ,,如果某考生得48分, 求有多少考生名列該考生之前?,已知1987年全國普通高校統(tǒng)考物理成績 XN(42,36),,這表明有16% 的考生成績超過48分,,例4 (確定超前百分位數(shù)、排定名次),解,由條件知即求 P(X 48),,查表可知,即 84%
30、 的考生名列該考生之后.,= 1 - (1),,即成績高于甲的人數(shù)應(yīng)占考生 的16.9%,,對于錄取考試人們最關(guān)心的是 自己能否達到錄取分數(shù)線? 自己的名次?,某公司招工300名(正式工280,臨時工20名),,例5(預測錄取分數(shù)和考生名次),解,,166,, X N(166,932),,(1)(預測分數(shù)線),考生甲得256分,問他能否被錄用?如錄用能否被錄為正式工?,考后由媒體得知:考試總平均成績?yōu)?66分, 360分以上的高分考生有31人.,有1657人參加考試,考試滿分為400分.,高于此線的 考生頻率為 300 / 1657, 高于360分的考生頻率為,(2)(預測甲的名次),
31、當 X=256 時, P(X256),這表明高于256分的頻率應(yīng)為0.169,,排在甲前應(yīng)有,甲大約排在283名.,故甲能被錄取,,但成為正式工的可能性不大.,,, P(X360),設(shè)考生成績?yōu)閄,最低分數(shù)線為 x0,,類似計算可得,,= 0. 9974,例6,解,求 P(|X-| < k ) k=1,2,3 .,P(|X-| < 3 ) = P( - 3 < X < + 3 ),這表明 X 的取值幾乎全部集中在區(qū)間 - 3 , +3內(nèi),,這在統(tǒng)計學上稱作 3 準則(三倍標準差原則).,超出這個范圍的可能性不到 0. 3 % ,,從而可以忽略不計.,為應(yīng)用方便,下面引入標準正態(tài)分布分位數(shù)的概念
32、:,設(shè) XN( , 2 ),,由三 原則,可認為 X 落在(-3, 3)內(nèi),,,-3 3,若某校有200名初一學生,按能力分成 5 組參加某項測驗,求各組分別應(yīng)有多少人?,例7(按能力分組),學生學習能力一般服從正態(tài)分布,,解,設(shè)學習能力X N (0,1),,由三 原則,,則每組應(yīng)占 6/5 的范圍,,查表可知,由對稱性可知 A 組和E 組應(yīng)有2000.034587 (人), B 組和D 組應(yīng)有2000.2383747 (人), C 組應(yīng)有200-472-72 = 92 (人).,現(xiàn)分成組距相同的五組 A,B,C,D,E(如圖),,-1.8 -0.6 0.6 1.8,為應(yīng)用
33、方便,更一般地可以建立標準正態(tài)分布分位數(shù)的概念:,則稱 滿足等式 P(X u ) = 的數(shù) u 為標準正態(tài)分布的上側(cè) 分位數(shù);,定義,設(shè) XN(0 , 1 ),,0 < < 1 ,,P(X u )= 1- P(Xu ),稱滿足等式 P(|X|u/2 ) = 的數(shù) u/2 為標準正態(tài)分布的雙側(cè) 分位數(shù);,,u,-u/2,u/2,= ,,= 1-(u ), (u )= 1- ,,可查表得值,類似可得 (u/2 )= 1- /2 ,,,,若 XN( , 2 )時,要求滿足 P(X x0 )= 的 x0 :,(u )= 1- u,,例8 已知某機器生產(chǎn)的螺栓長度XN(10.05,0.0036)。若
34、規(guī)定螺栓長度在10.050.12內(nèi)為合格品, 試求螺栓為合格品的概率。,解: 由于螺栓長度XN(10.05,0.0036), 因此,即螺栓為合格品的概率為95.44%。,已知 X N(3, 22), 且 PXk = PXk, 則 k = ( ).,3,練習(1),設(shè) X N(, 42), Y N(, 52), 記 p1 = PX 4,p2 = PY +5, 則( ) 對任意的 ,都有 p1 = p2 對任意的 ,都有 p1 p2,,練習(2),作業(yè),P68 練習2.5 2 3 4,,2.6 隨機變量函數(shù)及其分布,一、隨機變量函數(shù)的定義,二、離散型隨機變量函數(shù)的分布,三、連續(xù)型隨機變量
35、函數(shù)的分布,已知圓軸截面直徑 d 的分布,,求截面面積 A= 的分布.,再如,,求功率 W=V 2/ R (R為電阻)的分布等.,已知t =t 0 時刻噪聲電壓V 的分布,,在實際中,人們常常對隨機變量 X 的函數(shù)Y= g (X)所表示的隨機變量 Y 更感興趣,設(shè)隨機變量X 的分布已知,又Y= g (X) (設(shè)g是連續(xù)函數(shù)),無論在實踐中還是 在理論上都是重要的,如何由 X 的分布求出 Y 的分布?,通過實例找方法,例1,( X 取某值與 Y 取其對應(yīng)值是相同的事件,兩者的概率應(yīng)相同 ),一、離散型隨機變量函數(shù)的分布,解,則 Y=g( X )的分布列為,X 取值分別為 -2, -1, 0,
36、 1, 2 時, Y=2X+1 對應(yīng)值為-3, -1, 1, 3, 5.,求Y=2X+1,Y=X 2 的分布列.,X Y=X 2 -2 4 -1 1 0 0 1 1 2 4,-2, 2 4 -1, 1 1 0 0,一般地,離散型隨機變量 X 的分布列為,將它們對應(yīng)的概率相加后和并成一項即可,若g(xk)中有相等值,,,,(報童問題) 假定報童有 5 份報紙,賣出的數(shù)量 X 分布律如下,k 0 1 2 3 4 5 pk 0.1 0.1 0.2 0.3 0.2 0.1,他每賣掉一份報紙將獲得報酬 1 元,沒有賣出 而剩下的每份賠償 0.5
37、元。計算最終所得的分布。,,,解. 以 Y 記報童最終的所得,因此有 Y = 1X 0.5( 5 X) = 1.5 X 2.5,k 0 1 2 3 4 5 pk 0.1 0.1 0.2 0.3 0.2 0.1,,,X 的分布律,k 2.5 1 0.5 2 3.5 5 pk 0.1 0.1 0.2 0.3 0.2 0.1,,,Y = 1.5 X 2.5 的分布律,則 FY ( y ) = P(Y y),解 設(shè)Y 的分布函數(shù)為 FY ( y ),,例2,設(shè) X 具有概率密度,求 Y = -2X + 8 的概率密度.,于是Y 的概率密度為
38、,二、連續(xù)型隨機變量函數(shù)的分布,注意到 0 < x < 4 時,,即 0 < y < 8 時,,此時,,,,= P(-2X+8 y),,設(shè) X 具有概率密度,求導可得,當 y 0 時,,注意到 Y = X 2 0,故當 y 0時,F(xiàn)Y ( y) = 0;,解 設(shè)Y 和X 的分布函數(shù)分別為FY ( y) 和 FX (x),,例3,則 Y=X 2 的概率密度為,,,Y 服從自由度為 1 的 分布,求Y=X 2 的概率密度.,從上述兩例中可看到,在求P Y y 的過程中, 關(guān)鍵是第一步中: 設(shè)法從 g(X) y 中解出X, 從而得到與 g(X) y 等價的關(guān)于 X 的不等式 .,用 代
39、替 X 2 y ,即利用已知的 X 的分布,求出 X 的函數(shù)的分布,用 代替 -2 X + 8 y ,求連續(xù)型隨機變量的函數(shù)的分布的常用方法,如例2中,,如例3中,,,定理,則 Y = g(X) 是一個連續(xù)型隨機變量,其概率密度為,又 y = g(x) 處處可導,且有g(shù) (x)0 (或恒有g(shù) (x)<0),,,類似可證 g (x)<0 時,,定理的證明與前面的解題思路完全類似.,設(shè)連續(xù)型隨機變量 X 具有概率密度 fX(x),,定理,下面求Y 的分布函數(shù)FY(y):,證,由于,g 保號,h( y)是g(x) 的反函數(shù),綜合以上即有結(jié)論成立.,a b a b,試證 X 的線性函數(shù)
40、 Y=aX+b (a 0) 也服從正態(tài)分布.,證 X 的概率密度為,例4 設(shè)隨機變量 XN(, 2 ),,顯然 y = g(x) = a x+b可導且g =a 保號,Y=aX+b 的概率密度為,由定理知, Y = aX + b (a + b , (|a| )2 ),即,注 取 ,, 驗證函數(shù)可導且單調(diào), 求反函數(shù)及其導數(shù), 代入定理公式即得函數(shù)的密度,注意取絕對值,有 , 確定y的取值范圍,求 Y = 1- e X 的概率密度.,解,例5 設(shè) X 的概率密度為,顯然 y = g(x) = 1- e x 可導, 且g = - e x 保號,,Y = 1- e X 的概率密度為,由定理知,即,,,,注意取絕對值,,先轉(zhuǎn)化為分布函數(shù), 再求導,已知 X 的概率密度為,求Y = sinX 的概率密度.,例6,利用分布函數(shù)求概率密度:,函數(shù) y = g(x) = sinx 在0,上為非單調(diào)函數(shù),,解,故不能用定理求.,x0, 時,,y 0 時,,0