《數(shù)據(jù)模型與決策》PPT課件.ppt
參數(shù)估計(jì):點(diǎn)估計(jì)和區(qū)間估計(jì).假設(shè)檢驗(yàn):利用樣本判斷某個(gè)假設(shè)的真?zhèn)?統(tǒng)計(jì)推斷的基本問(wèn)題,一般常用?表示參數(shù),參數(shù)?所有可能取值組成的集合稱(chēng)為參數(shù)空間,常用?表示。參數(shù)估計(jì)問(wèn)題就是根據(jù)樣本對(duì)上述各種未知參數(shù)作出估計(jì)。參數(shù)估計(jì)的形式有兩種:點(diǎn)估計(jì)與區(qū)間估計(jì)。,參數(shù)估計(jì),點(diǎn)估計(jì)的幾種方法,矩法估計(jì)替換原理是指用樣本矩及其函數(shù)去替換相應(yīng)的總體矩及其函數(shù),譬如:用樣本均值估計(jì)總體均值E(X),即;用樣本方差估計(jì)總體方差Var(X),即用樣本的p分位數(shù)估計(jì)總體的p分位數(shù),用樣本中位數(shù)估計(jì)總體中位數(shù)。,例對(duì)某型號(hào)的20輛汽車(chē)記錄其每加侖汽油的行駛里程(km),觀(guān)測(cè)數(shù)據(jù)如下:29.827.628.327.930.128.729.928.027.928.728.427.229.528.528.030.029.129.829.626.9經(jīng)計(jì)算有由此給出總體均值、方差和中位數(shù)的估計(jì)分別為:28.695,0.9185和28.6。,極(最)大似然估計(jì),定義設(shè)總體的概率函數(shù)為P(x;?),?是參數(shù)?可能取值的參數(shù)空間,x1,x2,…,xn是樣本,將樣本的聯(lián)合概率函數(shù)看成?的函數(shù),用L(?;x1,x2,…,xn)表示,簡(jiǎn)記為L(zhǎng)(?),稱(chēng)為樣本的似然函數(shù)。,如果某統(tǒng)計(jì)量滿(mǎn)足則稱(chēng)是?的最(極)大似然估計(jì),簡(jiǎn)記為MLE(MaximumLikelihoodEstimate)。,人們通常更習(xí)慣于由對(duì)數(shù)似然函數(shù)lnL(?)出發(fā)尋找?的最大似然估計(jì)。當(dāng)L(?)是可微函數(shù)時(shí),求導(dǎo)是求最大似然估計(jì)最常用的方法,對(duì)lnL(?)求導(dǎo)更加簡(jiǎn)單些。,極大似然估計(jì)的例,色盲的遺傳學(xué)問(wèn)題研究,評(píng)價(jià)點(diǎn)估計(jì)的優(yōu)良標(biāo)準(zhǔn),估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)??梢宰C明樣本均值是總體均值的無(wú)偏估計(jì)量;樣本比例是總體比例的無(wú)偏估計(jì)量,隨著樣本容量的增大,估計(jì)量的值越來(lái)越接近被估計(jì)的總體參數(shù)可以證明樣本均值是總體均值的一致估計(jì)量;樣本比例是總體比例的一致估計(jì)量;樣本方差是總體方差的一致估計(jì)量。,對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效可以證明樣本均值是總體均值的有效估計(jì)量;樣本比例是總體比例的有效估計(jì)量。,返回,無(wú)偏性(P130)一致性(P133)有效性(P132),區(qū)間估計(jì),區(qū)間估計(jì)是根據(jù)樣本統(tǒng)計(jì)量來(lái)估計(jì)總體未知參數(shù)所在的可能區(qū)間的方法。由于這種估計(jì)的區(qū)間能以一定的置信度來(lái)保證估計(jì)的準(zhǔn)確性,因此,也稱(chēng)該區(qū)間為置信區(qū)間區(qū)間估計(jì)的基本要求:置信度:區(qū)間估計(jì)時(shí),希望區(qū)間包含總體參數(shù)的概率越大越好精確度:區(qū)間估計(jì)時(shí),希望區(qū)間的平均長(zhǎng)度越短越好,克林頓政府外交和經(jīng)濟(jì)政策的支持率,《今日美國(guó)報(bào)》和美國(guó)有線(xiàn)電視新聞網(wǎng)(CNN)27日公布一項(xiàng)民意測(cè)驗(yàn)調(diào)查結(jié)果:克林頓政府外交政策支持率為39%,經(jīng)濟(jì)政策支持率為42%。民意調(diào)查于4月22日至24日在1015人中進(jìn)行,其誤差在3%之內(nèi)。,(摘自1994年4月28日新民晚報(bào)),總體美國(guó)2億五千多萬(wàn)成年人,樣本1015人,,,抽取樣本,推斷總體,總體與樣本,在全部美國(guó)2億五千多萬(wàn)成年人中克林頓政府外交政策和經(jīng)濟(jì)政策支持率各是多少?,經(jīng)統(tǒng)計(jì):在樣本1015人中各有39%(396)的和42%(426)的人分別支持克林頓政府的外交政策和經(jīng)濟(jì)政策,估計(jì),克林頓政府外交政策支持率為39%克林頓政府經(jīng)濟(jì)政策支持率為42%誤差在3%之內(nèi)。,樣本、樣本量與可信度,1015人是從美國(guó)2億五千多萬(wàn)成年人中隨機(jī)抽取的,調(diào)查的1015人中有多少人支持克林頓政府的外交政策,有多少人支持克林頓政府的經(jīng)濟(jì)政策顯然是不確定。根據(jù)統(tǒng)計(jì)的理論和方法,抽取了足夠多的1015人的樣本,樣本隨機(jī)抽取,計(jì)算正確,推斷有依據(jù),所以說(shuō)支持率是39%與42%,其可信程度是不低的。,“誤差在3%之內(nèi)”的含義,克林頓政府外交政策支持率的區(qū)間估計(jì)為39%3%,即(36%,42%);克林頓政府經(jīng)濟(jì)政策支持率的區(qū)間估計(jì)為42%3%,即(39%,45%)。,,,,概率為95%,置信水平與置信區(qū)間,克林頓政府外交政策支持率的(點(diǎn))估計(jì)為39%,置信水平為95%的區(qū)間估計(jì)為39%3%,也就是(36%,42%);克林頓政府經(jīng)濟(jì)政策支持率的(點(diǎn))估計(jì)為42%,置信水平為95%的區(qū)間估計(jì)為42%3%,也就是(39%,45%)。,,,,關(guān)于比例的估計(jì),關(guān)于比例的估計(jì),估計(jì)與結(jié)果一致么?,關(guān)于比例的估計(jì),拋擲均勻硬幣驗(yàn)證:均勻硬幣正面和反面出現(xiàn)的可能性是否一樣大,都等于0.5。,總體拋擲硬幣,樣本,,,拋擲硬幣2048次,推斷總體,隨機(jī)試驗(yàn),均勻硬幣正面和反面出現(xiàn)的可能性是否一樣大,都等于0.5?,在2048次拋擲中正面出現(xiàn)了1061次。經(jīng)計(jì)算:正面出現(xiàn)概率的置信水平為95%的區(qū)間估計(jì)為0.51810.0216,驗(yàn)證:均勻硬幣正面和反面出現(xiàn)的可能性是否一樣大,都等于0.5。,兩點(diǎn)注意,關(guān)于均值的估計(jì),關(guān)于均值的估計(jì),平均食品消費(fèi)支出的估計(jì),關(guān)于均值的估計(jì),關(guān)于比例和均值的估計(jì),在樣本容量比較小的時(shí)候,樣本容量小,且總體為正態(tài)分布,圓鋼強(qiáng)度,圓鋼平均強(qiáng)度的置信區(qū)間,圓鋼平均強(qiáng)度的近似置信區(qū)間,比較,謝謝!,