《生物統(tǒng)計學復習》課件

上傳人:文**** 文檔編號:240670015 上傳時間:2024-04-28 格式:PPT 頁數(shù):49 大?。?02.50KB
收藏 版權申訴 舉報 下載
《生物統(tǒng)計學復習》課件_第1頁
第1頁 / 共49頁
《生物統(tǒng)計學復習》課件_第2頁
第2頁 / 共49頁
《生物統(tǒng)計學復習》課件_第3頁
第3頁 / 共49頁

下載文檔到電腦,查找使用更方便

20 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《《生物統(tǒng)計學復習》課件》由會員分享,可在線閱讀,更多相關《《生物統(tǒng)計學復習》課件(49頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、生物統(tǒng)計學總復習2015-06-29一、什么是統(tǒng)計學Statistics?統(tǒng)計學是收集、分析、表述和解釋統(tǒng)計數(shù)據(jù)統(tǒng)計學是收集、分析、表述和解釋統(tǒng)計數(shù)據(jù)的科學。統(tǒng)計學是關于數(shù)據(jù)的科學。的科學。統(tǒng)計學是關于數(shù)據(jù)的科學。資料的收集收集就是取得統(tǒng)計數(shù)據(jù)。數(shù)據(jù)整理數(shù)據(jù)整理是將數(shù)據(jù)分組、歸納和匯總并將其用圖表的形式表達出來。數(shù)據(jù)分析數(shù)據(jù)分析是通過統(tǒng)計方法研究數(shù)據(jù),并結合實際背景闡述實際問題的特征的過程。數(shù)據(jù)解釋數(shù)據(jù)解釋是對分析結果進行說明。統(tǒng)計學分為描述統(tǒng)計學描述統(tǒng)計學和推斷統(tǒng)計學推斷統(tǒng)計學。反映客反映客觀現(xiàn)象的數(shù)象的數(shù)據(jù)據(jù) 總體內(nèi)在的體內(nèi)在的數(shù)量數(shù)量規(guī)律性律性推斷推斷統(tǒng)計(利用(利用樣本信息和概率本信息

2、和概率論對總體的數(shù)量特征體的數(shù)量特征進行估行估計和和檢驗等)等)概率概率論(包括分布理(包括分布理論、大數(shù)定律、大數(shù)定律和中心極限定理等)和中心極限定理等)描述描述統(tǒng)計(統(tǒng)計數(shù)據(jù)的搜集、整數(shù)據(jù)的搜集、整理、理、顯示和分析等)示和分析等)總體數(shù)據(jù) 樣本數(shù)據(jù) 描述統(tǒng)計與推斷統(tǒng)計的關系描述統(tǒng)計與推斷統(tǒng)計的關系 幾個基本概念總體總體(population)(population)、個體(、個體(individualindividual)與樣本)與樣本(sample)(sample)總體(N):一個統(tǒng)計問題所研究對象的全體有限總體有限總體:一個班級學生的身高無限總體無限總體:臨床試驗中來推斷某一藥品療效

3、高、某一棉田棉鈴蟲的頭數(shù)個體:組成總體的每一基本單元樣本(n):從總體中抽取的部分個體,用于對總體進行推斷(n30,小樣本;n30,大樣本)通過某事物的一部分(樣本),來估計事物的全部(總體)特征JJJJJJJJJJJJJJ幾個基本概念(續(xù))幾個基本概念(續(xù))變量變量(variable)(variable)與觀測值與觀測值(observation)(observation)變量(變數(shù)):相同性質的事物表現(xiàn)差異性的某種特征某種特征,其表現(xiàn)隨個體而異身高、體重、葉綠素含量、葉片形狀隨機變量:變量取值的變化是不可預測的變量通常記為:x,y,z,觀測值:對變量進行測量或觀察所獲得的數(shù)值觀測值也稱為:變

4、量值(value of variables)、資料/數(shù)據(jù)(data)二、均值和方差二、均值和方差 :第:第i個觀察值或變數(shù)個觀察值或變數(shù) n:觀察值或變數(shù)的個數(shù):觀察值或變數(shù)的個數(shù):求和符號(:求和符號(sigma)計算公式:計算公式:標準差和方差標準差和方差總體方差和總體標準差總體方差和總體標準差樣本方差和樣本標準差樣本方差和樣本標準差三、概率與概率分布三、概率與概率分布概率分布-幾個概念概率函數(shù)概率函數(shù)(probability function)隨機變量取某一特定值的概率函數(shù)(離散型隨機變量)二項分布(對立事件)和泊松分布(出現(xiàn)概率較小,樣本容量大)概率密度函數(shù)概率密度函數(shù)(probabi

5、lity density function)隨機變量取某一特定值的密度函數(shù)(連續(xù)型隨機變量)概率分布函數(shù)概率分布函數(shù)(probability distribution function)隨機變量取值小于或等于某特定值的概率離散型隨機變量的概率分布概率分布圖概率分布圖概率分布函數(shù)累積函數(shù)密度函數(shù)連續(xù)型隨機變量的密度函數(shù)及概率分布函數(shù)x=某一特定值時,P=0若若n n,二項分布連接線表現(xiàn)為一個光滑的曲線。這一曲線稱之為正態(tài)分布曲線正態(tài)分布曲線或正態(tài)概率曲線正態(tài)概率曲線。其概率密度函數(shù)為:記做:N(,2)13由于正態(tài)曲線受和的制約,曲線隨這兩個參數(shù)的變化而改變。構造一個新變數(shù),這個變數(shù)要消去和的影響

6、。假定新變數(shù)用u來表示,則:標準正態(tài)分布的概率密度函數(shù)u變換變換標準正態(tài)標準正態(tài)分布分布u u服從均數(shù)為服從均數(shù)為0 0、標準差為、標準差為1 1的正態(tài)分布的正態(tài)分布14原總體原總體樣本樣本1樣本樣本2樣本樣本n新總體新總體n 統(tǒng)計量統(tǒng)計量如果從容量為N的總體抽樣(放回),若每次抽取容量為n的樣本,那么一共可以得到Nn個樣本。每個樣本可以計算一個平均數(shù),如果將這些平均數(shù)集合起來便構成一個新總體。由于每次隨機抽樣所得的平均數(shù)可能會存在差異,所以由平均數(shù)構成的新總體也應該有其分布,這種分布稱為平均數(shù)的平均數(shù)的抽樣分布抽樣分布。樣本均值的抽樣分布樣本均值的抽樣分布161、樣本平均數(shù)的期望值、樣本平均

7、數(shù)的期望值 由于不同的樣本可得到不同的樣本均值,因此,考察樣本均值的期望就顯得非常重要。用 表示樣本均值的期望值,表示總體均值,可證明在簡單隨機抽樣中。2.2.樣本平均數(shù)的標準差樣本平均數(shù)的標準差稱為標準誤標準誤。t分布分布 當總體標準差未知時,且樣本數(shù)小于30時,以樣本標準差S代替所得到的統(tǒng)計量 記為t。在計算時,由于采用S來代替,使得t 變量不再服從標準正態(tài)分布,而是服從t分布服從自由度為n-1的t分布2、t分布密度曲線以縱軸為對稱軸,左右對稱,且在t0時,分布密度函數(shù)取得最大值3、與標準正態(tài)分布曲線相比,t分布曲線頂部略低,兩尾部稍高而平.df越小這種趨勢越明顯.df越大,t分布越趨近于

8、標準正態(tài)分布.當n 30時,t分布與標準正態(tài)分布的區(qū)別很?。籲 100時,t分布基本與標準正態(tài)分布相同;n時,t分布與標準正態(tài)分布完全一致正態(tài)分布曲線與t分布曲線的比較t分布的特征分布的特征1、t分布受自由度df=n-1的制約,每一個自由度都有一條t分布密度曲線分布分布 設從一正態(tài)總體 中隨機抽取樣本容量為n,m的兩個獨立樣本,其樣本的方差為 ,則定義 兩者的比值為F:服從自由度為n-1,m-1的F分布 F分布特征分布特征1)F分布的平均數(shù)1,F(xiàn)的取值區(qū)間為0,+)2)F分布曲線的形狀僅決定于df1和df2.在df1l或2時,F分布曲線呈嚴重傾斜的反向J型,當df1=3時轉為左偏曲線(在平均值

9、的左邊)不同自由度下的F分布曲線四、統(tǒng)計推斷統(tǒng)計推斷由一個樣由一個樣本或一糸本或一糸列樣本所列樣本所得的結果得的結果來推斷總來推斷總體的特征體的特征假設檢驗假設檢驗參數(shù)估計參數(shù)估計原理:概率很小的事件在一次抽樣試驗中實際是幾乎不可能發(fā)生的。=0.05/0.01假設檢驗(Hypothesis)如何進行檢驗:如何進行檢驗:樣本樣本平均數(shù)平均數(shù)總體總體均數(shù)均數(shù)推斷推斷樣本樣本隨機抽樣隨機抽樣總體總體1 1 、提出假設、提出假設無效假設無效假設/零假設零假設/檢驗假設檢驗假設備擇假設備擇假設/對應假設對應假設 0 0 誤差效應處理效應H0HA2 2、確定顯著水平確定顯著水平0.05顯著水平*極顯著水平

10、*能否定能否定H0的的人為人為規(guī)定的規(guī)定的概率概率標準稱為顯著水平,記作標準稱為顯著水平,記作。統(tǒng)計學中,一般認為概率小于統(tǒng)計學中,一般認為概率小于0.05或或0.01的事件為的事件為小概率事件小概率事件,所以在小概率原理基礎上建立的假設檢驗也所以在小概率原理基礎上建立的假設檢驗也常取常取=0.05和和=0.01兩個顯著水平兩個顯著水平。P1.581)=20.0571=0.1142 根據(jù)研究設計的類型和統(tǒng)計推斷的目的選根據(jù)研究設計的類型和統(tǒng)計推斷的目的選擇使用不同的檢驗方法。擇使用不同的檢驗方法。本例:服從本例:服從N(x,x2)分布。分布。例:4、作出推斷結論:是否接受假設PP30時,可用樣

11、本方差s2來代替 總體方差2,仍用u檢驗法。3、總體方差2未知,且n30且n230時,用u u檢驗法。檢驗法。2、兩個總體方差12 和22未知,且兩個樣本都是小樣本,即n130且n230時,用t t檢驗法檢驗法。成組數(shù)據(jù)平均數(shù)的比較成組數(shù)據(jù)平均數(shù)的比較-應用情景應用情景成對數(shù)據(jù)平均數(shù)的比較成對數(shù)據(jù)平均數(shù)的比較略略所謂方差的同質性,就是指各個總體的所謂方差的同質性,就是指各個總體的方差是相同的。方差是相同的。方差的同質性檢驗就是要從各樣本的方方差的同質性檢驗就是要從各樣本的方差來推斷其總體方差是否相同差來推斷其總體方差是否相同方差的同質性檢驗五、方差分析t t 檢驗可以判斷兩組數(shù)據(jù)平均數(shù)間的差異

12、顯著性檢驗可以判斷兩組數(shù)據(jù)平均數(shù)間的差異顯著性對多個處理進行平均數(shù)差異顯著性檢驗時,采用對多個處理進行平均數(shù)差異顯著性檢驗時,采用t t檢驗檢驗法的缺點:法的缺點:方差:又叫均方,是標準差的平方,是表示變異的量。方差:又叫均方,是標準差的平方,是表示變異的量。確定各種原因在總變異中所占的重要程度。確定各種原因在總變異中所占的重要程度。處理效應處理效應試驗誤差試驗誤差相差不大,說明試驗處理對指標影響不大。相差不大,說明試驗處理對指標影響不大。相差較大,即處理效應比試驗誤差大得多,相差較大,即處理效應比試驗誤差大得多,說明試驗處理影響是很大的,不可忽視。說明試驗處理影響是很大的,不可忽視。xij=

13、+i+ij(i=1,2,3(i=1,2,3,k,k;j=1,2,3j=1,2,3,n),n)總體平均數(shù)總體平均數(shù)i 處理效應處理效應ij 試驗誤差試驗誤差xij 是在第是在第 i 次處理下的第次處理下的第 j 次觀測值次觀測值多重比較(多重比較(多重比較(多重比較(multiple comparisonsmultiple comparisons)要明確要明確不同處理平均數(shù)兩兩間差異的顯著性不同處理平均數(shù)兩兩間差異的顯著性,每個處理的平均數(shù)都要與其他的處理進行比較,每個處理的平均數(shù)都要與其他的處理進行比較,這種差異顯著性的檢驗就叫這種差異顯著性的檢驗就叫多重比較多重比較。即:統(tǒng)計上把多個平均數(shù)兩

14、兩間的相互比較稱為多即:統(tǒng)計上把多個平均數(shù)兩兩間的相互比較稱為多重比較。重比較。概念概念五、多重比較五、多重比較多重比較方法較多(多重比較方法較多(多重比較方法較多(多重比較方法較多(multiple comparisonsmultiple comparisons)不同離子不同離子對木聚糖對木聚糖酶活性酶活性的影響的影響(mg/ml)(mg/ml)0.000.250.500.751.001.250.000.060.120.180.240.300.000.400.800.801.201.602.000.000.400.600.801.001.20Na+K+Cu2+Mn2+水水平平實驗指標實驗指標

15、因素因素*對對多因素試驗多因素試驗而言,而言,處理就是指水平與水平的組合處理就是指水平與水平的組合定義定義:是指對:是指對試驗指標試驗指標同時受到兩個試驗同時受到兩個試驗因素因素作用的試驗資料的方差分析。作用的試驗資料的方差分析。二因素都是固定因素二因素都是固定因素二因素均為隨機因素二因素均為隨機因素固定模型固定模型隨機模型隨機模型混合模型混合模型一個因素是固定因素,一個因素是固定因素,一個因素是隨機因素一個因素是隨機因素二因素方差分析二因素方差分析三種模型在計算上類似,但在對待檢驗及結果解釋時有三種模型在計算上類似,但在對待檢驗及結果解釋時有所不同所不同。主效應和互作主效應和互作主效應主效應

16、(main effectmain effect):各試驗因素的相對獨立作用(不同飼料的各試驗因素的相對獨立作用(不同飼料的增重差異,不同品種玉米產(chǎn)量不同)增重差異,不同品種玉米產(chǎn)量不同)互作、交互互作、交互(interactioninteraction):某一因素在另一因素的不同水平上所產(chǎn)生某一因素在另一因素的不同水平上所產(chǎn)生的效應不同。的效應不同。方差分析的基本假定正態(tài)性正態(tài)性可加性可加性方差同質性方差同質性二因素方差分析二因素方差分析六、回歸與相關的概念相相關關變變量量因果關系因果關系平行關系平行關系回歸分析回歸分析(regression analysis)(regression anal

17、ysis)相關分析相關分析(correlation analysis)(correlation analysis)一個變量的變化一個變量的變化受到受到另一另一個變量或幾個變量的個變量或幾個變量的制約制約兩個以上變量之間兩個以上變量之間共同受共同受到到另外因素的另外因素的影響影響(一)、直線回歸的變異來源(x,y)實際值與估計值之差,剩余或殘差。估計值與均值之差,它與回歸系數(shù)的大小有關。因變量因變量 y y的平方和,總平方和,的平方和,總平方和,SSSST T或或SSSS總總回歸平方和回歸平方和 U/SSU/SSR R離回歸平方和離回歸平方和 Q/SSQ/SSE E變異分解兩個變量是否存在線性關

18、系,采用兩個變量是否存在線性關系,采用F F檢驗法進行。檢驗法進行。也以采用也以采用t t檢驗法進行(需分別檢驗檢驗法進行(需分別檢驗a a、b b值)。值)。若若x x與與y y間間不存在直線關系不存在直線關系,則總體回歸系數(shù),則總體回歸系數(shù)=0;=0;若若x x與與y y間間存在直線關系存在直線關系,則總體回歸系數(shù),則總體回歸系數(shù)00.F F值較大時,說明方程的變值較大時,說明方程的變異主要有回歸平方和(異主要有回歸平方和(U U)造成,方程成立。造成,方程成立。t t檢驗法檢驗法F F檢驗法檢驗法回歸方差回歸方差離回歸方差離回歸方差=F=F直線回歸的直線回歸的適應范圍適應范圍一般以自變量的一般以自變量的取值為限取值為限。直線回歸注意問題在自變量范圍內(nèi)求出的估計值,一般稱為內(nèi)插在自變量范圍內(nèi)求出的估計值,一般稱為內(nèi)插(interpolation);超過自變量取值范圍所計算出超過自變量取值范圍所計算出的估計值,稱為外延的估計值,稱為外延(extrapolation)。若無充分理由證明超過自變量取值范圍還是直若無充分理由證明超過自變量取值范圍還是直線,應該避免外延。線,應該避免外延。決定系數(shù)coefficient of determination變量變量x x引起引起y y變異的回歸平方和占變異的回歸平方和占y y總變異平方和總變異平方和的比率的比率

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關資源

更多
正為您匹配相似的精品文檔
關于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!