《《線性回歸方程》1PPT優(yōu)秀課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《《線性回歸方程》1PPT優(yōu)秀課件(30頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、線性回歸方程線性回歸方程 有些教師常說(shuō):有些教師常說(shuō):“如果你的數(shù)學(xué)成績(jī)好,那如果你的數(shù)學(xué)成績(jī)好,那么你的物理學(xué)習(xí)就不會(huì)有什么大問(wèn)題么你的物理學(xué)習(xí)就不會(huì)有什么大問(wèn)題” 按照這種按照這種說(shuō)法,似乎學(xué)生的物理成績(jī)與數(shù)學(xué)成績(jī)之間也存說(shuō)法,似乎學(xué)生的物理成績(jī)與數(shù)學(xué)成績(jī)之間也存在著某種關(guān)系。你如何認(rèn)識(shí)它們之間存在的關(guān)系?在著某種關(guān)系。你如何認(rèn)識(shí)它們之間存在的關(guān)系?物理成績(jī)物理成績(jī) 數(shù)學(xué)成績(jī)數(shù)學(xué)成績(jī) 學(xué)習(xí)興趣學(xué)習(xí)興趣 學(xué)習(xí)時(shí)間學(xué)習(xí)時(shí)間 其他因素其他因素結(jié)論:變量之間除了函數(shù)關(guān)系外,還有結(jié)論:變量之間除了函數(shù)關(guān)系外,還有 。問(wèn)題引入:?jiǎn)栴}引入: 函數(shù)關(guān)系函數(shù)關(guān)系-變量之間是一種確定變量之間是一種確定性的關(guān)系
2、性的關(guān)系.如如:圓的面積圓的面積S和半徑和半徑r之間之間的關(guān)系的關(guān)系. 相關(guān)關(guān)系相關(guān)關(guān)系變量之間有一定的聯(lián)變量之間有一定的聯(lián)系系,但不能完全的用函數(shù)來(lái)表達(dá)但不能完全的用函數(shù)來(lái)表達(dá). 一般一般來(lái)說(shuō)來(lái)說(shuō),身高越高身高越高,體重越重體重越重,但不能用一但不能用一個(gè)函數(shù)來(lái)嚴(yán)格地表示身高與體重之間個(gè)函數(shù)來(lái)嚴(yán)格地表示身高與體重之間的關(guān)系的關(guān)系.(非確定性關(guān)系非確定性關(guān)系)變量之間的關(guān)系變量之間的關(guān)系函數(shù)關(guān)系是一種確定的關(guān)系;函數(shù)關(guān)系是一種確定的關(guān)系;相關(guān)關(guān)系與函數(shù)關(guān)系的異同點(diǎn):相關(guān)關(guān)系與函數(shù)關(guān)系的異同點(diǎn):均是指兩個(gè)變量的關(guān)系均是指兩個(gè)變量的關(guān)系問(wèn)題:?jiǎn)栴}:舉一兩個(gè)現(xiàn)實(shí)生活中的問(wèn)題,問(wèn)題所涉及的舉一兩個(gè)現(xiàn)實(shí)
3、生活中的問(wèn)題,問(wèn)題所涉及的變量之間存在一定的相關(guān)關(guān)系。變量之間存在一定的相關(guān)關(guān)系。(1 1)父母的身高與子女身高之間的關(guān)系)父母的身高與子女身高之間的關(guān)系(2 2)商品銷售收入與廣告支出經(jīng)費(fèi)之間的關(guān)系)商品銷售收入與廣告支出經(jīng)費(fèi)之間的關(guān)系(3 3)糧食產(chǎn)量與施肥量之間的關(guān)系)糧食產(chǎn)量與施肥量之間的關(guān)系 例例:相關(guān)關(guān)系是一種非確定關(guān)系相關(guān)關(guān)系是一種非確定關(guān)系. .相同點(diǎn):相同點(diǎn):不同點(diǎn):不同點(diǎn):?jiǎn)栴}:?jiǎn)栴}: 某小賣部為了了解熱茶銷售量與氣溫某小賣部為了了解熱茶銷售量與氣溫之間的關(guān)系,隨機(jī)統(tǒng)計(jì)并制作了某之間的關(guān)系,隨機(jī)統(tǒng)計(jì)并制作了某6天天賣出熱茶的杯數(shù)與當(dāng)天氣溫的對(duì)照表:賣出熱茶的杯數(shù)與當(dāng)天氣溫的
4、對(duì)照表:氣溫氣溫/0C261813104 -1杯數(shù)杯數(shù)202434385064如果某天的氣溫是如果某天的氣溫是-50C,你能根據(jù)這些,你能根據(jù)這些數(shù)據(jù)預(yù)測(cè)這天小賣部賣出熱茶的杯數(shù)嗎數(shù)據(jù)預(yù)測(cè)這天小賣部賣出熱茶的杯數(shù)嗎? 為了了解熱茶銷量與為了了解熱茶銷量與氣溫的大致關(guān)系氣溫的大致關(guān)系, ,我們我們以橫坐標(biāo)以橫坐標(biāo)x x表示氣溫,表示氣溫,縱坐標(biāo)縱坐標(biāo)y y表示熱茶銷量,表示熱茶銷量,建立直角坐標(biāo)系建立直角坐標(biāo)系. .將表將表中數(shù)據(jù)構(gòu)成的中數(shù)據(jù)構(gòu)成的6 6個(gè)數(shù)對(duì)個(gè)數(shù)對(duì)表示的點(diǎn)在坐標(biāo)系內(nèi)表示的點(diǎn)在坐標(biāo)系內(nèi)標(biāo)出,得到下圖。今標(biāo)出,得到下圖。今后我們稱這樣的圖為后我們稱這樣的圖為散點(diǎn)圖散點(diǎn)圖(scatt
5、erplot).(scatterplot). 選擇怎樣的直線近似地表示熱茶銷量與氣選擇怎樣的直線近似地表示熱茶銷量與氣溫之間的關(guān)系溫之間的關(guān)系? ? 我們有多種思考方案我們有多種思考方案: :( (1) )選擇能反映直線變化的兩個(gè)點(diǎn)選擇能反映直線變化的兩個(gè)點(diǎn), ,例如取例如取(4,50),(18,24)(2)取一條直線)取一條直線,使得位于該直線一側(cè)和使得位于該直線一側(cè)和另一側(cè)的點(diǎn)的個(gè)數(shù)基本相同;另一側(cè)的點(diǎn)的個(gè)數(shù)基本相同;(3)多取幾組點(diǎn))多取幾組點(diǎn),確定幾條直線方程確定幾條直線方程,再分再分別算出各條直線斜率、截距的平均值別算出各條直線斜率、截距的平均值,作為作為所求直線的斜率、截距;所求直
6、線的斜率、截距; 怎樣的直線最好呢怎樣的直線最好呢?這兩點(diǎn)的直線;這兩點(diǎn)的直線;建構(gòu)數(shù)學(xué)建構(gòu)數(shù)學(xué) ybxa ybxa1.最小二乘法:最小二乘法: 用方程為用方程為的點(diǎn),應(yīng)使得該直線與散點(diǎn)圖中的點(diǎn)最接近的點(diǎn),應(yīng)使得該直線與散點(diǎn)圖中的點(diǎn)最接近那么,怎樣衡量直線那么,怎樣衡量直線 與圖中六與圖中六個(gè)點(diǎn)的接近程度呢?個(gè)點(diǎn)的接近程度呢? 的直線擬合散點(diǎn)圖中的直線擬合散點(diǎn)圖中 yx26,18,13,10,4,babababababa 我們將表中給出的自變量我們將表中給出的自變量代入直線方程代入直線方程, ,得到相應(yīng)的六個(gè)值:得到相應(yīng)的六個(gè)值:的的六個(gè)六個(gè)值值 它們與表中相應(yīng)的實(shí)際值應(yīng)該越接近越好它們與表中
7、相應(yīng)的實(shí)際值應(yīng)該越接近越好. 22222222( , )(2620)(1824)(1334)(1038)(450)(64)12866140382046010172Q a bb ab ab ab ab ab abaabba 所以所以, ,我們用類似于估計(jì)平均數(shù)時(shí)的我們用類似于估計(jì)平均數(shù)時(shí)的思想思想, ,考慮離差的平方和考慮離差的平方和 ybxa, a b( , )Q a b與圖中六個(gè)點(diǎn)的接近與圖中六個(gè)點(diǎn)的接近程度程度,所以所以,設(shè)法設(shè)法取取 達(dá)到最小值達(dá)到最小值.的值的值,使使這種方法叫做這種方法叫做最小平方法最小平方法(又稱又稱最小最小二乘法二乘法) . ( , )Q a b ybxa是直線是
8、直線在垂直方向在垂直方向(縱軸方向縱軸方向)上的距離的平上的距離的平方和方和,可以用來(lái)衡量可以用來(lái)衡量直線直線與各散點(diǎn)與各散點(diǎn)222222( , )128661403820460101721286(1403820)64601017214038201286(.)12867019101286().1286701910( )1286Q a bbaabbababaaabbababf b把a(bǔ)看作常數(shù),那么Q是關(guān)于b的二次函數(shù)記為f(b)f(b)當(dāng)時(shí),取最小值2222( ) 6(140460)12863820101721404606(.)6702306().670230( )6f aababbbaabab
9、af a把b看作常數(shù),那么Q是關(guān)于a的二次函數(shù)記為f(a)當(dāng)時(shí),取最小值070191012867023061.6477,57.55681.647757.5568566566abQbabayxxyC 當(dāng)時(shí),(a,b)取最小值解得所求直線方程為當(dāng)時(shí),故當(dāng)氣溫為時(shí),熱茶銷量約為杯。線性相關(guān)關(guān)系線性相關(guān)關(guān)系: 像這樣能用直線方程像這樣能用直線方程 ybxa近似表示的相關(guān)關(guān)系叫做近似表示的相關(guān)關(guān)系叫做線性相關(guān)關(guān)系線性相關(guān)關(guān)系. 如果散點(diǎn)圖中的點(diǎn)分布從整體如果散點(diǎn)圖中的點(diǎn)分布從整體上看大致在一條直線附近我們就稱上看大致在一條直線附近我們就稱這兩個(gè)變量之間具有這兩個(gè)變量之間具有線性相關(guān)線性相關(guān)關(guān)系關(guān)系 x1
10、x2x3xnxy1y2y3yny線性回歸方程:線性回歸方程:一般地一般地,設(shè)有設(shè)有n個(gè)觀察數(shù)據(jù)如下:個(gè)觀察數(shù)據(jù)如下:2221122()().()nnQybxaybxaybxa ybxa當(dāng)當(dāng)a,b使使取得最小值時(shí)取得最小值時(shí),就稱就稱這這n對(duì)數(shù)據(jù)的對(duì)數(shù)據(jù)的線性回歸方程線性回歸方程,該方程所表該方程所表示的直線稱為示的直線稱為回歸直線回歸直線.為擬合為擬合2221122222211111()().()222nnnnnnniiiiiiiiiiiQybxaybxaybxaybx yaybxabxna 類似地,我們可以推得,求回歸類似地,我們可以推得,求回歸方程方程 中系數(shù)中系數(shù)a,b的一般公式的一般公
11、式: ybxa1122211()(),()nni iiiiinniiiixynxyxx yybxnxxxa y bx 以上公式的推導(dǎo)較復(fù)雜,故不作推導(dǎo),但它以上公式的推導(dǎo)較復(fù)雜,故不作推導(dǎo),但它的原理較為簡(jiǎn)單:即各點(diǎn)到該直線的距離的平的原理較為簡(jiǎn)單:即各點(diǎn)到該直線的距離的平方和最小,這一方法叫方和最小,這一方法叫最小二乘法最小二乘法。求解線性回歸問(wèn)題的步驟求解線性回歸問(wèn)題的步驟:1.列表列表( ),畫(huà)散點(diǎn)圖,畫(huà)散點(diǎn)圖.2.計(jì)算計(jì)算:3.代入公式求代入公式求a,b4.列出直線方程列出直線方程iiiiyxyx,211, ,nniiiiix yxx y例題例題1:下表為某地近幾年機(jī)動(dòng)車輛數(shù)與交通:下
12、表為某地近幾年機(jī)動(dòng)車輛數(shù)與交通事故數(shù)的統(tǒng)計(jì)資料,請(qǐng)判斷機(jī)動(dòng)車輛數(shù)與交事故數(shù)的統(tǒng)計(jì)資料,請(qǐng)判斷機(jī)動(dòng)車輛數(shù)與交通事故數(shù)之間是否具有線性相關(guān)關(guān)系,求出通事故數(shù)之間是否具有線性相關(guān)關(guān)系,求出線性回歸方程線性回歸方程;如果不具有線性相關(guān)關(guān)系如果不具有線性相關(guān)關(guān)系,說(shuō)明說(shuō)明理由理由解:在直角坐標(biāo)系中畫(huà)出數(shù)據(jù)的散點(diǎn)圖,解:在直角坐標(biāo)系中畫(huà)出數(shù)據(jù)的散點(diǎn)圖,直觀判斷散點(diǎn)在一條直線附近,故具有直觀判斷散點(diǎn)在一條直線附近,故具有線性相關(guān)關(guān)系線性相關(guān)關(guān)系88118821181822211031,128.875,71.6,8.95,137835,9611.79611.78 128.875 8.951378358 128
13、.8758.95128.875iiiiiiiiiiiiiixxyyxx yx ynxybxnxaybx 將它們代入*式:0.07740.0774-1.0241所以,所求線性回歸方程為 y0.0774x-1.0241回歸分析的基本步驟回歸分析的基本步驟:畫(huà)散點(diǎn)圖畫(huà)散點(diǎn)圖求回歸方程求回歸方程預(yù)報(bào)、決策預(yù)報(bào)、決策問(wèn)題:有時(shí)散點(diǎn)圖的各點(diǎn)并不集中在一條直線的附近,仍然可以按照求回歸直線方程的步驟求回歸直線,顯然這樣的回歸直線沒(méi)有實(shí)際意義。在怎樣的情況下求得的回歸直線方程才有實(shí)際意義?即建立的線性回歸模型是否合理?如何對(duì)一組數(shù)據(jù)之間的線性相關(guān)程度作出定量分析?相關(guān)系數(shù)相關(guān)系數(shù) 1.1.計(jì)算公式計(jì)算公式 2
14、 2相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)的性質(zhì) (1)|r|1(1)|r|1 (2)|r|(2)|r|越接近于越接近于1 1,相關(guān)程度越強(qiáng);,相關(guān)程度越強(qiáng);|r|r|越接越接近于近于0 0,相關(guān)程度越弱,相關(guān)程度越弱n niiiii=1i=1nnnn2222iiiii=1i=1i=1i=1(x - x)(y - y)(x - x)(y - y)r =r =(x - x)(y - y)(x - x)(y - y)2 2_ _n n1 1i i2 2i i2 2_ _n n1 1i i2 2i in n1 1i i_ _ _i ii iy yn ny yx xn nx xy yx xn ny yx x超級(jí)鏈接超
15、級(jí)鏈接散點(diǎn)圖只是形象地描述點(diǎn)的分布情況,要想把握其特征,散點(diǎn)圖只是形象地描述點(diǎn)的分布情況,要想把握其特征,必須進(jìn)行定量的研究必須進(jìn)行定量的研究相關(guān)關(guān)系與函數(shù)關(guān)系有怎樣的不同?函數(shù)關(guān)系中的兩個(gè)變量間是一種確定性關(guān)系相關(guān)關(guān)系是一種非確定性關(guān)系 函數(shù)關(guān)系是一種理想的關(guān)系模型 相關(guān)關(guān)系在現(xiàn)實(shí)生活中大量存在,是更一般的情況小結(jié):小結(jié):1.1.變量之間的兩種關(guān)系:變量之間的兩種關(guān)系:確定性關(guān)系與確定性關(guān)系與相關(guān)關(guān)系相關(guān)關(guān)系2。對(duì)于線性相關(guān)的兩個(gè)變量用什么方法來(lái)刻。對(duì)于線性相關(guān)的兩個(gè)變量用什么方法來(lái)刻畫(huà)之間的關(guān)系呢?畫(huà)之間的關(guān)系呢?最小二乘法最小二乘法最小二乘法估計(jì)線性回歸方程:最小二乘法估計(jì)線性回歸方程: ybxa1122211()(),()nniiiiiinniiiix ynxyxxyybxnxxxaybx數(shù)學(xué)統(tǒng)計(jì) 畫(huà)散點(diǎn)圖畫(huà)散點(diǎn)圖 了解最小二乘法的思想了解最小二乘法的思想 求回歸直線方程求回歸直線方程1. 用回歸直線方程解決應(yīng)用問(wèn)題用回歸直線方程解決應(yīng)用問(wèn)題個(gè)人觀點(diǎn)供參考,歡迎討論