線性回歸方程
《線性回歸方程》由會(huì)員分享,可在線閱讀,更多相關(guān)《線性回歸方程(12頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、環(huán)球雅思學(xué)科教師輔導(dǎo)講義 講義編號(hào): 組長簽字: 簽字日期: 學(xué)員編號(hào): 年 級(jí): 高二 課時(shí)數(shù):3 學(xué)員姓名: 輔導(dǎo)科目: 數(shù)學(xué) 學(xué)科教師:閆建斌 課 題 線性回歸方程 授課日期及時(shí)段 2014-2-11 18:00-20:00精品文檔,你值得期待 教學(xué)目標(biāo) 線性回歸方程基礎(chǔ) 重點(diǎn)、難點(diǎn) 教 學(xué) 內(nèi) 容
2、 1、本周錯(cuò)題講解 2、知識(shí)點(diǎn)梳理 1.線性回歸方程 ①變量之間的兩類關(guān)系:函數(shù)關(guān)系與相關(guān)關(guān)系 ②制作散點(diǎn)圖,判斷線性相關(guān)關(guān)系 ③線性回歸方程:(最小二乘法) 最小二乘法:求回歸直線,使得樣本數(shù)據(jù)的點(diǎn)到它的距離的平方最小的方法 注意:線性回歸直線經(jīng)過定點(diǎn) 2.相關(guān)系數(shù)(判定兩個(gè)變量線性相關(guān)性): 注:⑴>0時(shí),變量正相關(guān); <0時(shí),變量負(fù)相關(guān); ⑵① 越接近于1,兩個(gè)變量的線性相關(guān)性越強(qiáng); ② 接近于0時(shí),兩個(gè)變量之間幾乎不存在線性相關(guān)關(guān)系。 3.線形回歸模型: ⑴隨機(jī)誤差:我們把線性回歸模型,其中為模型的未知參數(shù),稱為隨
3、機(jī)誤差。 隨機(jī)誤差 ⑵殘差:我們用回歸方程中的估計(jì),隨機(jī)誤差,所以是的估計(jì)量,故,稱為相應(yīng)于點(diǎn)的殘差。 ⑶回歸效果判定-----相關(guān)指數(shù)(解釋變量對(duì)于預(yù)報(bào)變量的貢獻(xiàn)率) (的表達(dá)式中確定) 注:①得知越大,說明殘差平方和越小,則模型擬合效果越好; ②越接近于1,,則回歸效果越好。 4.獨(dú)立性檢驗(yàn)(分類變量關(guān)系): (1)分類變量:這種變量的不同“值”表示個(gè)體所屬的不同類別的變量。 (2)列聯(lián)表:列出兩個(gè)分類變量的頻數(shù)表,稱為列聯(lián)表。 (3)對(duì)于列聯(lián)表:的觀測值。 (4)臨界值表: 0.50 0.40 0.25 0.15 0.10 0.05 0.0
4、25 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 如果,就推斷“有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過;否則,在樣本數(shù)據(jù)中沒有發(fā)現(xiàn)足夠證據(jù)支持結(jié)論“有關(guān)系”。 (5)反證法與獨(dú)立性檢驗(yàn)原理的比較: 反證法原理 在假設(shè)下,如果推出矛盾,就證明了不成立。 獨(dú)立性檢 驗(yàn)原理 在假設(shè)下,如果出現(xiàn)一個(gè)與相矛盾的小概率事件,就推斷不成立,且該推斷犯錯(cuò)誤的概率不超過這個(gè)小概率。 典型例題 1.(2011山東)某產(chǎn)品的廣告費(fèi)用x與銷售額y的統(tǒng)計(jì)數(shù)據(jù)
5、如下表: 廣告費(fèi)用x/萬元 4 2 3 5 銷售額y/萬元 49 26 39 54 根據(jù)上表可得回歸方程=x+中的為9.4,據(jù)此模型預(yù)報(bào)廣告費(fèi)用為6萬元時(shí)銷售額為 ( ). A.63.6萬元 B.65.5萬元 C.67.7萬元 D.72.0萬元 解析 ∵==,==42, 又=x+必過(,),∴42=9.4+,∴=9.1. ∴線性回歸方程為=9.4x+9.1. ∴當(dāng)x=6時(shí),=9.46+9.1=
6、65.5(萬元). 答案 B 2.(2011江西)為了解兒子身高與其父親身高的關(guān)系,隨機(jī)抽取5對(duì)父子的身高數(shù)據(jù)如下: 父親身高x/cm 174 176 176 176 178 兒子身高y/cm 175 175 176 177 177 則y對(duì)x的線性回歸方程為 ( ). A.=x-1 B.=x+1 C.=88+x D.=176 解析 因?yàn)椋剑?76, ==176, 又y對(duì)x的線性回歸方程表示的直線恒過點(diǎn)(,),
7、 所以將(176,176)代入A、B、C、D中檢驗(yàn)知選C. 答案 C 3.(2011陜西)設(shè)(x1,y1),(x2,y2),…,(xn,yn)是變量x和y的n個(gè)樣本點(diǎn),直線l是由這些樣本點(diǎn)通過最小二乘法得到的線性回歸直線(如圖),以下結(jié)論中正確的是( ). A.x和y的相關(guān)系數(shù)為直線l的斜率 B.x和y的相關(guān)系數(shù)在0到1之間 C.當(dāng)n為偶數(shù)時(shí),分布在l兩側(cè)的樣本點(diǎn)的個(gè)數(shù)一定相同 D.直線l過點(diǎn)(,) 解析 因?yàn)橄嚓P(guān)系數(shù)是表示兩個(gè)變量是否具有線性相關(guān)關(guān)系的一個(gè)值,它的 絕對(duì)值越接近1,兩個(gè)變量的線性相關(guān)程度越強(qiáng),所以A、B錯(cuò)誤.C中n 為偶數(shù)時(shí),分布在l兩側(cè)的樣本點(diǎn)的個(gè)數(shù)可以
8、不相同,所以C錯(cuò)誤.根據(jù)回 歸直線方程一定經(jīng)過樣本中心點(diǎn)可知D正確,所以選D. 答案 D 4.(2011廣東)為了解籃球愛好者小李的投籃命中率與打籃球時(shí)間之間的關(guān)系,下表記錄了小李某月1號(hào)到5號(hào)每天打籃球時(shí)間x(單位:小時(shí))與當(dāng)天投籃命中率y之間的關(guān)系: 時(shí)間x 1 2 3 4 5 命中率y 0.4 0.5 0.6 0.6 0.4 小李這5天的平均投籃命中率為________;用線性回歸分析的方法,預(yù)測小李該月6號(hào)打6小時(shí)籃球的投籃命中率為________. 解析 小李這5天的平均投籃命中率 ==0.5, 可求得小李這5天的平均打籃球時(shí)間=3.根據(jù)表中數(shù)據(jù)
9、可求得=0.01,= 0.47,故回歸直線方程為=0.47+0.01x,將x=6代入得6號(hào)打6小時(shí)籃球的 投籃命中率約為0.53. 答案 0.5 0.53 5.(2011遼寧)調(diào)查了某地若干戶家庭的年收入x(單位:萬元)和年飲食支出y(單位:萬元),調(diào)查顯示年收入x與年飲食支出y具有線性相關(guān)關(guān)系,并由調(diào)查數(shù)據(jù)得到y(tǒng)對(duì)x的回歸直線方程:=0.254x+0.321.由回歸直線方程可知,家庭年收入每增加1萬元,年飲食支出平均增加________萬元. 解析 由題意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254. 答案 0.254 6.(2011安徽)某
10、地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計(jì)數(shù)據(jù): 年份 2002 2004 2006 2008 2010 需求量(萬噸) 236 246 257 276 286 (1)利用所給數(shù)據(jù)求年需求量與年份之間的回歸直線方程=x+; (2)利用(1)中所求出的直線方程預(yù)測該地2012年的糧食需求量. 解 (1)由所給數(shù)據(jù)看出,年需求量與年份之間是近似直線上升的,下面求回歸直線方程.為此對(duì)數(shù)據(jù)預(yù)處理如下: 年份-2006 -4 -2 0 2 4 需求量-257 -21 -11 0 19 29 對(duì)預(yù)處理后的數(shù)據(jù),容易算得=0,=3.2. = ==
11、6.5,=-b=3. 由上述計(jì)算結(jié)果,知所求回歸直線方程為 -257=(x-2 006)+=6.5(x-2 006)+3.2, 即=6.5(x-2 006)+260.2. ① (2)利用直線方程①,可預(yù)測2012年的糧食需求量為 6.5(2012-2006)+260.2=6.56+260.2=299.2(萬噸). 課堂練習(xí) 1.實(shí)驗(yàn)測得四組(x,y)的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的回歸直線方程為( ) A.=x+1 B.=x+2 C.=2x+1 D.=x-1 2.在比較兩個(gè)模型的擬合效果時(shí),甲、
12、乙兩個(gè)模型的相關(guān)指數(shù)R2的值分別約為0.96和0.85,則擬合效果好的模型是( ) A.甲 B.乙 C.甲、乙相同 D.不確定 3.某化工廠為預(yù)測產(chǎn)品的回收率y,需要研究它和原料有效成分含量x之間的相關(guān)關(guān)系,現(xiàn)取8對(duì)觀測值,計(jì)算,得xi=52,yi=228,x=478,xiyi=1849,則其線性回歸方程為( ) A.=11.47+2.62x B.=-11.47+2.62x C.=2.62+11.47x D.=11.47-2.62x 4.下表是某廠1~4月份用水量(單位:百噸)的一組數(shù)據(jù): 月份x 1 2 3 4 用水量y
13、 4.5 4 3 2.5 由散點(diǎn)圖可知,用水量y與月份x之間有較好的線性相關(guān)關(guān)系,其線性回歸直線方程是=-0.7x+a,則a等于______. 5.某車間為了規(guī)定工時(shí)定額,需要確定加工零件所花費(fèi)的時(shí)間,為此作了四次試驗(yàn),得到的數(shù)據(jù)如下: 零件的個(gè)數(shù)x(個(gè)) 2 3 4 5 加工的時(shí)間y(小時(shí)) 2.5 3 4 4.5 (1)在給定的坐標(biāo)系中畫出表中數(shù)據(jù)的散點(diǎn)圖; (2)求出y關(guān)于x的線性回歸方程=bx+a,并在坐標(biāo)系中畫出回歸直線; (3)試預(yù)測加工10個(gè)零件需要多少小時(shí)? 課后練習(xí) 一、選擇題 1.實(shí)驗(yàn)測得四組(x,y)的值為
14、(1,2),(2,3),(3,4),(4,5),則y與x之間的回歸直線方程為( ) A.=x+1 B.=x+2 C.=2x+1 D.=x-1 答案 A 解析 畫出散點(diǎn)圖,四點(diǎn)都在直線=x+1. 2.下列有關(guān)樣本相關(guān)系數(shù)的說法不正確的是( ) A.相關(guān)系數(shù)用來衡量變量x與y之間的線性相關(guān)程度 B.|r|≤1,且|r|越接近于1,相關(guān)程度越大 C.|r|≤1,且|r|越接近0,相關(guān)程度越小 D.|r|≥1,且|r|越接近1,相關(guān)程度越小 答案 D 3.由一組樣本(x1,y1),(x2,y2),…,(xn,yn)得到的回歸直線方程=a+bx,下面有四種關(guān)于回
15、歸直線方程的論述: (1)直線=a+bx 至少經(jīng)過點(diǎn)(x1,y1),(x2,y2),…,(xn,yn)中的一個(gè)點(diǎn); (2)直線=a+bx的斜率是; (3)直線=a+bx必過(,)點(diǎn); (4)直線=a+bx和各點(diǎn)(x1,y1),(x2,y2),…,(xn,yn)的偏差 (yi-a-bxi)2是該坐標(biāo)平面上所有的直線與這些點(diǎn)的偏差中最小的直線. 其中正確的論述有( ) A.0個(gè) B.1個(gè) C.2個(gè) D.3個(gè) 答案 D 解析 線性回歸直線不一定過點(diǎn)(x1,y1),(x2,y2),…,(xn,yn)中的任何一點(diǎn);b=就是線性回歸直線的斜率,也就是回歸系數(shù);線性回歸直線過點(diǎn)(,)
16、;線性回歸直線是平面上所有直線中偏差 (yi-a-bxi)2取得最小的那一條.故有三種論述是正確的,選D. 4.設(shè)兩個(gè)變量x和y之間具有線性相關(guān)關(guān)系,它們的相關(guān)系數(shù)是r,y關(guān)于x的回歸直線的斜率是b,縱截距是a,那么必有( ) A.b與r的符號(hào)相同 B.a(chǎn)與r的符號(hào)相同 C.b與r的符號(hào)相反 D.a(chǎn)與r的符號(hào)相反 答案 A 5.在比較兩個(gè)模型的擬合效果時(shí),甲、乙兩個(gè)模型的相關(guān)指數(shù)R2的值分別約為0.96和0.85,則擬合效果好的模型是( ) A.甲 B.乙 C.甲、乙相同 D.不確定 答案 A 6.某化工廠為預(yù)測產(chǎn)品的回收率y,需要研究它和原料有效成分含量
17、x之間的相關(guān)關(guān)系,現(xiàn)取8對(duì)觀測值,計(jì)算,得xi=52,yi=228,x=478,xiyi=1849,則其線性回歸方程為( ) A.=11.47+2.62x B.=-11.47+2.62x C.=2.62+11.47x D.=11.47-2.62x 答案 A 解析 利用回歸系數(shù)公式計(jì)算可得a=11.47,b=2.62,故=11.47+2.62x. 二、填空題 7.下表是某廠1~4月份用水量(單位:百噸)的一組數(shù)據(jù): 月份x 1 2 3 4 用水量y 4.5 4 3 2.5 由散點(diǎn)圖可知,用水量y與月份x之間有較好的線性相關(guān)關(guān)系,其線性回歸直線方程是=-0.
18、7x+a,則a等于______. 解析?。?.5,=3.5,∵回歸直線方程過定點(diǎn)(,),∴3.5=-0.72.5+a. ∴a=5.25. 8.某服裝商場為了了解毛衣的月銷售量y(件)與月平均氣溫x(℃)之間的關(guān)系,隨機(jī)統(tǒng)計(jì)了某4個(gè)月的月銷售量與當(dāng)月平均氣溫,其數(shù)據(jù)如下表: 月平均氣溫x(℃) 17 13 8 2 月銷售量y(件) 24 33 40 55 由表中數(shù)據(jù)算出線性回歸方程=bx+a中的b≈-2,氣象部門預(yù)測下個(gè)月的平均氣溫約為6℃,據(jù)此估計(jì),該商場下個(gè)月毛衣的銷售量約為________件. (參考公式:b=,a=-b ) 答案 46 解析 由所提供
19、數(shù)據(jù)可計(jì)算得出=10,=38,又b≈-2代入公式a=-b 可得a=58,即線性回歸方程=-2x+58,將x=6代入可得. 9.對(duì)196個(gè)接受心臟搭橋手術(shù)的病人和196個(gè)接受血管清障手術(shù)的病人進(jìn)行了3年的跟蹤研究,調(diào)查他們是否又發(fā)作過心臟病,調(diào)查結(jié)果如下表所示: 又發(fā)作過 心臟病 未發(fā)作過 心臟病 合計(jì) 心臟搭橋手術(shù) 39 157 196 血管清障手術(shù) 29 167 196 合計(jì) 68 324 392 試根據(jù)上述數(shù)據(jù)計(jì)算K2=________. 比較這兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響有沒有差別.________. 答案 ≈1.78 不能作出這兩
20、種手術(shù)對(duì)病人又發(fā)作心臟病的影響有差別的結(jié)論 解析 提出假設(shè)H0:兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響沒有差別. 根據(jù)列聯(lián)表中的數(shù)據(jù),可以求得K2=≈1.78. 當(dāng)H0成立時(shí)K2≈1.78,而K2<2.072的概率為0.85.所以,不能否定假設(shè)H0.也就是不能作出這兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響有差別的結(jié)論. 三、解答題 10.某農(nóng)科所對(duì)冬季晝夜溫差大小與某反季大豆新品種發(fā)芽多少之間的關(guān)系進(jìn)行分析研究,他們分別記錄了2010年12月1日至12月5日的每天晝夜溫差與實(shí)驗(yàn)室每天每100顆種子中的發(fā)芽數(shù),得到如下表: 日期 12月1日 12月2日 12月3日 12月4日 12月5日
21、 溫差x(℃) 10 11 13 12 8 發(fā)芽數(shù)y(顆) 23 25 30 26 16 該農(nóng)科所確定的研究方案是:先從這五組數(shù)據(jù)中選取2組,用剩下的3組數(shù)據(jù)求線性回歸方程,再對(duì)被選取的2組數(shù)據(jù)進(jìn)行檢驗(yàn). (1)求選取的2組數(shù)據(jù)恰好是不相鄰的2天數(shù)據(jù)的概率; (2)若選取的是12月1日與12月5日的兩組數(shù)據(jù),請(qǐng)根據(jù)12月2日至12月4日的數(shù)據(jù),求出y關(guān)于x的線性回歸方程=bx+a; (3)若由線性回歸方程得到的估計(jì)數(shù)據(jù)與所選出的檢驗(yàn)數(shù)據(jù)的誤差均不超過2顆,則認(rèn)為得到的線性回歸方程是可靠的,試問(2)中所得到的線性回歸方程是否可靠? 解析 (1)設(shè)抽到不相鄰的兩
22、組數(shù)據(jù)為事件A,因?yàn)閺?組數(shù)據(jù)中選取2組數(shù)據(jù)共有10種情況:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)其中數(shù)據(jù)為12月份的日期數(shù). 每種情況都是可能出現(xiàn)的,事件A包括的基本事件有6種: 所以P(A)==.所以選取的2組數(shù)據(jù)恰好是不相鄰2天數(shù)據(jù)的概率是. (2)由數(shù)據(jù),求得=12,=27. 由公式,求得b=,a=-b =-3. 所以y關(guān)于x的線性回歸方程為=x-3. (3)當(dāng)x=10,=10-3=22,|22-23|<2; 同樣,當(dāng)x=8時(shí),=8-3=17,|17-16|<2; 所以,該研究所得到的回歸方
23、程是可靠的. 11.某車間為了規(guī)定工時(shí)定額,需要確定加工零件所花費(fèi)的時(shí)間,為此作了四次試驗(yàn),得到的數(shù)據(jù)如下: 零件的個(gè)數(shù)x(個(gè)) 2 3 4 5 加工的時(shí)間y(小時(shí)) 2.5 3 4 4.5 (1)在給定的坐標(biāo)系中畫出表中數(shù)據(jù)的散點(diǎn)圖; (2)求出y關(guān)于x的線性回歸方程=bx+a,并在坐標(biāo)系中畫出回歸直線; (3)試預(yù)測加工10個(gè)零件需要多少小時(shí)? (注:b=,a=-b ) 解析 (1)散點(diǎn)圖如圖. (2)由表中數(shù)據(jù)得:xiyi=52.5, =3.5,=3.5,x=54, ∴b=0.7, ∴a=1.05, ∴=0.7x+1.05. 回歸直線
24、如圖所示. (3)將x=10代入回歸直線方程,得=0.710+1.05=8.05(小時(shí) ). ∴預(yù)測加工10個(gè)零件需要8.05小時(shí). 12.(2010遼寧卷)為了比較注射A,B兩種藥物后產(chǎn)生的皮膚皰疹的面積,選200只家兔做試驗(yàn),將這200只家兔隨機(jī)地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B. 下表1和表2分別是注射藥物A和B后的試驗(yàn)結(jié)果.(皰疹面積單位:mm2) 表1:注射藥物A后皮膚皰疹面積的頻數(shù)分布表 皰疹面積 [60,65) [65,70) [70,75) [75,80) 頻數(shù) 30 40 20 10 表2:注射藥物B后皮膚皰疹面積的
25、頻數(shù)分布表 皰疹面積 [60,65) [65,70) [70,75) [75,80) [80,85) 頻數(shù) 10 25 20 30 15 (ⅰ)完成下面頻率分布直方圖,并比較注射兩種藥物后皰疹面積的中位數(shù)大小; (ⅱ)完成下面22列聯(lián)表,并回答能否有99.9% 的把握認(rèn)為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”. 表3: 皰疹面積小 于70 mm2 皰疹面積不小 于70 mm2 合計(jì) 注射藥物A a= b= 注射藥物B c= d= 合計(jì)n= 附:K2= 解析 (ⅰ) 可以看出注射藥物A后的皰疹面積的中位數(shù)在65至70之間,而注射藥物B后的皰疹面積的中位數(shù)在70至75之間,,所以注射藥物A后皰疹面積的中位數(shù)小于注射藥物B后皰疹面積的中位數(shù). (ⅱ)表3: 皰疹面積小 于70 mm2 皰疹面積不小 于70 mm2 合計(jì) 注射藥物A a=70 b=30 100 注射藥物B c=35 d=65 100 合計(jì) 105 95 n=200 K2=≈24.56. 由于K2>10.828,所以有99.9%的把握認(rèn)為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”. X
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。