指導(dǎo)應(yīng)用回歸分析資料報告(第三版)何曉群 劉文卿 課后習(xí)題問題詳解 完整版
《指導(dǎo)應(yīng)用回歸分析資料報告(第三版)何曉群 劉文卿 課后習(xí)題問題詳解 完整版》由會員分享,可在線閱讀,更多相關(guān)《指導(dǎo)應(yīng)用回歸分析資料報告(第三版)何曉群 劉文卿 課后習(xí)題問題詳解 完整版(115頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、word 第二章 一元線性回歸分析 思考與練習(xí)參考答案 一元線性回歸有哪些根本假定? 答: 假設(shè)1、解釋變量X是確定性變量,Y是隨機變量; 假設(shè)2、隨機誤差項ε具有零均值、同方差和不序列相關(guān)性: E(εi)=0 i=1,2, …,n Var (εi)=s2 i=1,2, …,n Cov(εi, εj)=0 i≠j i,j= 1,2, …,n 假設(shè)3、隨機誤差項ε與解釋變量X之間不相關(guān): Cov(Xi, εi)=0 i=1,2, …,n 假設(shè)4、ε服從零均值、同方差、零協(xié)方差的
2、正態(tài)分布 εi~N(0, s2 ) i=1,2, …,n 2.2 考慮過原點的線性回歸模型 Yi=β1Xi+εii=1,2, …,n 誤差εi〔i=1,2, …,n〕仍滿足根本假定。求β1的最小二乘估計 解: 得: 2.3 證明〔2.27式〕,Sei =0 ,SeiXi=0 。 證明: 其中: 即: Sei =0 ,SeiXi=0 回歸方程E〔Y〕=β0+β1X的參數(shù)β0,β1的最小二乘估計與最大似然估計在什么條件下等價?給出證明。 答:由于εi~N(0, s2 ) i=1,2, …,n 所
3、以Yi=β0 + β1Xi+ εi~N〔β0+β1Xi, s2) 最大似然函數(shù): 使得Ln〔L〕最大的,就是β0,β1的最大似然估計值。 同時發(fā)現(xiàn)使得Ln〔L〕最大就是使得下式最小, 上式恰好就是最小二乘估計的目標函數(shù)一樣。值得注意的是:最大似然估計是在εi~N(0, s2)的假設(shè)下求得,最小二乘估計如此不要求分布假設(shè)。 所以在εi~N(0, s2 ) 的條件下,參數(shù)β0,β1的最小二乘估計與最大似然估計等價。 2.5 證明是β0的無偏估計。 證明: 證明 證明: 證明平方和分解公式:SST=SSE+SSR 證明:
4、 2.8 驗證三種檢驗的關(guān)系,即驗證: 〔1〕;〔2〕 證明:〔1〕 〔2〕 2.9 驗證〔2.63〕式: 證明: 其中: 2.10 用第9題證明是s2的無偏估計量 證明: 2.11 驗證決定系數(shù)與F值之間的關(guān)系式 證明: 2.14 為了調(diào)查某廣告對銷售收入的影響,某商店記錄了5個月的銷售收入y〔萬元〕和廣告費用x〔萬元〕,數(shù)據(jù)見表2.6,要求用手工計算: 月份 1 2 3 4 5 X 1 2 3 4 5 Y 10 10 20 20 40 (1) 畫散點圖〔略〕 (2) X與Y是否大致呈線性關(guān)系? 答
5、:從散點圖看,X與Y大致呈線性關(guān)系。 (3) 用最小二乘法估計求出回歸方程。 計算表 X Y 1 10 4 100 20 6 〔-14〕2 〔-4〕2 2 10 1 100 10 13 〔-7〕2 〔3〕2 3 20 0 0 0 20 0 0 4 20 1 0 0 27 72 72 5 40 4 400 40 34 142 〔-6〕2 和15 100 和Lxx=10 Lyy=600 和Lxy=70 和100 SSR=490 SSE=110 均3 均20
6、 均20 回歸方程為: (4) 求回歸標準誤差 先求SSR〔Qe〕見計算表。 所以 (5) 給出 的置信度為95%的區(qū)間估計; 由于(1-a)的置信度下, 的置信區(qū)間是 查表可得 所以 的95%的區(qū)間估計為:〔7—3.182*1.915,7+3.182*1.915〕,即〔0.906,13.094〕。 所以 的95%的區(qū)間估計為:〔-1-3.182*6.351,-1+3.182*6.351〕, 即〔-21.211, 19.211〕。的置信區(qū)間包含0,表示不顯著。 (6) 計算x和y的決定系數(shù) 說明回歸方程的擬合優(yōu)度高。
7、 (7) 對回歸方程作方差分析 方差分析表 方差來源 平方和 自由度 均方 F值 SSR 490 1 490 SSE 110 3 SST 600 4 F值=13.364>F(1,3)=10.13(當n=1,n=8時,α=0.05查表得對應(yīng)的值為10.13),所以拒絕原假設(shè),說明回歸方程顯著。 〔8〕做回歸系數(shù)β1的顯著性檢驗H0: β1=0 t值=3.656>t(3)=3.182,所以拒絕原假設(shè),說明x對Y有顯著的影響。 (8) 做相關(guān)系數(shù)R的顯著性檢驗 R值=0.904>R(3)=0.878,所以承受原假設(shè),說明x和
8、Y有顯著的線性關(guān)系。 (9) 對回歸方程作殘差圖并作相應(yīng)的分析 殘差圖(略) .從殘差圖上看出,殘差是圍繞e=0在一個固定的帶子里隨機波動,根本滿足模型的假設(shè)ei~N(0, s2 ), 但由于樣本量太少, 所以誤差較大. (10) 求廣告費用為4.2萬元時,銷售收入將達到多少?并給出置信度為95%的置信區(qū)間. 解: 當X0=4.2時, 所以廣告費用為4.2萬元時, 銷售收入將達到28.4萬元. 由于置信度為1-α?xí)r,Y0估計值的置信區(qū)間為: 所以求得Y0的95%的置信區(qū)間為: [ ,] 預(yù)測誤差較大. 2.15 一家保險公司十分關(guān)心其總公司營業(yè)部加班的制度,決定
9、認真調(diào)查一下現(xiàn)狀。經(jīng)過十周時間,收集了每周加班工作時間的數(shù)據(jù)和簽發(fā)的新保單數(shù)目,x為每周新簽發(fā)的保單數(shù)目,y為每周加班工作時間〔小時〕。見表2.7。 表2..7 周序號 1 2 3 4 5 6 7 8 9 10 X 825 215 1070 550 480 920 1350 325 670 1215 Y 1、畫散點圖 2、由散點圖可以看出, x與y之間大致呈線性關(guān)系。 3、用最小二乘法求出回歸系數(shù) 由表可知: 回歸方程為: 4、求回歸標準誤差 故回歸標準誤差,=0.48。 5
10、、給出回歸系數(shù)的置信度為95%的區(qū)間估計 由回歸系數(shù)顯著性檢驗表可以看出,當置信度為95%時: 的預(yù)測區(qū)間為[-0.701,0.937],的預(yù)測區(qū)間為[0.003,0.005]. 的置信區(qū)間包含0,表示不拒絕為零的假設(shè)。 6、決定系數(shù) 由模型概要表得到?jīng)Q定系數(shù)為0.9接近于1,說明模型的擬合優(yōu)度高。 7. 對回歸方程作方差分析 由方差分析表可知: F值=72.396>5.32(當n=1,n=8時,查表得對應(yīng)的值為5.32) P值0,所以拒絕原假設(shè),說明回歸方程顯著。 8、對的顯著性檢驗 從上面回歸系數(shù)顯著性檢驗表可以得到的t統(tǒng)計量為t=8.509,所對應(yīng)的p值近似為0,通
11、過t檢驗。說明每周簽發(fā)的新保單數(shù)目x對每周加班工作時間y有顯著的影響。 相關(guān)系數(shù)顯著性檢驗 相關(guān)系數(shù)達到0.949,說明x與y顯著線性相關(guān)。 10、對回歸方程作殘差圖并作相應(yīng)分析 從殘差圖上看出,殘差是圍繞e=0隨即波動,滿足模型的根本假設(shè)。 11、該公司預(yù)計下一周簽發(fā)新保單X0=1000,需要的加班時間是多少? 當x=1000時,小時 12、給出Y0的置信水平為95%的預(yù)測區(qū)間 通過SPSS運算得到Y(jié)0的置信水平為95%的預(yù)測區(qū)間為: 〔2.5195,4.8870〕。 13 給出E〔Y0〕的置信水平為95%的預(yù)測區(qū)間 通過SPSS運算得到Y(jié)0的置信水平為95%
12、的預(yù)測區(qū)間為:〔3.284,4.123〕。 2.16 表是1985年美國50個州和哥倫比亞特區(qū)公立學(xué)校中教師的人均年工資y(美元)和學(xué)生的人均經(jīng)費投入x(美元). 序號 y x 序號 y x 序號 y x 1 19583 3346 18 20816 3059 35 19538 2642 2 20263 3114 19 18095 2967 36 20460 3124 3 20325 3554 20 20939 3285 37 21419 2752 4 26800 4542 21 22644 3914 38
13、 25160 3429 5 29470 4669 22 24624 4517 39 22482 3947 6 26610 4888 23 27186 4349 40 20969 2509 7 30678 5710 24 33990 5020 41 27224 5440 8 27170 5536 25 23382 3594 42 25892 4042 9 25853 4168 26 20627 2821 43 22644 3402 10 24500 3547 27 22795 3366 4
14、4 24640 2829 11 24274 3159 28 21570 2920 45 22341 2297 12 27170 3621 29 22080 2980 46 25610 2932 13 30168 3782 30 22250 3731 47 26015 3705 14 26525 4247 31 20940 2853 48 25788 4123 15 27360 3982 32 21800 2533 49 29132 3608 16 21690 3568 33 22934 2
15、729 50 41480 8349 17 21974 3155 34 18443 2305 51 25845 3766 解答:〔1〕繪制y對x的散點圖,可以用直線回歸描述兩者之間的關(guān)系嗎? 由上圖可以看出y與x的散點分布大致呈直線趨勢。 〔2〕建立y對x的線性回歸。 利用SPSS進展y和x的線性回歸,輸出結(jié)果如下: 表1 模型概要 R R2 調(diào)整后的R2 隨機誤差項的標準差估計值 表2 方差分析表 模型 平方和 自由度 和平均 F值 P值 1 回歸平方和 1 .000a 殘差平方和 49
16、 總平方和 50 表3 系數(shù)表 模型 非標準化系數(shù) 標準化系數(shù) t值 P值 B 標準差 回歸系數(shù) 1 常數(shù) .000 對學(xué)生的人均經(jīng)費投入 .312 .835 .000 1) 由表1可知,x與y決定系數(shù)為,說明模型的擬合效果一般。x與y線性相關(guān)系數(shù)R=0.835,說明x與y有較顯著的線性關(guān)系。 2) ,說明回歸方程顯著。 3) 由表3 可見對的顯著性t檢驗P值近似為零,故顯著不為0,說明x對y有顯著的線性影響。 4) 綜上,模型通過檢驗,可以用于預(yù)測和控制。 x與y的線性回歸方程為:
17、〔3〕繪制標準殘差的直方圖和正態(tài)概率圖 圖1 標準殘差的直方圖 理論正 態(tài)概率 觀測值概率 圖2 標準殘差的正態(tài)概率P-P圖 由圖1可見標準化后殘差近似服從正態(tài)分布,由圖2可見正態(tài)概率圖中的各個散點都分布在45°線附近,所以沒有證據(jù)證明誤差項服從同方差的正態(tài)分布的假定是不真實的,即殘差通過正態(tài)性檢驗,滿足模型根本假設(shè)。 第3章 多元線性回歸 思考與練習(xí)參考答案 3.2 討論樣本容量n與自變量個數(shù)p的關(guān)系,它們對模型的參數(shù)估計有何影響? 答:在多元線性回歸模型中,樣本容量n與自變量個數(shù)p的關(guān)系是:n>>p。如果n<=p對模型的參數(shù)估計會帶來很嚴重的影響
18、。因為: 1. 在多元線性回歸模型中,有p+1個待估參數(shù)β,所以樣本容量的個數(shù)應(yīng)該大于解釋變量的個數(shù),否如此參數(shù)無法估計。 2. 解釋變量X是確定性變量,要求,明確設(shè)計矩陣X中的自變量列之間不相關(guān),即矩陣X是一個滿秩矩陣。假設(shè),如此解釋變量之間線性相關(guān),是奇異陣,如此的估計不穩(wěn)定。 3.3證明 隨機誤差項ε的方差s2的無偏估計。 證明: 3.4 一個回歸方程的復(fù)相關(guān)系數(shù)R=0.99,樣本決定系數(shù)R2=0.9801,我們能判斷這個回歸方程就很理想嗎? 答:不能斷定這個回歸方程理想。因為: 1. 在樣本容量較少,變量個數(shù)較大時,決定系數(shù)的值容易接近1
19、,而此時可能F檢驗或者關(guān)于回歸系數(shù)的t檢驗,所建立的回歸方程都沒能通過。 2. 樣本決定系數(shù)和復(fù)相關(guān)系數(shù)接近于1只能說明Y與自變量X1,X2,…,Xp整體上的線性關(guān)系成立,而不能判斷回歸方程和每個自變量是顯著的,還需進展F檢驗和t檢驗。 3. 在應(yīng)用過程中發(fā)現(xiàn),在樣本容量一定的情況下,如果在模型中增加解釋變量必定使得自由度減少,使得 R2往往增大,因此增加解釋變量〔尤其是不顯著的解釋變量〕個數(shù)引起的R2的增大與擬合好壞無關(guān)。 3.7 驗證 證明:多元線性回歸方程模型的一般形式為: 其經(jīng)驗回歸方程式為, 又, 故, 中心化后,如此有, 左右同時除以, 令, 樣
20、本數(shù)據(jù)標準化的公式為 , 如此上式可以記為 如此有 3.10 驗證決定系數(shù)R2與F值之間的關(guān)系式: 證明: 3.11 研究貨運總量y〔萬噸〕與工業(yè)總產(chǎn)值x1〔億元〕、農(nóng)業(yè)總產(chǎn)值x2〔億元〕、居民非商品支出x3〔億元〕的關(guān)系。數(shù)據(jù)見表3.9〔略〕。 〔1〕計算出y,x1,x2,x3的相關(guān)系數(shù)矩陣。 SPSS輸出如下: 如此相關(guān)系數(shù)矩陣為: 〔2〕求出y與x1,x2,x3的三元回歸方程。 對數(shù)據(jù)利用SPSS做線性回歸,得到回歸方程為 〔3〕對所求的方程作擬合優(yōu)度檢驗。 由上表可知,調(diào)整后的決定系數(shù)為0.708,說明回歸方程對樣本觀測值的擬合程度
21、較好。 〔4〕對回歸方程作顯著性檢驗; 原假設(shè): F統(tǒng)計量服從自由度為〔3,6〕的F分布,給定顯著性水平=0.05,查表得,由方查分析表得,F(xiàn)值=8.283>4.76,p值=0.015,拒絕原假設(shè),由方差分析表可以得到,說明在置信水平為95%下,回歸方程顯著。 〔5〕對每一個回歸系數(shù)作顯著性檢驗; 做t檢驗:設(shè)原假設(shè)為, 統(tǒng)計量服從自由度為n-p-1=6的t分布,給定顯著性水平0.05,查得單側(cè)檢驗臨界值為1.943,X1的t值=1.942<1.943,處在否認域邊緣。 X2的t值=2.465>1.943。拒絕原假設(shè)。 由上表可得,在顯著性水平時,只有的P值<0.05,
22、通過檢驗,即只有的回歸系數(shù)較為顯著 ;其余自變量的P值均大于0.05,即x1,x2的系數(shù)均不顯著。 〔6〕如果有的回歸系數(shù)沒有通過顯著性檢驗,將其剔除,重新建立回歸方程,并作回歸方程的顯著性檢驗和回歸系數(shù)的顯著性檢驗。 解:用后退法對數(shù)據(jù)重新做回歸分析,結(jié)果如下: 選擇模型二,重新建立的回歸方程為: 對新的回歸方程做顯著性檢驗: 原假設(shè): F服從自由度為〔2,7〕的F分布,給定顯著性水平=0.05,查表得,由方差分析表得,F(xiàn)值=11.117>4.74,p值=0.007,拒絕原假設(shè). 認為在顯著性水平=0.05下,x1,x2整體上對y有顯著的線性影響,即回歸方程是顯著的
23、。 對每一個回歸系數(shù)做顯著性檢驗: 做t檢驗:設(shè)原假設(shè)為,統(tǒng)計量服從自由度為n-p-1=7的t分布,給定顯著性水平0.05,查得單側(cè)檢驗臨界值為1.895,X1的t值=2.575>1.895,拒絕原假設(shè)。故顯著不為零,自變量X1對因變量y的線性效果顯著; 同理β2也通過檢驗。同時從回歸系數(shù)顯著性檢驗表可知:X1,X2的p值 都小于0.05,可認為對x1,x2分別對y都有顯著的影響。 〔7〕求出每一個回歸系數(shù)的置信水平為955D 置信區(qū)間 由回歸系數(shù)表可以看到,β1置信水平為95%的置信區(qū)間[0.381,8.970], β2置信水平為95%的置信區(qū)間[3.134,14.808]
24、 〔8〕求標準化回歸方程 由回歸系數(shù)表〔上表〕可得,標準化后的回歸方程為: 〔9〕求當x01=75,x02=42,x03,給定置信水平95%,用SPSS軟件計算準確置信區(qū)間,用手工計算近似預(yù)測區(qū)間; 由SPSS輸出結(jié)果可知,當時,〔見上表〕,的置信度為95%的準確預(yù)測區(qū)間為〔204.4,331.2〕〔見下表〕,的置信度為95%的近似預(yù)測區(qū)間為,手工計算得:〔219.6,316.0〕。 〔10〕結(jié)合回歸方程對問題做一些簡單分析。 答:由回歸方程 可知農(nóng)業(yè)總產(chǎn)值固定的時候,工業(yè)總產(chǎn)值每增加1億元,貨運總量增加4.676萬噸;工業(yè)總產(chǎn)值固定的時候,農(nóng)業(yè)總產(chǎn)值每增加1億
25、元,貨運總量增加8.971萬噸。而居民非商品支出對貨運總量沒有顯著的線性影響。由標準化回歸方程可知: 工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值與Y都是正相關(guān)關(guān)系,比擬回歸系數(shù)的大小可知農(nóng)業(yè)總產(chǎn)值X2對貨運總量Y的影響程度大一些。 第4章 違背根本假設(shè)的情況 思考與練習(xí)參考答案 4.1 試舉例說明產(chǎn)生異方差的原因。 答:例:截面資料下研究居民家庭的儲蓄行為 Yi=b0+b1Xi+εi 其中:Yi表示第i個家庭的儲蓄額,Xi表示第i個家庭的可支配收入。 由于高收入家庭儲蓄額的差異較大,低收入家庭的儲蓄額如此更有規(guī)律性,差異較小,所以εi的方差呈現(xiàn)單調(diào)遞增型變化。 例4.2:以某一行
26、業(yè)的企業(yè)為樣本建立企業(yè)生產(chǎn)函數(shù)模型 Yi=Aib1Kib2Lib3eεi 被解釋變量:產(chǎn)出量Y,解釋變量:資本K、勞動L、技術(shù)A,那么每個企業(yè)所處的外部環(huán)境對產(chǎn)出量的影響被包含在隨機誤差項中。由于每個企業(yè)所處的外部環(huán)境對產(chǎn)出量的影響程度不同,造成了隨機誤差項的異方差性。這時,隨機誤差項ε的方差并不隨某一個解釋變量觀測值的變化而呈規(guī)律性變化,呈現(xiàn)復(fù)雜型。 4.2 異方差帶來的后果有哪些? 答:回歸模型一旦出現(xiàn)異方差性,如果仍采用OLS估計模型參數(shù),會產(chǎn)生如下不良后果: 1、參數(shù)估計量非有效 2、變量的顯著性檢驗失去意義 3、回歸方程的應(yīng)用效果極不理想 總的來說,當模型出現(xiàn)異方差
27、性時,參數(shù)OLS估計值的變異程度增大,從而造成對Y的預(yù)測誤差變大,降低預(yù)測精度,預(yù)測功能失效。 4.3 簡述用加權(quán)最小二乘法消除一元線性回歸中異方差性的思想與方法。 答:普通最小二乘估計就是尋找參數(shù)的估計值使離差平方和達極小。其中每個平方項的權(quán)數(shù)一樣,是普通最小二乘回歸參數(shù)估計方法。在誤差項等方差不相關(guān)的條件下,普通最小二乘估計是回歸參數(shù)的最小方差線性無偏估計。然而在異方差的條件下,平方和中的每一項的地位是不一樣的,誤差項的方差大的項,在殘差平方和中的取值就偏大,作用就大,因而普通最小二乘估計的回歸線就被拉向方差大的項,方差大的項的擬合程度就好,而方差小的項的擬合程度就差。由OLS求出的
28、仍然是的無偏估計,但不再是最小方差線性無偏估計。所以就是:對較大的殘差平方賦予較小的權(quán)數(shù),對較小的殘差平方賦予較大的權(quán)數(shù)。這樣對殘差所提供信息的重要程度作一番校正,以提高參數(shù)估計的精度。 加權(quán)最小二乘法的方法: 簡述用加權(quán)最小二乘法消除多元線性回歸中異方差性的思想與方法。 答:運用加權(quán)最小二乘法消除多元線性回歸中異方差性的思想與一元線性回歸的類似。多元線性回歸加權(quán)最小二乘法是在平方和中參加一個適當?shù)臋?quán)數(shù),以調(diào)整各項在平方和中的作用,加權(quán)最小二乘的離差平方和為: 〔2〕 加權(quán)最小二乘估計就是尋找參數(shù)的估計值使式〔2〕的離差平方和達
29、極小。所得加權(quán)最小二乘經(jīng)驗回歸方程記做 〔3〕 多元回歸模型加權(quán)最小二乘法的方法: 首先找到權(quán)數(shù),理論上最優(yōu)的權(quán)數(shù)為誤差項方差的倒數(shù),即 〔4〕 誤差項方差大的項承受小的權(quán)數(shù),以降低其在式〔2〕平方和中的作用; 誤差項方差小的項承受大的權(quán)數(shù),以提高其在平方和中的作用。由〔2〕式求出的加權(quán)最小二乘估計就是參數(shù)的最小方差線性無偏估計。 一個需要解決的問題是誤差項的方差是未知的,因此無法真正按照式〔4〕選取權(quán)數(shù)。在實際問題中誤差項方差通常與自變量的水平有關(guān)(如誤差項方差隨著自變
30、量的增大而增大),可以利用這種關(guān)系確定權(quán)數(shù)。例如與第j個自變量取值的平方成比例時, 即=k時,這時取權(quán)數(shù)為 〔5〕 更一般的情況是誤差項方差與某個自變量(與|ei|的等級相關(guān)系數(shù)最大的自變量)取值的冪函數(shù)成比例,即=k,其中m是待定的未知參數(shù)。此時權(quán)數(shù)為 〔6〕 這時確定權(quán)數(shù) 的問題轉(zhuǎn)化為確定冪參數(shù)m的問題,可以借助SPSS軟件解決。4.5〔4.5〕式一元加權(quán)最小二乘回歸系數(shù)估計公式。 證明: 由 得: 驗證〔4.8〕式多元加權(quán)最小二乘
31、回歸系數(shù)估計公式。 證明:對于多元線性回歸模型 〔1〕 ,即存在異方差。設(shè) , 用左乘〔1〕式兩邊,得到一個新的的模型: ,即。 因為, 故新的模型具有同方差性,故可以用廣義最小二乘法估計該模型,得 原式得證。 4.7 有同學(xué)認為當數(shù)據(jù)存在異方差時,加權(quán)最小二乘回歸方程與普通最小二乘回歸方程之間必然有很大的差異,異方差越嚴重,兩者之間的差異就越大。你是否同意這位同學(xué)的觀點?說明原因。 答:不同意。當回歸模型存在異方差時,加權(quán)最小二乘估計〔WLS〕只是普通最小二乘估計〔OLS〕的改良,這種改良可能是細微的,不能理解為WLS一定會得到與OLS截然不同的方程來,或者大幅
32、度的改良。實際上可以構(gòu)造這樣的數(shù)據(jù),回歸模型存在很強的異方差,但WLS 與OLS的結(jié)果一樣。加權(quán)最小二乘法不會消除異方差,只是消除異方差的不良影響,從而對模型進展一點改良。 4.8 對例4.3的數(shù)據(jù),用公式計算出加權(quán)變換殘差,繪制加權(quán)變換殘差圖,根據(jù)繪制出的圖形說明加權(quán)最小二乘估計的效果。 解:用公式計算出加權(quán)變換殘差,分別繪制加權(quán)最小二乘估計后的殘差圖和加權(quán)變換殘差圖〔見如如下圖〕。 根據(jù)繪制出的兩個圖形可以發(fā)現(xiàn)加權(quán)最小二乘估計沒有消除異方差,只是對原OLS的殘差有所改善,而經(jīng)過加權(quán)變換后的殘差不存在異方差。 4.9 參見參考文獻[2],表4.12〔P138〕是用電頂峰每小時
33、用電量y與每月總用電量x的數(shù)據(jù)。 〔1〕用普通最小二乘法建立y與x的回歸方程,并畫出殘差散點圖。 解:SPSS輸出結(jié)果如下: 由上表可得回歸方程為: 殘差圖為: 〔2〕診斷該問題是否存在異方差; 解:a由殘差散點圖可以明顯看出存在異方差,誤差的方差隨著的增加而增大。 b用SPSS做等級相關(guān)系數(shù)的檢驗,結(jié)果如下表所示: 得到等級相關(guān)系數(shù),P值=0.021,認為殘差絕對值與自變量顯著相關(guān),存在異方差。 〔3〕如果存在異方差,用冪指數(shù)型的權(quán)函數(shù)建立加權(quán)最小二乘回歸方程; 解:SPSS輸出結(jié)果如圖: 由上述表可得,在時對數(shù)似然函數(shù)達到最大,如此冪指數(shù)的最優(yōu)
34、取值為。加權(quán)后的回歸方程為:。 計算加權(quán)后的殘差,并對殘差絕對值和自變量做等級相關(guān)系數(shù)分析,結(jié)果如下表所示: ,P值為0.019<0.05,即加權(quán)最小二乘法沒有消除異方差,只是消除異方差的不良影響,從而對模型進展一點改良。 〔4〕用方差穩(wěn)定變換消除異方差。 解:對應(yīng)變量做方差穩(wěn)定變換〔〕后,用最小二乘法做回歸,SPSS結(jié)果如下表: 如此回歸方程為:。 保存預(yù)測值,計算出殘差的絕對值后,計算等級相關(guān)系數(shù),見下表: 其中,P值=0.254>0.05,說明異方差已經(jīng)消除。 4.10 試舉一可能產(chǎn)生隨機誤差項序列相關(guān)的經(jīng)濟例子。 答:例如,居民總消費函數(shù)模型: Ct
35、=b0+b1Yt+ εt t=1,2,…,n 由于居民收入對消費影響有滯后性,而且今年消費水平受上年消費水平影響,如此可能出現(xiàn)序列相關(guān)性。另外由于消費習(xí)慣的影響被包含在隨機誤差項中,如此可能出現(xiàn)序列相關(guān)性〔往往是正相關(guān) 〕。 4.11 序列相關(guān)性帶來的嚴重后果是什么? 答:直接用普通最小二乘法估計隨機誤差項存在序列相關(guān)性的線性回歸模型未知參數(shù)時,會產(chǎn)生如下一些問題: 1. 參數(shù)估計量仍然是無偏的,但不具有有效性,因為有自相關(guān)性時參數(shù)估計值的方差大于無自相關(guān)性時的方差。 2. 均方誤差MSE可能嚴重低估誤差項的方差 3. 變量的顯著性檢驗失去意義:在變量的顯著性檢驗中
36、,統(tǒng)計量是建立在參數(shù)方差正確估計根底之上的,當參數(shù)方差嚴重低估時,容易導(dǎo)致t值和F值偏大,即可能導(dǎo)致得出回歸參數(shù)統(tǒng)計檢驗和回歸方程檢驗顯著,但實際并不顯著的嚴重錯誤結(jié)論。 4. 當存在序列相關(guān)時, 仍然是的無偏估計,但在任一特定的樣本中, 可能嚴重歪曲b的真實情況,即最小二乘法對抽樣波動變得非常敏感 5. 模型的預(yù)測和結(jié)構(gòu)分析失效。 4.12 總結(jié)DW檢驗的優(yōu)缺點。 答:優(yōu)點:1.應(yīng)用廣泛,一般的計算機軟件都可以計算出DW值; 2.適用于小樣本; 3.可用于檢驗隨機擾動項具有一階自回歸形式的序列相關(guān)問題。 缺點:1. DW檢驗有兩個不能確定的區(qū)域,一旦DW值落入該區(qū)域,就無法
37、判斷。此時,只有增大樣本容量或選取其他方法; 2.DW統(tǒng)計量的上、下界表要求n>15,這是由于樣本如果再小,利用殘差就很難對自相關(guān)性的存在做出比擬正確的診斷; 3.DW檢驗不適應(yīng)隨機項具有高階序列相關(guān)性的檢驗。 4.13 表4.13中是某軟件公司月銷售額數(shù)據(jù),其中,x為總公司的月銷售額〔萬元〕;y為某分公司的月銷售額〔萬元〕。 〔1〕用普通最小二乘法建立y與x的回歸方程; 由上表可知:用普通二乘法建立的回歸方程為 〔2〕用殘差圖與DW檢驗診斷序列的相關(guān)性; 1.以自變量x為橫軸,普通殘差為縱軸畫殘差圖如下: 從圖中可以看到,殘差有規(guī)律的變化,呈現(xiàn)大致反W形狀,說明
38、隨機誤差項存在自相關(guān)性。 〔殘差1〕為橫坐標,〔殘差〕為縱坐標,繪制散點圖如下: 由殘差圖可見大局部的點落在第一、三象限,明確隨機擾動項存在著正的序列相關(guān); 可知DW值為0.663,查DW表,n=20,k=2,顯著性水平=0.05,得=1.20,=1.41,由于0.663<1.20,知DW值落入正相關(guān)區(qū)域,即殘差序列存在正的自相關(guān)。 〔3〕用迭代法處理序列相關(guān),并建立回歸方程。 自相關(guān)系數(shù) 令,,然后用對作普通最小二乘回歸可得輸出結(jié)果如下: 可看到新的回歸方程的DW=1.360.且1.18<1.360<1.40,因而DW檢驗落入不確定區(qū)域此時,一步迭代誤差
39、項的標準差為0.07296,小于 對的回歸方程為,將=,=代人,復(fù)原為原始變量的方程 由于一步迭代的DW檢驗落入不確定區(qū)域,因而可以考慮對數(shù)據(jù)進展二步迭代,也就是對和重復(fù)以上迭代過程。進展回歸結(jié)果如下: 此時DW的值為1.696,查DW表,n=18,k=2,顯著性水平=0.05,得=1.16, =1.39, DW值大于,小于2,落入無自相關(guān)區(qū)域。誤差標準項0.0849,略小于一步迭代的標準差0.7296。 但是在檢驗都通過的情況下,由于一步迭代的值和F值均大于兩步迭代后的值,且根據(jù)取模型簡約的原如此,最終選擇一步迭代的結(jié)果,即: 〔4〕用一階差分的方法處理數(shù)據(jù),建立回歸
40、方程; 先計算差分=-,=-,然后用對做過原點的最小二乘回歸,結(jié)果如下: 由上面表,可知DW值為1.462>1.40=,即DW落入不相關(guān)區(qū)域,可知殘差序列不存在自相關(guān),一階差分法成功地消除了序列自相關(guān)。同時得到回歸方程為 , 將=-,=-,代人,復(fù)原原始變量的方程 =+0.169〔-〕 〔5〕比擬普通最小二乘法所得的回歸方程和迭代法、一階差分法所建立回歸方程的優(yōu)良性。 答:此題中自相關(guān)系數(shù)0.6685,不接近于1,不適宜用差分法,另外由迭代法的F值與都大于差分法的值,故差分法的效果低于迭代法的效果;而普通最小二乘法的隨機誤差項標準差為0.09744,大于迭代的隨機誤差項標
41、準差0.07296,所以迭代的效果要優(yōu)于普通最小二乘法,所以此題中一次迭代法最好。 4.14 某樂隊經(jīng)理研究其樂隊CD盤的銷售額〔y〕,兩個有關(guān)的影響變量是每周出場次x1和樂隊的周點擊率x2,數(shù)據(jù)見表4.14。 〔1〕用普通最小二乘法建立y與x1、x2的回歸方程,用殘差圖與DW檢驗診斷序列的自相關(guān)性; 解:將數(shù)據(jù)輸入SPSS,經(jīng)過線性回歸得到結(jié)果如下: Model Summary(b) Model R R Square Adjusted R Square Std. Error of the Estimate Durbin-Watson 1 .541(a) .29
42、3 .264 .745 a Predictors: (Constant), x2, x1 b Dependent Variable: y ANOVA(b) Model Sum of Squares df Mean Square F Sig. 1 Regression 2 .000(a) Residual 49 Total 51 a Predictors: (Constant), x2, x1 b Dependent Variable: y 由以上3個表可知普通最小二乘法建立y
43、與x1、x2的回歸方程,通過了r、F、t檢驗,說明回歸方程顯著。y與x1、x2的回歸方程為:
殘差圖ei(et)~ei1(et-1)為:
從殘差圖可以看出殘差集中在1、3象限,說明隨機誤差項存在一階正自相關(guān)。
查表得dl=1.46 du=1.63, 0
44、項間無自相關(guān)性。 回歸方程為:yt’’’ 復(fù)原為:yt-y(t-1)= -178.775+211.11*(x1t-x1(t-1)) +1.436*( x2t-x2(t-1)) (3)用一階差分法處理序列相關(guān),建立回歸方程。 Model Summary(c,d) Model R R Square(a) Adjusted R Square Std. Error of the Estimate Durbin-Watson 1 .715(b) .511 .491 a For regression through the origin (the no-i
45、ntercept model), R Square measures the proportion of the variability in the dependent variable about the origin explained by regression. This CANNOT be pared to R Square for models which include an intercept. b Predictors: DIFF(x2,1), DIFF(x1,1) c Dependent Variable: DIFF(y,1) d Linear Regress
46、ion through the Origin >du,所以消除了自相關(guān)性, 差分法回歸方程為: yt-yt-1=210.117(x1t-x1(t-1))+1.397(x2t-x2(t-1)). (4)用最大似然法處理序列相關(guān),建立回歸方程。 用SPSS軟件的自回歸功能,analyze——>time series——>autoregression: =0.631, =, (5)用科克倫-奧克特迭代法處理序列相關(guān),建立回歸方程 =0.632, =260.560 , DW=1.748。 〔6〕用普萊斯-溫斯登迭代法處理序列相關(guān),建立回歸方程。
47、 =0.632, = , DW=1.746。 〔7〕比擬以上各方法所建回歸方程的優(yōu)良性。 綜合以上各方法的模型擬合結(jié)果如下表所示: 自回歸方法 DW 迭代法 —— 差分法 —— —— 0 準確最大似然 —— —— 科克倫-奧克特 —— 普萊斯-溫斯登 —— 由上表可看出:DW值都落在了隨機誤差項無自相關(guān)性的區(qū)間上,一階差分法消除自相關(guān)最徹底,但因為=0.627,并不接近于1,故得到的方差較大,擬合效果不理想。將幾種方
48、法所得到的值進展比擬,就可知迭代法的擬合效果最好,以普萊斯-溫斯登法次之,差分法最差。 4.15 說明引起異常值的原因和消除異常值的方法。 答:通常引起異常值的原因和消除異常值的方法有以下幾條,見表4.10: 4.16 對第3章習(xí)題11做異常值檢驗。 研究貨運總量y〔萬噸〕與工業(yè)總產(chǎn)值x1〔億元〕、農(nóng)業(yè)總產(chǎn)值x2〔億元〕、居民非商品支出x3〔億元〕的關(guān)系。 〔1〕利用SPSS建立y與x1,x2,x3的三元回歸方程,分別計算普通殘差,學(xué)生化殘差,刪除殘差,刪除學(xué)生化殘差,中心化杠桿值,庫克距離,見下表: 從表中看到絕對值最大的學(xué)生化殘差為SRE=2.11556,小于3,但有超過3
49、的個別值,因而根據(jù)學(xué)生化殘差診斷認為存在異常值。絕對值最大的刪除學(xué)生化殘差為3.832,對應(yīng)為第6個數(shù)據(jù),因此判斷它為為異常值。第6個數(shù)據(jù)的中心化杠桿值為0.64,位于第一大,大于2=2=0.6,且?guī)炜司嚯x為3.21位于第一大,因而從杠桿值看是第6個數(shù)據(jù)是自變量的異常值,同時庫克距離大于1,故第6個數(shù)據(jù)為異常值的原因是由自變量異常與因變量異常兩個共同原因引起的。 編號 y X1 X2 X3 殘差 學(xué)生化 殘差 刪除殘差 刪除學(xué)生化殘差 1 2 3 4 5 6 7 8 9 10 160 260
50、 210 265 240 220 275 160 275 250 70 75 65 74 72 68 78 66 70 65 35 40 40 42
51、 38 45 42 36 44 42 -15.47481 12.82499 5.34434 -0 0.62767 0.26517 0.40935 -0.11351 -0.87604 0.59277 0.24349 -0.00396 0.37902 0.16609 0.03115 0.00620 0.000
52、00 0.40874 0.50110 0.28946 0.01500 0.22158 0.35418 0.14025 0.16079 0.09935 0.24 0.64187 0.49277 0.36129 0.16366 0.33883 (2) 刪除第6組數(shù)據(jù),然后做回歸分析, 編號 y X1 X2 X3 殘差 刪除學(xué)生化殘差 學(xué)生化殘差 刪除學(xué)生化殘差 1 2 3 4 5 7 8 9 10 160 260 210 265 240 275 160 275 250 70 75 65
53、74 72 78 66 70 65 35 40 40 42 38. 42 36 44 42 14.09650. 0.71258 0.62911 -0.75831 0.10566 0.27655 0.58638 -0.72098 -0.60244 0.09461 0.24927 0.36355 0.03367 0.07188 0.02948 0.57840 0.00749 0.03708 0.17
54、948 0.44322 0.34665 0.14278 0.22222 0.10976 0.38467 0.61732 0.54865 0.29224 0.33571 .由上表可知:刪除第六組數(shù)據(jù)后,發(fā)現(xiàn)學(xué)生化殘差的絕對值和刪除化學(xué)生殘差絕對值均小于3,庫克距離均小于1,中心化杠桿值的最大值為0.61732<2= ,說明數(shù)據(jù)不再有異常值。 所以可判斷異常值的原因是由于數(shù)據(jù)登記或?qū)嶋H問題有突變引起的。 第5章 自變量選擇與逐步回歸 思考與練習(xí)參考答案 5.1 自變量選擇對回歸參數(shù)的估計有何影響? 答: 回歸自變量的選擇是建立回歸模型得一個極為重要的問題。如果模型中
55、丟掉了重要的自變量, 出現(xiàn)模型的設(shè)定偏誤,這樣模型容易出現(xiàn)異方差或自相關(guān)性 ,影響回歸的效果;如果模型中增加了不必要的自變量, 或者數(shù)據(jù)質(zhì)量很差的自變量, 不僅使得建模計算量增大, 自變量之間信息有重疊,而且得到的模型穩(wěn)定性較差,影響回歸模型的應(yīng)用。 5.2自變量選擇對回歸預(yù)測有何影響? 答:當全模型〔m元〕正確采用選模型〔p元〕時,我們舍棄了m-p個自變量,回歸系數(shù)的最小二乘估計是全模型相應(yīng)參數(shù)的有偏估計,使得用選模型的預(yù)測是有偏的,但由于選模型的參數(shù)估計、預(yù)測殘差和預(yù)測均方誤差具有較小的方差,所以全模型正確而誤用選模型有利有弊。 當選模型〔p元〕正確采用全模型〔m元〕時,全模型回歸系數(shù)
56、的最小二乘估計是相應(yīng)參數(shù)的有偏估計,使得用模型的預(yù)測是有偏的,并且全模型的參數(shù)估計、預(yù)測殘差和預(yù)測均方誤差的方差都比選模型的大,所以回歸自變量的選擇應(yīng)少而精。 5.3 如果所建模型主要用于預(yù)測,應(yīng)該用哪個準如此來衡量回歸方程的優(yōu)劣? 答:如果所建模型主要用于預(yù)測,如此應(yīng)使用統(tǒng)計量達到最小的準如此來衡量回歸方程的優(yōu)劣。 5.4 試述前進法的思想方法。 答:前進法的根本思想方法是:首先因變量Y對全部的自變量x1,x2,...,xm建立m個一元線性回歸方程, 并計算F檢驗值,選擇偏回歸平方和顯著的變量〔F值最大且大于臨界值〕進入回歸方程。每一步只引入一個變量,同時建立m-1個二元線性回歸方程
57、,計算它們的F檢驗值,選擇偏回歸平方和顯著的兩變量變量〔F值最大且大于臨界值〕進入回歸方程。在確定引入的兩個自變量以后,再引入一個變量,建立m-2個三元線性回歸方程,計算它們的F檢驗值,選擇偏回歸平方和顯著的三個變量〔F值最大〕進入回歸方程。不斷重復(fù)這一過程,直到無法再引入新的自變量時,即所有未被引入的自變量的F檢驗值均小于F檢驗臨界值Fα(1,n-p-1),回歸過程完畢。 5.5 試述后退法的思想方法。 答:后退法的根本思想是:首先因變量Y對全部的自變量x1,x2,...,xm建立一個m元線性回歸方程, 并計算t檢驗值和F檢驗值,選擇最不顯著〔P值最大且大于臨界值〕的偏回歸系數(shù)的自變量剔
58、除出回歸方程。每一步只剔除一個變量,再建立m-1元線性回歸方程,計算t檢驗值和F檢驗值,剔除偏回歸系數(shù)的t檢驗值最小〔P值最大〕的自變量,再建立新的回歸方程。不斷重復(fù)這一過程,直到無法剔除自變量時,即所有剩余p個自變量的F檢驗值均大于F檢驗臨界值Fα(1,n-p-1),回歸過程完畢。 5.6前進法、后退法各有哪些優(yōu)缺點? 答:前進法的優(yōu)點是能夠?qū)σ蜃兞坑杏绊懙淖宰兞堪达@著性一一選入,計算量小。前進法的缺點是不能反映引進新變量后的變化,而且選入的變量就算不顯著也不能刪除。后退法的優(yōu)點是是能夠?qū)σ蜃兞繘]有顯著影響的自變量按不顯著性一一剔除,保存的自變量都是顯著的。后退法的缺點是開始計算量大
59、,當減少一個自變量時,它再也沒機會進入了。如果碰到自變量間有相關(guān)關(guān)系時,前進法和后退法所作的回歸方程均會出現(xiàn)不同程度的問題。 5.7 試述逐步回歸法的思想方法。 答:逐步回歸的根本思想是有進有出。具體做法是將變量一個一個的引入,當每引入一個自變量后,對已選入的變量要進展逐個檢驗,當原引入變量由于后面變量的應(yīng)納入而變得不再顯著時,要將其剔除。引入一個變量或從回歸防方程中剔除一個變量,為逐步回歸的一步,每一步都要進展F檢驗,以確保每次引入新的變量之前回歸方程中只包含顯著的變量。這個過程反復(fù)進展,直到無顯著變量引入回歸方程,也無不顯著變量從回歸方程中剔除為止。這樣就防止了前進法和后退法各自的缺陷
60、,保證了最后得到的回歸子集是最優(yōu)回歸子集。 5.8 在運用逐步回歸法時,α進和α出的賦值原如此是什么?如果希望回歸方程中多保存一些自變量,α進應(yīng)如何賦值? 答:原如此是要求引入自變量的顯著水平α進小于剔除自變量的顯著性水平α出,否如此可能出現(xiàn)死循環(huán);假設(shè)想回歸方程多保存自變量,可以增大α進的值,使得更多自變量的P值在α進的圍,但要注意,α進的值不得超過α出的值。 5.9 在研究國家財政收入時,我們把財政收入按收入形式分為:各項稅收收入、企業(yè)收入、債務(wù)收入、國家能源交通重點建設(shè)收入、根本建設(shè)貸款歸還收入、國家預(yù)算調(diào)節(jié)基金收入、其他收入等。為了建立國家財政收入回歸模型,我們以財政收入y〔億元
61、〕為因變量,自變量如下:x1為農(nóng)業(yè)增加值〔億元〕,x2為工業(yè)增加值〔億元〕,x3為建筑業(yè)增加值〔億元〕,x4為人口數(shù)〔萬人〕,x5為社會消費總額〔億元〕,x6為受災(zāi)面積〔萬公頃〕。據(jù)《中國統(tǒng)計年鑒》獲得1978—1998年共21個年份的統(tǒng)計數(shù)據(jù),見表5.4〔P167〕。由定性分析知,所有自變量都與y有較強的相關(guān)性,分別用后退法和逐步回歸法作自變量選元。 解:后退法SPSS輸出結(jié)果: 逐步回歸法 二者結(jié)果一樣,回歸方程為: — 但是回歸系數(shù)的解釋不合理。 表5.5的數(shù)據(jù)是1968-1983年期間與線制造有關(guān)的數(shù)據(jù),各變量的含義如下: x1——年份; x2——國民生產(chǎn)總值〔
62、10億美元〕; x3——新房動工數(shù)〔單位:1000〕; x4——失業(yè)率〔%〕; x5——滯后6個月的最惠利率; x6——用戶用線增量〔%〕; y——年銷量〔百萬尺雙線〕。 〔1〕建立y對x2~x6的線性回歸方程。SPSS輸出結(jié)果如下: 回歸方程為: 其中x2、 x5的系數(shù)未通過檢驗。 (2)用后退法選擇自變量。 后退法剔除P值最大的剔除x5,模型的參數(shù)均通過顯著性檢驗?!诧@著性水平α=0.05〕,得回歸方程為: 模型明確年銷量〔y〕與國民生產(chǎn)總值、新房動工數(shù)、失業(yè)率、用戶用線增量有顯著的線性關(guān)系。 〔3〕用逐步回歸法選擇自變量 逐步回歸法引入x3,x5
63、,x4進入回歸模型,沒有剔除變量,保存x3,x5,x4作為最終模型?;貧w方程為: — 模型明確年銷量〔y〕與新房動工費、失業(yè)率、滯后6個月的最惠利率 有顯著的線性關(guān)系。 〔4〕根據(jù)以上計算結(jié)果分析后退法和逐步回歸法的差異 答:兩個方法得到的最終模型是不同的,后退法首先剔除了x5,而逐步回歸法在第二步引入了x5,說明兩種方法對自變量選取的方法是不同的,這與自變量之間的相關(guān)性有關(guān)。相比之下,后退法首先做全模型的回歸,每個自變量都有機會展示自己的作用,所得結(jié)果更值得信服。從本例看,x5是滯后6個月的最惠利率,對因變量的影響似乎不大。 第6章 多重共線性的情形與其處理 思考與練習(xí)參考答案
64、 6.1 試舉一個產(chǎn)生多重共線性的經(jīng)濟實例。 答:例如有人建立某地區(qū)糧食產(chǎn)量回歸模型,以糧食產(chǎn)量為因變量Y,化肥用量為X1,水澆地面積為X2,農(nóng)業(yè)投入資金為X3。由于農(nóng)業(yè)投入資金X3與化肥用量X1,水澆地面積X2有很強的相關(guān)性,所以回歸方程效果會很差。再例如根據(jù)某行業(yè)企業(yè)數(shù)據(jù)資料擬合此行業(yè)的生產(chǎn)函數(shù)時,資本投入、勞動力投入、資金投入與能源供應(yīng)都與企業(yè)的生產(chǎn)規(guī)模有關(guān),往往出現(xiàn)高度相關(guān)情況,大企業(yè)二者都大,小企業(yè)都小。 6.2多重共線性對回歸參數(shù)的估計有何影響? 答:1、完全共線性下參數(shù)估計量不存在; 2、近似共線性下OLS估計量非有效; 3、參數(shù)估計量經(jīng)濟含義不合理; 4、變量的顯著
65、性檢驗失去意義; 5、模型的預(yù)測功能失效。 6.3 具有嚴重多重共線性的回歸方程能不能用來做經(jīng)濟預(yù)測? 答:雖然參數(shù)估計值方差的變大容易使區(qū)間預(yù)測的“區(qū)間〞變大,使預(yù)測失去意義。但如果利用模型去做經(jīng)濟預(yù)測,只要保證自變量的相關(guān)類型在未來期中一直保持不變,即使回歸模型中包含嚴重多重共線性的變量,也可以得到較好預(yù)測結(jié)果;否如此會對經(jīng)濟預(yù)測產(chǎn)生嚴重的影響。 6.4多重共線性的產(chǎn)生于樣本容量的個數(shù)n、自變量的個數(shù)p有無關(guān)系? 答:有關(guān)系,增加樣本容量不能消除模型中的多重共線性,但能適當消除多重共線性造成的后果。當自變量的個數(shù)p較大時,一般多重共線性容易發(fā)生,所以自變量應(yīng)選擇少而精。 6.5
66、 自己找一個經(jīng)濟問題來建立多元線性回歸模型,怎樣選擇變量和構(gòu)造設(shè)計矩陣X才可能防止多重共線性的出現(xiàn)? 答:請參考第三次上機實驗題——機場吞吐量的多元線性回歸模型,注意利用二手數(shù)據(jù)很難防止多重共線性的出現(xiàn),所以一般利用逐步回歸和主成分回歸消除多重共線性。如果進展自己進展試驗設(shè)計如正交試驗設(shè)計,并收集數(shù)據(jù),選擇向量使設(shè)計矩陣X的列向量〔即X1,X2, Xp〕不相關(guān)。 6.6對第5章習(xí)題9財政收入的數(shù)據(jù)分析多重共線性,并根據(jù)多重共線性剔除變量。將所得結(jié)果與逐步回歸法所得的選元結(jié)果相比擬。 附5.9 在研究國家財政收入時,我們把財政收入按收入形式分為:各項稅收收入、企業(yè)收入、債務(wù)收入、國家能源交通重點建設(shè)收入、根本建設(shè)貸款歸還收入、國家預(yù)算調(diào)節(jié)基金收入、其他收入等。為了建立國家財政收入回歸模型,我們以財政收入y〔億元〕為因變量,自變量如下:x1為農(nóng)業(yè)增加值〔億元〕,x2為工業(yè)增加值〔億元〕,x3為建筑業(yè)增加值〔億元〕,x4為人口數(shù)〔萬人〕,x5為社會消費總額〔億元〕,x6為受災(zāi)面積〔萬公頃〕。據(jù)《中國統(tǒng)計年鑒》獲得1978—1998年共21個年份的統(tǒng)計數(shù)據(jù),見表5.4〔P167〕。由定性
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024《增值稅法》全文學(xué)習(xí)解讀(規(guī)范增值稅的征收和繳納保護納稅人的合法權(quán)益)
- 2024《文物保護法》全文解讀學(xué)習(xí)(加強對文物的保護促進科學(xué)研究工作)
- 銷售技巧培訓(xùn)課件:接近客戶的套路總結(jié)
- 20種成交的銷售話術(shù)和技巧
- 銷售技巧:接近客戶的8種套路
- 銷售套路總結(jié)
- 房產(chǎn)銷售中的常見問題及解決方法
- 銷售技巧:值得默念的成交話術(shù)
- 銷售資料:讓人舒服的35種說話方式
- 汽車銷售績效管理規(guī)范
- 銷售技巧培訓(xùn)課件:絕對成交的銷售話術(shù)
- 頂尖銷售技巧總結(jié)
- 銷售技巧:電話營銷十大定律
- 銷售逼單最好的二十三種技巧
- 銷售最常遇到的10大麻煩