統(tǒng)計(jì)學(xué)第一二章數(shù)據(jù)與統(tǒng)計(jì)學(xué)
《統(tǒng)計(jì)學(xué)第一二章數(shù)據(jù)與統(tǒng)計(jì)學(xué)》由會員分享,可在線閱讀,更多相關(guān)《統(tǒng)計(jì)學(xué)第一二章數(shù)據(jù)與統(tǒng)計(jì)學(xué)(13頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、第一章 數(shù)據(jù)與統(tǒng)計(jì)學(xué) 第一節(jié) 統(tǒng)計(jì)數(shù)據(jù)與統(tǒng)計(jì)學(xué) 1 .統(tǒng)計(jì)學(xué)是一門收集、整理、顯示和分析統(tǒng)計(jì)數(shù)據(jù)的科學(xué),目的是探索數(shù)據(jù)的內(nèi) 在數(shù)量規(guī)律性。 2 .研究過程:提出問題 —?解釋數(shù)據(jù)(結(jié)果說明)=> 分析數(shù)據(jù)(研究數(shù)據(jù))T 整理數(shù)據(jù)(處理數(shù)據(jù))—> 收集數(shù)據(jù)(取得數(shù)據(jù))=> 解決問題 第二節(jié) 統(tǒng)計(jì)學(xué)的產(chǎn)生與發(fā)展 3 .古典統(tǒng)計(jì)學(xué)階段(17世紀(jì)中葉?19世紀(jì)初):(1)國勢學(xué)派:使用記述、對 比的方法研究國家基本國情;(2)政治算術(shù)學(xué)派:使用數(shù)字、圖表等統(tǒng)計(jì)方法, 研究英國、法國、荷蘭三國的國情、國力;(3)概率論學(xué)派:研究隨機(jī)現(xiàn)象 —? 近代統(tǒng)計(jì)學(xué)階段(19世紀(jì)初?20世紀(jì)初)—> 現(xiàn)代
2、統(tǒng)計(jì)學(xué)階段(20世紀(jì)初至 今) 第三節(jié)統(tǒng)計(jì)學(xué)的分科 4 .從統(tǒng)計(jì)教育的角度,統(tǒng)計(jì)學(xué)可以分為描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)、理論統(tǒng)計(jì)和應(yīng)用統(tǒng) 計(jì) 5 .描述統(tǒng)計(jì)是指用圖形、表格和概括性的數(shù)字對數(shù)據(jù)進(jìn)行描述的統(tǒng)計(jì)方法。描述 統(tǒng)計(jì)學(xué)是研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)分支 。 6 .描述統(tǒng)計(jì)學(xué)的內(nèi)容:(1)整理數(shù)據(jù);(2)收集數(shù)據(jù);(3)展示數(shù)據(jù);(4) 描述性分析。 7 .描述統(tǒng)計(jì)學(xué)的目的:(1)描述數(shù)據(jù)的基本特征;(2)找出數(shù)據(jù)的基本規(guī)律。 8 .描述統(tǒng)計(jì)學(xué)的研究對象:確定性現(xiàn)象。 9 .推斷統(tǒng)計(jì)是根據(jù)樣本信息對總體進(jìn)行估計(jì)、假設(shè)檢驗(yàn)、預(yù)測或其他推斷的統(tǒng)計(jì) 方法。 10 .推斷統(tǒng)計(jì)學(xué)的內(nèi)容:(
3、1)參數(shù)估計(jì);(2)假設(shè)檢驗(yàn)。 11 .推斷統(tǒng)計(jì)學(xué)的目的:對總體的基本特征做出推斷。 12 .推斷統(tǒng)計(jì)學(xué)的研究對象:不確定性現(xiàn)象。 13 .理論統(tǒng)計(jì)是研究統(tǒng)計(jì)學(xué)的一般理論,是研究統(tǒng)計(jì)方法的數(shù)學(xué)原理。應(yīng)用統(tǒng)計(jì) 是研究統(tǒng)計(jì)學(xué)在各領(lǐng)域的具體應(yīng)用。 第四節(jié)數(shù)據(jù)的種類與來源 14 .數(shù)據(jù)的種類按性質(zhì)可以分為(1)定位數(shù)據(jù),如坐標(biāo)數(shù)據(jù);(2)定性數(shù)據(jù), 如表示事物屬性的數(shù)據(jù)(城鎮(zhèn)、河流、道路等);(3)定量數(shù)據(jù),如面積,體 積,重量,速度等;(4)定時數(shù)據(jù),如年,月、日等。 15 .數(shù)據(jù)的種類按表現(xiàn)形式可分為(1)結(jié)構(gòu)型數(shù)據(jù),如各種數(shù)字、測量數(shù)據(jù)及其 解釋;(2)非結(jié)構(gòu)型數(shù)據(jù),如網(wǎng)絡(luò)日志、音頻
4、、視頻、圖片和地理信息等。 16 .第一手?jǐn)?shù)據(jù)(直接數(shù)據(jù)):統(tǒng)計(jì)數(shù)據(jù)來源于直接組織的調(diào)查、觀察或科學(xué)試 驗(yàn),第二手?jǐn)?shù)據(jù)(間接數(shù)據(jù)):統(tǒng)計(jì)數(shù)據(jù)來源于已有的數(shù)據(jù)。 17 .統(tǒng)計(jì)調(diào)查是按照預(yù)定的統(tǒng)計(jì)任務(wù),運(yùn)用科學(xué)的統(tǒng)計(jì)調(diào)查方法,有計(jì)劃有組織 地向客觀實(shí)際搜集資料的全過程。 18 .統(tǒng)計(jì)調(diào)查包括(1)普查,普查是為了某一特定目的,專門組織的的一次性全 面調(diào)查。通常是一次性或周期性的,非經(jīng)常一般需要規(guī)定統(tǒng)一的標(biāo)準(zhǔn)調(diào)查時間數(shù) 據(jù)的規(guī)范化程度較高應(yīng)用范圍比較狹窄。 (2)抽樣調(diào)查,抽樣調(diào)查是從總體中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查, 并根據(jù)樣本調(diào)查結(jié)果來推斷總體特征的數(shù)據(jù)收集方法。特點(diǎn):經(jīng)濟(jì)性、時
5、效性、 適應(yīng)面廣、準(zhǔn)確性高。(最重要的調(diào)查方法) (3)統(tǒng)計(jì)報(bào)表,統(tǒng)計(jì)報(bào)表是按國家統(tǒng)一規(guī)定的表式,統(tǒng)一的指標(biāo)項(xiàng)目,統(tǒng)一的 報(bào)送時間,自下而上逐級定期提供基本統(tǒng)計(jì)資料的調(diào)查方法。 (4)重點(diǎn)調(diào)查,重點(diǎn)調(diào)查是在所要調(diào)查的總體中選擇一部分重點(diǎn)單位進(jìn)行調(diào)查。 重點(diǎn)單位是著眼于現(xiàn)象量的方面, 盡管這些單位在全部單位中只占一部分, 但是 它們的某一主要標(biāo)志的標(biāo)志總量在總體標(biāo)志總量中有絕大比重。 (不帶主觀因素) (5)典型調(diào)查,典型調(diào)查是指有意識地選取若干具有代表性的單位進(jìn)行調(diào)查和 研究,借以認(rèn)識事物發(fā)展變化的規(guī)律。 典型調(diào)查包括①解剖麻雀:總體內(nèi)部個體 間差異很??;②劃類選典:總體內(nèi)部個體間差異
6、較大。 (雖然抽樣調(diào)查、重點(diǎn)調(diào) 查、典型調(diào)查都屬于非全面調(diào)查,但是只有抽樣調(diào)查可以用來推斷總體的數(shù)量特 征。重點(diǎn)調(diào)查和典型調(diào)查所得資料只能形成對總體的定性認(rèn)識, 不能上升為總體 的定量結(jié)果。) (6)科學(xué)試驗(yàn),在自然科學(xué)和工程的研究領(lǐng)域,通常是通過科學(xué)試驗(yàn)的方法獲 得研究的統(tǒng)計(jì)數(shù)據(jù)。 (7)網(wǎng)絡(luò)獲取等。 19 .間接數(shù)據(jù)的獲取渠道:(1)統(tǒng)計(jì)部門和政府部門公布的有關(guān)資料,如各類統(tǒng) 計(jì)年鑒; (2)各類專業(yè)期刊、報(bào)紙、書籍所提供的資料; (3)各種會議(博覽會、展銷會、交易會等)及專業(yè)性、學(xué)術(shù)性研討會上交流 的有關(guān)資料; (4)從互聯(lián)網(wǎng)或圖書館查閱到的相關(guān)資料。 20 .文件檢
7、索:(1)系統(tǒng)檢索,選取合適的數(shù)據(jù)庫和檢索的關(guān)鍵詞; (2)追溯檢索,Science Citation Index; (3)瀏覽檢索,根據(jù)平時的積累。 第五節(jié)統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量 21 .統(tǒng)計(jì)調(diào)查階段是統(tǒng)計(jì)研究的第一步,在這一階段中,統(tǒng)計(jì)數(shù)據(jù)的誤差從不同 的角度分類,可以分為非抽樣誤差與抽樣誤差。 22 .抽樣誤差是指利用樣本推斷總體時產(chǎn)生的誤差。影響抽樣誤差大小的因素: (1)樣本容量的大??;(2)總體的變異性。抽樣誤差可以計(jì)算和控制。 23 .非抽樣誤差是指由于調(diào)查過程中有關(guān)環(huán)節(jié)的失誤造成的。從理論上來說,非 抽樣誤差是可以避免的。控制方法:(1)對調(diào)查員進(jìn)行挑選;(2)對調(diào)查員進(jìn)
8、 行培訓(xùn); (3)對調(diào)查過程進(jìn)行控制;(4)對調(diào)查結(jié)果進(jìn)行檢驗(yàn)、評估。 第六節(jié)統(tǒng)計(jì)學(xué)的基本概念 24 .總體:是指所研究的所有個體(基本單位)的集合??傮w中的每個個體稱為 總體單位??傮w單位的特點(diǎn):大量性,同質(zhì)性和異質(zhì)性。 25 .樣本:是指從總體中抽取的一部分元素的集合。構(gòu)成樣本的元素的數(shù)目稱為 樣本容量。 26 .標(biāo)志(變量): 說明總體單位屬性和特征的名稱。標(biāo)志包括(1)品質(zhì)標(biāo)志: 說明總體單位質(zhì)的特征;(2)數(shù)量標(biāo)志:說明總體單位量的特征。 27 .指標(biāo):綜合反應(yīng)總體數(shù)量特征的概念和數(shù)值,具有可量性和綜合性。指標(biāo)包 括(1)理論指標(biāo):指標(biāo)名稱、核算方法、計(jì)量單位;( 2)
9、實(shí)踐指標(biāo):時間、 空間、數(shù)值。常用指標(biāo):總量指標(biāo)、平均指標(biāo)和相對指標(biāo)。 例如:2014年我國國內(nèi)生產(chǎn)總值568845億元(總量指標(biāo)),按可比價格計(jì)算, 比上年增長7.7% (相對指標(biāo))。全年全國糧食總產(chǎn)量達(dá)到 60194萬噸(總量指 標(biāo)),比上年增加1236萬噸(總量指標(biāo)),增長 2.1% (相對指標(biāo))。全年城 鎮(zhèn)居民人均總收入29547元(總量指標(biāo))。其中,城鎮(zhèn)居民人均可支配收入26955 元(總量指標(biāo)),比上年名義增長 9.7% (相對指標(biāo)),扣除價格因素實(shí)際增長 7.0% (相對指標(biāo))。全年農(nóng)村居民人均純收入 8896元(總量指標(biāo)),比上年名 義增長12.4% (相對指標(biāo)),扣除價
10、格因素實(shí)際增長 9.3% (相對指標(biāo))。2013 年全國居民收入基尼系數(shù)為0.473 (相對指標(biāo))。 第二章統(tǒng)計(jì)數(shù)據(jù)的描述 第0節(jié)數(shù)據(jù)的預(yù)處理 1 .數(shù)據(jù)的審核包括邏輯審核和計(jì)算檢查,目的:保證數(shù)據(jù)的完整性和準(zhǔn)確性 第一節(jié)統(tǒng)計(jì)數(shù)據(jù)的整理 2 .統(tǒng)計(jì)調(diào)查階段是統(tǒng)計(jì)研究的第一步,它是根據(jù)統(tǒng)計(jì)研究的需要,將數(shù)據(jù)按照某 個屬性分成不同的組別。在分組時,如果按照性別、質(zhì)量等定性指標(biāo)分組,稱為 品質(zhì)標(biāo)志分組;如果按照數(shù)量或數(shù)值等定量指標(biāo)分組,稱為數(shù)量標(biāo)志分組。 性那 百分比%門 30^ 女「 如 』口口 5g 100戶 組)
11、 年齡(歲)一 百分比(%) Q 17? frp 1力 ]即 1和 28- 1腫 36^ 眸 2P 5加 100+3 組) 單變量值分組適用于品質(zhì)標(biāo)志分組及數(shù)量標(biāo)志分組中變量值較少時。 3 .次數(shù)分配(組距分組)是指將數(shù)據(jù)按其分組標(biāo)志進(jìn)行分組。 4 .次數(shù)分配的特點(diǎn):(1)將變量值的一個區(qū)間作為一組; (2)適合于連續(xù)變量; (3)適合于變量值較多的情況; (4)需要遵循“不重不漏”的原則(上組限不在該組內(nèi)); (5)可采用等距分組,也可采用不等距分組。 5 .組距分組的思路:(1)先確定組數(shù),再確定組距;(2)先確
12、定組距,再確定 組數(shù)。不管怎么分組,都是組數(shù)越多,組距越少。 例:66 69 74 76 78 80 82 84 88 89 輟 At 百分此(%卜 加 3肝 削?905 削「 舐N 10, 叫 J 做i 627卻 和 加 汕 + 器?95。 部1 1岫 4 6 .與組距分組有關(guān)的幾個概念:(1)下限(low limit): 一個組的最小值; (2)上限(upper limit): 一個組的最大值; (3)組距(class width):上限與下限之差; (4)組中值:下限與上限
13、之間的中點(diǎn)值(組中值 =(上限+下限)/2). 7.累計(jì)頻數(shù)(shu o ) (1)向上累積頻數(shù)(以下累計(jì)):變量值由小到大排列, 表示某個變量值的位置,或者小于等于某個變量值的個數(shù); (2)向下累計(jì)頻數(shù)(以上累計(jì)):變量值由大到小排列,表示某個變量值的位 置,或者大于等于某個變量值的個數(shù)。 8次數(shù)分配直方圖:用矩形的寬度和高度來表示頻數(shù)分布的圖形。 在直角坐標(biāo)中, 用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩 形,即直方圖。 9 .折線圖(頻數(shù)多邊形圖)是指在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值) 用直線連接起來,再把原來的直方圖抹掉。具體做法:(1
14、)第一個矩形的頂部 中點(diǎn)通過豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中 點(diǎn)與其豎邊中點(diǎn)連接到橫軸;(2)折線圖下所圍成的面積與直方圖的面積相等, 二者所表示的頻數(shù)分布是一致的。 10 .次數(shù)分布曲線:當(dāng)觀察次數(shù)逐漸增多,組距越小組數(shù)越多時,所畫出來的折 線就會越光滑,逐漸形成一條光滑的曲線,即次數(shù)分配曲線。常見的有四種曲 線,即正態(tài)分布曲線,偏態(tài)曲線,J形曲線和U形曲線。 正態(tài)分布曲線 右偏分布曲線 左偏分布曲線 正J型分布曲線 反J型分布曲線 U形曲線 (1)正態(tài)分布曲線也稱為鐘形曲線,,是客觀事物數(shù)量特征表現(xiàn)最多的一種次 數(shù)分布曲線,如人的身高
15、、體重、智商,電子管中的熱噪聲、電流、電壓,纖維 長度。細(xì)沙強(qiáng)度,鋼的含碳量,農(nóng)作物產(chǎn)量,橡膠的抗張力。一個地區(qū)多年的降 雨量等。所有的試驗(yàn)、測量和觀測誤差都服從正態(tài)分布; (2)偏態(tài)分布曲線根據(jù)尾巴拖向哪一方分為正偏(右偏)和負(fù)偏(左偏)兩種 分布曲線。例如人均收入分配的曲線就是右偏分布曲線; (3) J形曲線包括正J形曲線和反J形曲線。例如供給曲線(正J形曲線)和需 求曲線(反J形曲線); (4) U形曲線又稱為死亡率曲線、產(chǎn)品故障率曲線或浴盆曲線,人和動物的死 亡率近似服從U形曲線分布。產(chǎn)品的故障和報(bào)損情況也有類似的分布規(guī)律。 11.20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼(G. Gini)
16、根據(jù)洛倫茨曲線給出了衡量收入分配 平均程度的指標(biāo) A表示實(shí)際收入曲線與絕對平均線之間的面積 B表示實(shí)際收入曲線與絕對不平均線之間的面積 如果A=0,則基尼系數(shù)=0,表示收入絕對平均 如果B=0,則基尼系數(shù)=1,表示收入絕對不平均 基尼系數(shù)在0和1之間取值 一般認(rèn)為,基尼系數(shù)若小于0.2,表明分配平均;基尼系數(shù)在 0.2至0.4之間 是比較適當(dāng)?shù)?,即一個社會既有效率又沒有造成極大的分配不公;基尼系數(shù)在 0.4被認(rèn)為是收入分配不公平的警戒線, 超過了 0.4應(yīng)該采取措施縮小這一差距。 累積的收入或財(cái)富百分 絕對平均線 洛倫茲曲線 第二節(jié) 分布集中趨勢的測度 12
17、 .眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)。特點(diǎn): (1)適合于數(shù)據(jù)較多時使 用;(2)不受極端值的影響;(3) 一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù); (4) 主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)。應(yīng)用:市場中價格的確 定。 13 .中位數(shù)是排序后位于中間位置的的是數(shù)據(jù)。若總數(shù)據(jù)個數(shù)為奇數(shù),則中位數(shù) =中間數(shù)1 ;若總數(shù)據(jù)個數(shù)為偶數(shù),則中位數(shù)=中間數(shù)1中間數(shù)2。特點(diǎn):(1) 2 2 不受極端值影響;(2)主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分 類數(shù)據(jù) 14 .中位數(shù)是將統(tǒng)計(jì)分布從中間分為面積(即數(shù)據(jù)個數(shù))相等的兩部分,與中位 數(shù)性質(zhì)相似的還有四分位數(shù)、十分位數(shù)
18、和百分位數(shù)。四分位數(shù)是指將數(shù)據(jù)分布4 等分的三個數(shù)值,其中中間的四分位數(shù)就是中位數(shù)。十分位數(shù)和百分位數(shù)分別 是將是數(shù)據(jù)十等分和一百等分的數(shù)值。 15 .均值是數(shù)據(jù)集中趨勢的主要測度值。包括(1)算數(shù)平均值:設(shè)一組數(shù)據(jù)為: X1,X2,,與,則算數(shù)平均值=x=x1 X2 x (總體算數(shù)平均值和樣本平均 值求法一樣);(2)設(shè)一組數(shù)據(jù)為:X1,X2, ,Xn,相應(yīng)的頻數(shù)為:f1,f2, ,fn, fl fl 則加權(quán)平均值=x n Xi f i i 1 n i1fi fi n XiWi i 1 (變量值,權(quán)重)性質(zhì):(1)各變量值與均 xf xfn,加權(quán)
19、平均值的變形公式:加權(quán)平均值 f2 fn 值的離差之和等于零 (x X) 0; ( 2)各變量值與均值的離差平方和最小, ^-n- (3)幾何平均值:g & a2 , n ai 。適用特點(diǎn):(1)變量值以相 i 1 對數(shù)的形式出現(xiàn);(2)變量值相乘有意義。應(yīng)用:(1)計(jì)算平均發(fā)展速度; (2)平均收益率;(3)流水線的產(chǎn)品合格率。 例題:某產(chǎn)品要經(jīng)過生產(chǎn)流水線連續(xù)作業(yè)的四道工序才能完成。某月份各工序 產(chǎn)品的合格率分別為98%、95%、95%、97%,計(jì)算整個流水線產(chǎn)品合格率? 498%95%95%97% 96.24% 某銀行為鼓勵用戶長期存款,以復(fù)利方式計(jì)息,某10
20、年期存款的年利率第1—4 年為3%、第5—7年年為4.5%、第8—10年為5.5% o則10年的平均年利率? 101.(431.043.0551.0419均年利率為 4.19% 16.眾數(shù)、中位數(shù)、均值的比較:(1)數(shù)量關(guān)系 眾數(shù) 中位數(shù) 均值 均值 左偏分布 對稱分布 右偏分布 (2)眾數(shù)、中位數(shù)、均值的特點(diǎn)和應(yīng)用:①眾數(shù)(不受極值的影響,易于理解、 尤其適用于類型變量,不唯一);②中位數(shù)(不受極值的影響,數(shù)據(jù)分布偏斜程 度較大時使用);③均值(數(shù)學(xué)性質(zhì)穩(wěn)定、容易受到極值影響、數(shù)據(jù)對稱分布或 接近對稱分布時使用) 第三節(jié)分布離散程度的測度 17 .極差(全距)是指一
21、組數(shù)據(jù)中最大值與最小值之差,是數(shù)據(jù)分布離散程度的 最簡單測度值。特點(diǎn):容易受極值影響。 18 .內(nèi)距是上四分位數(shù)與下四分位數(shù)之差, 即IQR= Q3- Q1,它反映了中間50% 數(shù)據(jù)的離散程度。特點(diǎn):不受極端值的影響。 19 .方差是各個數(shù)據(jù)與平均數(shù)之差的平方之和的平均數(shù)??傮w未分組方差: i1(Xi x) n 總體分組方差: n — 2 i1(X X) fi n fi i 1 樣本未分組方差: 樣本分組方差 n — 2 1(x X) f fi 1 i 1 20.標(biāo)準(zhǔn)差又稱為均方差,是方差的算數(shù)平方根??傮w未分組標(biāo)準(zhǔn)差: n 2 I (Xi X)
22、 s 總體分組標(biāo)準(zhǔn)差:s n n — 2 I」(Xi X) s廿3 。樣本分組標(biāo)準(zhǔn)差: n 1 —2 (X X) fi - 。樣本未分組標(biāo)準(zhǔn)差: i1fi —2 (X X) fi n fi 1 i 1 21 .自由度是指一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)。當(dāng)樣本數(shù)據(jù)的個數(shù)為 n 時,若樣本均值確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)不能自 由取值。因此,自由度為 n-1。 22 .標(biāo)準(zhǔn)差的作用:(1)判斷變量的離散程度;(1)判斷某一變量取值是否一 致;(3)判斷某一變量落在某一區(qū)間的概率,切比雪夫定律: (4)判斷某一變量值在數(shù)
23、據(jù)幾何中的位置 標(biāo)準(zhǔn)化值Z 23. 離散系數(shù):標(biāo)準(zhǔn)差和對應(yīng)的均值之比 =(總體離散系數(shù))或V 5(樣本離散系數(shù))作用:消除了 X X 數(shù)據(jù)水平高低和計(jì)量單 位的影響。 應(yīng)用:用于對不同變量離散程度的比較 第四節(jié) 分布偏態(tài)與峰度的測度 24.數(shù)據(jù)分布的兩個重要特征是集中趨勢和離散程度。 但要測度 25偏態(tài)是對分布偏斜方向及程度的測度。判斷偏態(tài)的方向并不困難, 偏斜的程度則需要計(jì)算偏態(tài)系數(shù)(SK) , SK —3 (X X) 3 ns ,通常SK取值在-3? +3之間,絕對值越大,表明偏斜程度越大。情況: 大于 0為正偏(右偏),小 于0為負(fù)偏(左偏),
24、等于 0為對稱分布 26.峰度,記作K,是對數(shù)據(jù)分布平峰或尖峰程度的測度。峰度系數(shù) K=U Xi 一4 X)fi 27. fi?s4 「一 性別 第五節(jié) 統(tǒng)計(jì)圖與統(tǒng)計(jì)表 表2.11某廠職工人數(shù)統(tǒng)計(jì)表 2007年12月31日 比率(%) 合計(jì) 253 115 68.75 31.25 368 100.00 列標(biāo)題 I數(shù)字| |資料| ■附加 資料來源: 28.1. 計(jì)表設(shè)計(jì)和使用應(yīng)注意的問題:(1)合理安排表的結(jié)構(gòu); (2)表頭一般應(yīng)包括表號、總標(biāo)題和表中數(shù)據(jù)的單位等內(nèi)容,總標(biāo)題應(yīng)該簡明 確切地概括出統(tǒng)計(jì)表的內(nèi)容,一般需要表明統(tǒng)
25、計(jì)數(shù)據(jù)的時間(when)、地點(diǎn)(where) 以及何種數(shù)據(jù)(what),即標(biāo)題內(nèi)容應(yīng)該滿足3W要求; (3)表中的上下兩條橫線一般用粗線,中間其他的其他線要用細(xì)線,并且統(tǒng)計(jì) 表的左右兩邊不封口, (4)列標(biāo)題之間一般用豎線分開,而行標(biāo)題之間通常不必用橫線隔開,總之表 中盡量少用橫豎線,切忌不要用斜線; (5)統(tǒng)計(jì)表中的數(shù)據(jù)一般是右對齊,有小數(shù)點(diǎn)時應(yīng)以小數(shù)點(diǎn)對齊,而且小數(shù)點(diǎn) 的位數(shù)應(yīng)統(tǒng)一; (6)在使用統(tǒng)計(jì)表時,必要時要在表的下方加上注釋,特別要注明資料來源, 以表示對他人勞動成果的尊重 48 .莖葉圖:以一組數(shù)據(jù)的高位數(shù)做樹莖,樹葉保留數(shù)值的末位數(shù)字。 49 .莖葉圖的特點(diǎn):
26、(1)用來顯示未分組的原始數(shù)據(jù)的分布; (2)由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的; (3)以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉; (4)樹葉上只保留一位數(shù)字。 29.莖葉圖類似于橫置的直方圖,但又有。直方圖可觀察一組數(shù)據(jù)的分布狀況, 但沒有給出具體的數(shù)值;莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始 數(shù)值,保留了原始數(shù)據(jù)的信息 數(shù)和兩個四分位數(shù); (2)連接兩個四分位數(shù)回出箱子; (3)將兩個極值點(diǎn)與箱子連接。 31 .應(yīng)用統(tǒng)計(jì)圖錯誤的的情況:(1 范;(3)象形圖繪制的問題。 32 .分布的形狀與箱線圖 Q 中位數(shù) Q \/h/u / \ )指標(biāo)選的不合適;(2)繪圖時不夠科學(xué)規(guī) Q 中位數(shù) Q Q 1| |\ — 30.箱線圖用來反映原始數(shù)據(jù)分布的圖形。它由一個箱子和兩條線段組成。繪制 方法:(1)找出一組數(shù)據(jù)的五個特征值:數(shù)據(jù)的最大值、數(shù)據(jù)的最小值、中位 左偏分布 對稱分布 Q 中位數(shù) Q 右偏分布
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 初中語文作文素材:30篇文學(xué)名著開場白
- 初中語文答題技巧:現(xiàn)代文閱讀-說明文閱讀知識點(diǎn)總結(jié)
- 初中語文作文十大常考話題+素材
- 初中語文作文素材:描寫冬天的好詞、好句、好段總結(jié)
- 初中語文必考名著總結(jié)
- 初中語文作文常見主題總結(jié)
- 初中語文考試??济偨Y(jié)
- 初中語文必考50篇古詩文默寫
- 初中語文易錯易混詞總結(jié)
- 初中語文228條文學(xué)常識
- 初中語文作文素材:30組可以用古詩詞當(dāng)作文標(biāo)題
- 初中語文古代文化常識七大類別總結(jié)
- 初中語文作文素材:100個文藝韻味小短句
- 初中語文閱讀理解33套答題公式
- 初中語文228條文學(xué)常識總結(jié)