描述統(tǒng)計與探索性數(shù)據(jù)分析
定 價:75 元
- 作者:張理
- 出版時間:2025/4/1
- ISBN:9787030778468
- 出 版 社:科學(xué)出版社
- 中圖法分類:C8,O212.1
- 頁碼:284
- 紙張:
- 版次:1
- 開本:B5
本書是數(shù)據(jù)科學(xué)方法及應(yīng)用系列教材之一。本書融合統(tǒng)計學(xué)和數(shù)據(jù)科學(xué)的方法,系統(tǒng)介紹描述統(tǒng)計和探索性數(shù)據(jù)分析的原理和方法。主要內(nèi)容包括:指標(biāo)設(shè)計、數(shù)據(jù)預(yù)處理、描述統(tǒng)計量計算、數(shù)據(jù)可視化、相關(guān)分析、關(guān)聯(lián)分析、聚類分析、綜合指數(shù)分析等。重點(diǎn)介紹數(shù)據(jù)分析的統(tǒng)計流程和軟件實現(xiàn)方法,培養(yǎng)學(xué)生理解數(shù)據(jù)、分析數(shù)據(jù)的基本能力。
本書將基本理論與應(yīng)用相結(jié)合,實用性、操作性較強(qiáng),可廣泛應(yīng)用在需要開展數(shù)據(jù)分析的各個領(lǐng)域。本書采用四模塊結(jié)構(gòu):理論與方法+案例分析+R軟件應(yīng)用(含代碼)+思考與練習(xí),并提供第3~8章的在線自測習(xí)題,習(xí)題內(nèi)容覆蓋主要學(xué)習(xí)要點(diǎn),題型包括選擇題、填空題、計算題、軟件應(yīng)用題等,幫助學(xué)習(xí)者檢驗學(xué)習(xí)效果。通過掃描二維碼獲取相關(guān)在線資源和習(xí)題。
更多科學(xué)出版社服務(wù),請掃碼獲取。
1990年,獲云南大學(xué)經(jīng)濟(jì)學(xué)學(xué)士學(xué)位
1997年,獲云南大學(xué)統(tǒng)計學(xué)碩士學(xué)位
2004年-2005年,復(fù)旦大學(xué)訪問學(xué)者
2019年,英國普利茅斯大學(xué)University of Plymouth訪問學(xué)者
主要講授下列課程:經(jīng)濟(jì)學(xué)基礎(chǔ)(一、二),經(jīng)濟(jì)學(xué)原理,統(tǒng)計學(xué)原理,描述統(tǒng)計。(均為統(tǒng)計學(xué)本科專業(yè)課程)
目錄
叢書序
前言
第1章 總論 1
1.1 數(shù)據(jù)的定義 1
1.2 數(shù)據(jù)的特點(diǎn) 2
1.3 數(shù)據(jù)的類型 2
1.4 本書框架介紹 4
1.5 R軟件應(yīng)用 7
初步認(rèn)識R軟件 7
思考與練習(xí) 17
第2章 統(tǒng)計指標(biāo)概述 18
2.1 統(tǒng)計指標(biāo)的含義 18
2.1.1 指標(biāo)與統(tǒng)計指標(biāo) 18
2.1.2 統(tǒng)計指標(biāo)的特點(diǎn) 19
2.1.3 統(tǒng)計指標(biāo)的構(gòu)成要素 20
2.2 統(tǒng)計指標(biāo)類型 22
2.2.1 根據(jù)指標(biāo)形式和作用分類 22
2.2.2 根據(jù)指標(biāo)值獲取方式分類 22
2.2.3 根據(jù)指標(biāo)反映的數(shù)量關(guān)系分類 22
2.2.4 根據(jù)指標(biāo)數(shù)值類型分類 25
2.3 統(tǒng)計指標(biāo)設(shè)計 26
2.3.1 統(tǒng)計指標(biāo)設(shè)計原則 26
2.3.2 統(tǒng)計指標(biāo)設(shè)計步驟 27
2.4 案例分析 29
可持續(xù)發(fā)展投入產(chǎn)出效率測度指標(biāo)設(shè)計 29
2.5 R 軟件應(yīng)用 31
創(chuàng)建數(shù)據(jù)對象及讀入外部數(shù)據(jù) 31
思考與練習(xí) 43
第3章 數(shù)據(jù)采集 45
3.1 數(shù)據(jù)采集渠道 45
3.1.1 調(diào)查 45
3.1.2 觀測 46
3.1.3 實驗 46
3.1.4 網(wǎng)絡(luò)數(shù)據(jù)采集 46
3.1.5 手機(jī) APP 數(shù)據(jù) 47
3.2 數(shù)據(jù)采集方法及技術(shù) 47
3.2.1 抽樣調(diào)查方法 47
3.2.2 網(wǎng)絡(luò)數(shù)據(jù)采集方法 51
3.2.3 APP數(shù)據(jù)采集方法 53
3.3 案例分析 54
抽樣方法的具體應(yīng)用 54
3.4 R軟件應(yīng)用 59
抽樣方法和八爪魚軟件應(yīng)用 59
思考與練習(xí) 67
第4章 數(shù)據(jù)預(yù)處理 69
4.1 數(shù)據(jù)審核 69
4.1.1 直接來源數(shù)據(jù)審核 69
4.1.2 間接來源數(shù)據(jù)審核 70
4.2 數(shù)據(jù)清洗 71
4.2.1 數(shù)據(jù)篩選 71
4.2.2 缺失數(shù)據(jù)處理 72
4.2.3 異常數(shù)據(jù)處理 74
4.2.4 數(shù)據(jù)脫敏 77
4.3 數(shù)據(jù)變換 77
4.3.1 數(shù)據(jù)編碼 77
4.3.2 數(shù)據(jù)標(biāo)準(zhǔn)化 78
4.4 數(shù)據(jù)集成 81
4.5 數(shù)據(jù)歸約 81
4.6 案例分析 82
缺失數(shù)據(jù)插補(bǔ) 82
4.7 R 軟件應(yīng)用 86
數(shù)據(jù)采集與預(yù)處理 86
思考與練習(xí) 92
第5章 數(shù)據(jù)基本特征測度 93
5.1 數(shù)據(jù)基本特征概述 93
5.2 頻數(shù)統(tǒng)計 94
5.2.1 頻數(shù)統(tǒng)計概述 94
5.2.2 頻數(shù)統(tǒng)計表及編制 94
5.2.3 頻數(shù)統(tǒng)計表的類型 97
5.3 集中趨勢測度.99
5.3.1 幾種常見平均數(shù) 100
5.3.2 中位數(shù) 102
5.3.3 眾數(shù) 102
5.4 離散程度測度 104
5.5 數(shù)據(jù)分布形態(tài)測度 107
5.5.1 矩 107
5.5.2 偏度與偏度系數(shù) 108
5.5.3 峰度 109
5.6 動態(tài)趨勢測度 109
5.6.1 發(fā)展速度 110
5.6.2 增長速度 110
5.7 案例分析 111
R自帶數(shù)據(jù)集iris(鳶尾花)的描述統(tǒng)計指標(biāo)計算 111
5.8 R軟件應(yīng)用 114
計算描述統(tǒng)計量 114
思考與練習(xí) 123
第6章 數(shù)據(jù)可視化 124
6.1 統(tǒng)計圖形的基本要素 124
6.2 數(shù)據(jù)規(guī)模和結(jié)構(gòu)可視化圖 125
6.2.1 條形圖 125
6.2.2 餅圖 127
6.2.3 玫瑰圖 128
6.2.4 矩形樹圖 131
6.2.5 馬賽克圖 132
6.3 數(shù)據(jù)分布可視化圖 133
6.3.1 直方圖 133
6.3.2 箱線圖 135
6.3.3 概率密度圖 136
6.4 數(shù)據(jù)變化趨勢圖 138
6.4.1 點(diǎn)圖 138
6.4.2 線圖 139
6.5 多維數(shù)據(jù)可視化 141
6.5.1 雷達(dá)圖 141
6.5.2 星圖 143
6.5.3 臉譜圖 144
6.6 文本數(shù)據(jù)可視化 146
6.6.1 詞云圖 146
6.6.2 社會網(wǎng)絡(luò)圖 147
6.7 案例分析 148
R數(shù)據(jù)集HairEyeColor(頭發(fā)眼睛顏色)可視化 148
R數(shù)據(jù)集iris (鳶尾花)植物特征可視化 150
R數(shù)據(jù)集ToothGrowth(豚鼠牙齒生長)特征可視化 153
6.8 R軟件應(yīng)用.155
數(shù)據(jù)可視化 155
思考與練習(xí) 171
第7章 相關(guān)與關(guān)聯(lián)分析 172
7.1 相關(guān)關(guān)系 172
7.1.1 一般相關(guān)關(guān)系 172
7.1.2 典型相關(guān)分析 176
7.2 相關(guān)關(guān)系可視化 179
7.2.1 二維散點(diǎn)圖 179
7.2.2 三維散點(diǎn)圖 180
7.2.3 氣泡圖 182
7.2.4 散點(diǎn)圖矩陣 183
7.2.5 相關(guān)系數(shù)矩陣 185
7.3 關(guān)聯(lián)分析 186
7.3.1 關(guān)聯(lián)規(guī)則的基本概念 186
7.3.2 關(guān)聯(lián)規(guī)則的Apriori算法 190
7.4 案例分析 191
鳶尾花的外形特征相關(guān)關(guān)系 191
科技創(chuàng)新活動投入和產(chǎn)出的典型相關(guān)分析 194
Apriori 算法示例 200
7.5 R 軟件應(yīng)用 203
相關(guān)與關(guān)聯(lián)分析 203
思考與練習(xí) 209
第8章 聚類分析 211
8.1 聚類分析概述 211
8.2 距離的計算方法 212
8.2.1 歐氏距離 212
8.2.2 曼哈頓距離 213
8.2.3 明氏距離 213
8.2.4 蘭氏距離 214
8.2.5 馬氏距離 214
8.2.6 相關(guān)距離 215
8.2.7 余弦相似度 215
8.2.8 漢明距離 215
8.3 聚類算法 216
8.3.1 系統(tǒng)聚類方法 216
8.3.2 K-means聚類法 222
8.3.3 K-modes聚類法 224
8.4 最佳K值的兩種確定方法 226
8.4.1 肘部法 226
8.4.2 輪廓系數(shù)法 229
8.5 案例分析 230
紅酒質(zhì)量數(shù)據(jù)的聚類分析 230
8.6 R軟件應(yīng)用.234
聚類函數(shù)的應(yīng)用 234
思考與練習(xí) 237
第9章 綜合指數(shù)分析 238
9.1 綜合指數(shù)分析概述 238
9.2 以專家賦權(quán)為主的綜合指數(shù)分析 239
9.2.1 專家評分法 239
9.2.2 德爾菲法 241
9.2.3 層次分析法 241
9.3 以數(shù)據(jù)特征賦權(quán)為主的綜合指數(shù)分析 245
9.3.1 熵權(quán)法 245
9.3.2 變異系數(shù)法 247
9.3.3 主成分分析法 247
9.3.4 TOPSIS方法 250
9.3.5 灰色關(guān)聯(lián)分析法 252
9.4 案例分析 255
高技術(shù)產(chǎn)業(yè)創(chuàng)新能力綜合評價 255
9.5 R軟件應(yīng)用 273
綜合指數(shù)計算 273
思考與練習(xí) 277
參考文獻(xiàn) 279
附錄 280