R語言數據挖掘(第3版)(基于R應用的統(tǒng)計學叢書)
定 價:59 元
叢書名:基于R應用的統(tǒng)計學叢書
當前圖書已被 26 所學校薦購過!
查看明細
- 作者:薛薇
- 出版時間:2023/1/1
- ISBN:9787300310381
- 出 版 社:中國人民大學出版社
- 中圖法分類:TP312
- 頁碼:388
- 紙張:
- 版次:3
- 開本:16
全書分為12章,第1章數據挖掘與R語言概述,第2章R的數據組織和整理,第3章R的數據可視化,第4章R的近鄰分析:數據預測,第5章R的決策樹:數據預測,第6章R的人工神經網絡:數據預測,第7章R的支持向量機:數據預測,第8章R的一般聚類:揭示數據內在結構,第9章R的特色聚類:揭示數據內在結構,第10章R的關聯(lián)分析:揭示數據關聯(lián)性,第11章R的模式甄別:診斷異常數據,第12章R的網絡分析初步。
第1章 數據挖掘與R語言概述
1.1 什么是數據挖掘
1.2 數據挖掘的結果
1.2.1 數據挖掘結果的呈現方式
1.2.2 數據挖掘結果的基本特征
1.3 數據挖掘能做什么
1.3.1 數據預測
1.3.2 發(fā)現數據的內在結構
1.3.3 發(fā)現關聯(lián)性
1.3.4 模式診斷
1.4 數據挖掘方法的特點
1.4.1 對目標契合度不高的數據,怎樣的建模策略能夠更好地迎合分析的需要 1.4.2 對于海量、高維數據,怎樣的建模策略能夠更好地揭示數據特征,提高分析效率
1.4.3 對于復雜類型和關系數據,怎樣的建模策略能夠清晰地揭示數據的特征 1.5 數據挖掘的典型應用
1.5.1 數據挖掘在客戶細分研究中的應用
1.5.2 數據挖掘在客戶流失分析中的應用
1.5.3 數據挖掘在營銷響應分析中的應用
1.5.4 數據挖掘在交叉銷售中的應用
1.5.5 數據挖掘在欺詐甄別中的應用
1.6 R語言入門必備
1.6.1 R的包
1.6.2 R的下載安裝
1.6.3 R起步
1.6.4 R的運行方式和其他
1.7 RStudio簡介
1.8 本章函數列表
第2章 R的數據組織和整理
2.1 R的數據對象
2.1.1 從存儲角度劃分R對象
2.1.2 從結構角度劃分R對象
2.1.3 創(chuàng)建和訪問R的數據對象
2.2 向量的創(chuàng)建和訪問
2.2.1 創(chuàng)建只包含一個元素的向量
2.2.2 創(chuàng)建包含多個元素的向量
2.2.3 訪問向量中的元素
2.3 矩陣的創(chuàng)建和訪問
2.3.1 創(chuàng)建矩陣
2.3.2 訪問矩陣中的元素
2.4 數據框的創(chuàng)建和訪問
2.4.1 創(chuàng)建數據框
2.4.2 訪問數據框
2.5 數組和列表的創(chuàng)建和訪問
2.5.1 創(chuàng)建和訪問數組
2.5.2 創(chuàng)建和訪問列表
2.6 數據對象的相互轉換
2.6.1 不同存儲類型之間的轉換
2.6.2 不同結構類型之間的轉換
2.7 導入外部數據和保存數據
2.7.1 導入文本數據
2.7.2 導入SPSS數據
2.7.3 利用ODBC導入數據庫數據和Excel表數據
2.7.4 共享R自帶的數據包
2.7.5 數據保存
2.8 R語言程序設計基礎
2.8.1 R程序設計基本概念
2.8.2 R的系統(tǒng)函數
2.8.3 用戶自定義函數
2.8.4 R程序的控制結構
2.9 R語言數據整理和程序設計綜合應用
2.9.1 數據整理基礎綜合應用
2.9.2 利用流程控制還原匯總數據
2.10 本章函數列表
第3章 R的數據可視化
3.1 繪圖基礎
3.1.1 圖形設備和圖形文件
3.1.2 圖形組成和圖形參數
3.2 單變量分布特征的可視化
3.2.1 核密度圖
3.2.2 小提琴圖
3.2.3 克利夫蘭點圖
3.3 多變量聯(lián)合分布特征的可視化
3.3.1 曲面圖和等高線圖
3.3.2 二元核密度曲面圖
3.3.3 雷達圖
3.4 變量間相關性的可視化
3.4.1 馬賽克圖
3.4.2 散點圖
3.4.3 相關系數圖
3.5 本章函數列表
第4章 R的近鄰分析:數據預測
4.1 近鄰分析: K近鄰法
4.1.1 K近鄰法中的距離
4.1.2 K近鄰法中的近鄰個數
4.2 K近鄰法的R函數和應用示例
4.2.1 R的K近鄰法函數
4.2.2 R的K近鄰法示例
4.3 K近鄰法的適用性及特征選擇
4.3.1 K近鄰法的適用性
4.3.2 特征選擇
4.4 本章函數列表
第5章 R的決策樹:數據預測
5.1 決策樹算法概述
5.1.1 什么是決策樹
5.1.2 決策樹的幾何理解
5.1.3 決策樹的核心問題
5.2 分類回歸樹的生長過程
5.2.1 分類樹的生長過程
5.2.2 回歸樹的生長過程
5.2.3 損失矩陣對分類樹的影響
5.3 分類回歸樹的剪枝
5.3.1 最小代價復雜度的測度
5.3.2 分類回歸樹后剪枝過程
5.3.3 分類回歸樹的交叉驗證剪枝
5.4 分類回歸樹的R函數和應用示例
5.4.1 分類回歸樹的R函數
5.4.2 分類回歸樹的應用示例
5.5 建立分類回歸樹的組合預測模型
5.5.1 袋裝技術
5.5.2 袋裝技術的R函數及應用示例
5.5.3 提升技術
5.5.4 提升技術的R函數及應用示例
5.6 隨機森林
5.6.1 隨機森林概述
5.6.2 隨機森林的R函數和應用示例
5.7 本章函數列表
第6章 R的人工神經網絡:數據預測
6.1 人工神經網絡概述
6.1.1 人工神經網絡的概念和種類
6.1.2 人工神經網絡中的節(jié)點和意義
6.1.3 人工神經網絡建立的一般步驟
6.1.4 感知機模型
6.2 B-P反向傳播網絡
6.2.1 B-P反向傳播網絡的特點
6.2.2 B-P反向傳播算法
6.2.3 B-P反向傳播網絡中的學習率
6.3 B-P反向傳播網絡的R函數和應用示例
6.3.1 neuralnet包中的neuralnet函數
6.3.2 neuralnet函數的應用示例
6.3.3 利用ROC曲線確定概率分割值
6.3.4 nnet包中的nnet函數
6.4 本章函數列表
第7章 R的支持向量機:數據預測
7.1 支持向量分類概述
7.1.1 支持向量分類的基本思路
7.1.2 支持向量分類的三種情況
7.2 線性可分問題下的支持向量分類
7.2.1 如何求解超平面
7.2.2 如何利用超平面進行預測
7.3 廣義線性可分問題下的支持向量分類
7.3.1 如何求解超平面
7.3.2 可調參數的意義
7.4 線性不可分問題下的支持向量分類
7.4.1 線性不可分問題的一般解決方式
7.4.2 支持向量分類克服維災難的途徑
7.5 多分類的支持向量分類
7.6 支持向量回歸
7.6.1 支持向量回歸與一般線性回歸
7.6.2 支持向量回歸的基本思路
7.7 R的支持向量機及應用示例
7.7.1 R的支持向量機函數
7.7.2 利用R模擬線性可分下的支持向量分類
7.7.3 利用R模擬線性不可分下的支持向量分類
7.7.4 利用R模擬多分類的支持向量分類
7.8 本章函數列表
第8章 R的一般聚類:揭示數據內在結構
8.1 聚類分析概述
8.1.1 聚類分析的目的
8.1.2 聚類算法概述
8.2 基于質心的聚類模型:K-Means聚類
8.2.1 K-Means聚類中的距離測度
8.2.2 K-Means聚類過程
8.2.3 R的K-Means聚類函數
8.2.4 K-Means聚類的R模擬和應用示例
8.3 基于質心的聚類模型:PAM聚類
8.3.1 PAM聚類過程
8.3.2 R的PAM聚類函數和應用示例
8.4 基于聯(lián)通性的聚類模型:層次聚類
8.4.1 層次聚類的基本過程
8.4.2 層次聚類中距離的聯(lián)通性測度
8.4.3 層次聚類的R函數和應用示例
8.5 基于統(tǒng)計分布的聚類模型:EM聚類
8.5.1 基于統(tǒng)計分布的聚類模型的出發(fā)點:有限混合分布
8.5.2 EM聚類
8.5.3 R的EM聚類函數和應用示例
8.6 本章函數列表
第9章 R的特色聚類:揭示數據內在結構
9.1 BIRCH聚類
9.1.1 BRICH聚類的特點
9.1.2 BIRCH算法中的聚類特征和聚類特征樹
9.1.3 BIRCH的聚類過程
9.1.4 BRICH聚類的R函數和應用示例
9.2 SOM網絡聚類
9.2.1 SOM網絡聚類設計的出發(fā)點
9.2.2 SOM網絡的拓撲結構和聚類原理
9.2.3 SOM網絡聚類的R函數和應用示例
9.2.4 SOM網絡聚類應用:手寫郵政編碼識別
9.2.5 拓展SOM網絡:數據預測
9.3 基于密度的聚類模型:DBSCAN聚類
9.3.1 DBSCAN聚類原理
9.3.2 DBSCAN聚類的R函數和應用示例
9.4 本章函數列表
第10章 R的關聯(lián)分析:揭示數據關聯(lián)性
10.1 簡單關聯(lián)規(guī)則及其測度
10.1.1 什么是簡單關聯(lián)規(guī)則
10.1.2 簡單關聯(lián)規(guī)則的有效性和實用性
10.2 Apriori算法及應用示例
10.2.1 搜索頻繁項集
10.2.2 依據頻繁項集產生簡單關聯(lián)規(guī)則
10.2.3 Apriori算法的R函數和應用示例
10.2.4 簡單關聯(lián)規(guī)則的可視化R函數和應用示例
10.3 簡單關聯(lián)分析的應用示例
10.3.1 發(fā)現連帶銷售商品
10.3.2 顧客選擇性傾向對比
10.4 本章函數列表
第11章 R的模式甄別:診斷異常數據
11.1 模式甄別方法和評價概述
11.1.1 模式甄別方法
11.1.2 模式甄別結果及評價
11.2 模式甄別的無監(jiān)督偵測方法及應用示例
11.2.1 依概率偵測模式及R應用示例
11.2.2 依距離偵測模式:DB方法及 R應用示例
11.2.3 依密度偵測模式:LOF方法及 R應用示例
11.3 模式甄別的有監(jiān)督偵測方法及應用示例
11.3.1 樸素貝葉斯分類法
11.3.2 Logistic回歸及示例
11.3.3 非平衡數據集的SMOTE處理
11.4 模式甄別的半監(jiān)督偵測方法及應用示例
11.4.1 半監(jiān)督分類:自訓練分類模型
11.4.2 自訓練分類模型的R函數及應用示例
11.5 本章函數列表
第12章 R的網絡分析初步
12.1 網絡的定義、表示及構建
12.1.1 網絡的圖論定義及R函數
12.1.2 網絡的矩陣表示方式及 R函數
12.1.3 R的網絡數據文件和建立網絡對象
12.1.4 R的網絡可視化
12.2 網絡節(jié)點重要性的測度
12.2.1 度和測地線距離
12.2.2 節(jié)點“中心”作用的測度:點度中心度和接近中心度
12.2.3 節(jié)點“樞紐”作用的測度:中間中心度
12.2.4 節(jié)點重要性的其他方面:結構洞和關節(jié)點、特征向量中心度和 PageRank得分
12.3 網絡子群構成特征研究
12.3.1 二元關系和三元關系及 R函數
12.3.2 派系和 k核及R函數
12.3.3 社區(qū)和組件及R函數
12.4 網絡整體特征刻畫
12.4.1 網絡整體特征的測度
12.4.2 網絡特征的各種分布和度量
12.5 主要網絡類型及特點
12.5.1 規(guī)則網絡
12.5.2 隨機網絡
12.5.3 小世界網絡
12.5.4 無標度網絡
12.6 本章函數列表