1.全面講解商業(yè)領域中的數(shù)據(jù)處理、機器學習和人工智能,數(shù)據(jù)科學家的手冊。深圳數(shù)據(jù)交易所數(shù)據(jù)應用部負責人李可順、浙江大學客座教授 曹嘉飛傾情推薦。
2.不僅介紹了數(shù)據(jù)科學的基本概念和技術,更重要的是闡述了如何將這些技術應用到商業(yè)領域中。書中提供了很多實用的建議和技巧,可以幫助讀者更好地應用數(shù)據(jù)科學來推動商業(yè)決策和實現(xiàn)商業(yè)價值。
3.評估企業(yè)是否需要數(shù)據(jù)科學家,以及數(shù)據(jù)科學家需要哪些能力;評估項目是否需要大數(shù)據(jù)技術,以及大數(shù)據(jù)為何會約束分析師;介紹更適合解決眾多問題的前沿人工智能工具以及經(jīng)典方法。
第一章 前言 001
1.1 為什么企業(yè)管理者需要了解數(shù)據(jù)科學 003
1.2 新時代的數(shù)據(jù)素養(yǎng) 005
1.3 數(shù)據(jù)驅動式開發(fā) 007
1.4 如何使用本書 010
第二章 商業(yè)領域中的數(shù)據(jù)科學 013
2.1 什么是數(shù)據(jù)科學 015
2.2 企業(yè)中的數(shù)據(jù)科學 036
2.3 聘請數(shù)據(jù)科學家 048
2.4 管理失敗案例 067
第三章 處理現(xiàn)代數(shù)據(jù) 073
3.1 非結構化數(shù)據(jù)和被動收集 076
3.2 數(shù)據(jù)類型和來源 078
3.3 數(shù)據(jù)格式 079
3.4 數(shù)據(jù)庫 087
3.5 數(shù)據(jù)分析軟件架構 093
第四章 講述故事和總結數(shù)據(jù) 101
4.1 選擇要度量的內(nèi)容 104
4.2 異常值、可視化和概要統(tǒng)計的局限性:一圖抵千數(shù) 108
4.3 實驗、相關性和因果關系 113
4.4 以一個數(shù)字進行總結 117
4.5 評估關鍵特征:集中趨勢、擴散程度和重尾 118
4.6 總結兩個數(shù)字:相關系數(shù)和散點圖 128
4.7 高階內(nèi)容:擬合直線或曲線 133
4.8 統(tǒng)計學:如何不自欺欺人 142
4.9 高階內(nèi)容:值得了解的概率分布 158
第五章 機器學習 175
5.1 監(jiān)督式學習、非監(jiān)督式學習、二元分類 178
5.2 測量性能 188
5.3 高階內(nèi)容:重要分類器 198
5.4 數(shù)據(jù)結構:無監(jiān)督式學習 217
5.5 邊做邊學:強化學習 235
第六章 了解工具 241
6.1 關于學習編碼的注意事項 244
6.2 速查表 245
6.3 數(shù)據(jù)科學生態(tài)系統(tǒng)的組成部分 246
6.4 高階內(nèi)容:數(shù)據(jù)庫查詢速成課 264
第七章 深度學習和人工智能 275
7.1 人工智能概述 278
7.2 神經(jīng)網(wǎng)絡 282
7.3 自然語言處理(NLP) 296
7.4 知識庫和圖表 305
后記 309