AI時代的數(shù)據(jù)價值創(chuàng)造:從數(shù)據(jù)底座到大模型應用落地
定 價:79.8 元
當前圖書已被 5 所學校薦購過!
查看明細
- 作者:劉汪根 王志軍 陳果
- 出版時間:2025/5/1
- ISBN:9787115670168
- 出 版 社:人民郵電出版社
- 中圖法分類:TP274
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書旨在幫助數(shù)據(jù)行業(yè)的從業(yè)者在 AI 時代提升數(shù)據(jù)管理和數(shù)據(jù)技術認知水平,內(nèi)容覆蓋數(shù)據(jù)價值創(chuàng)造的理論、技術和實踐。
本書共 8 章。第 1 章回顧企業(yè)數(shù)據(jù)的發(fā)展歷史,并講解現(xiàn)代企業(yè)數(shù)據(jù)組織。第 2 章從多維度解析數(shù)據(jù)價值的創(chuàng)造路徑,包括從構建數(shù)字化決策、加速業(yè)務創(chuàng)新和推動 AI 變革等視角介紹數(shù)據(jù)價值創(chuàng)造的方法和成果。第 3 章系統(tǒng)講解數(shù)據(jù)管理的方法與技術,包括數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)資產(chǎn)運營、數(shù)據(jù)平臺架構的規(guī)劃及實踐案例。第 4 章講解數(shù)據(jù)要素價值化的路徑探索,包括數(shù)據(jù)要素在多行業(yè)的應用、基礎體系、可信數(shù)據(jù)流通技術及數(shù)據(jù)資產(chǎn)入表。第 5 章講解數(shù)據(jù)底座的技術與實踐,包括數(shù)據(jù)底座的架構要求、分布式存儲技術、分布式計算技術等,以及多種架構介紹。第 6 章講解數(shù)據(jù)與 AI 的融合,包括推薦系統(tǒng)、基于 LLM 的數(shù)據(jù)治理分析、數(shù)據(jù)標注等。第 7 章介紹企業(yè) AI 應用的方法論與知識融合。第 8 章是數(shù)據(jù)領域技術趨勢與思考,包括數(shù)據(jù)技術的自主可控、開源技術的發(fā)展與挑戰(zhàn)、數(shù)據(jù)中臺的發(fā)展歷程與思考、數(shù)據(jù)編織技術的原理與展望。
本書適合對大數(shù)據(jù)技術、數(shù)據(jù)管理、數(shù)據(jù)價值、數(shù)據(jù)與 AI 融合及相關技術感興趣的讀者閱讀,尤其適合從事大數(shù)據(jù)相關工作或旨在推動企業(yè)數(shù)字化轉型的讀者閱讀。
1. 本書作者劉汪根、陳果,在大數(shù)據(jù)圈子和咨詢領域的口碑、流量不錯,有較高的影響力。
2. 本書在內(nèi)容組織上有如下3大特色:
(1)系統(tǒng)性:完整的數(shù)據(jù)管理知識體系。
(2)理論與實踐相結合:既包括核心技術的介紹,又包括大型企業(yè)的成功案例。
(3)前沿性:不僅包含成熟的數(shù)據(jù)管理技術,還包括AI+數(shù)據(jù)管理的前沿技術與應用。
劉汪根,現(xiàn)任星環(huán)科技副總裁、聯(lián)合創(chuàng)始人,CCF大數(shù)據(jù)專家委員會和數(shù)據(jù)治理發(fā)展委員會執(zhí)行委員。幫助星環(huán)打造了一系列自主可控、技術領先的大數(shù)據(jù)基礎軟件產(chǎn)品,成為全球首個通過國際基準測試TPC-DS認證的公司。
王志軍,中國聯(lián)通軟件研究院副院長,首席安全官。致力于大數(shù)據(jù)、云計算、AI及企業(yè)信息化領域研究,是通信行業(yè)大數(shù)據(jù)平臺建設的開拓者,曾幫助運營商率先實現(xiàn)全網(wǎng)數(shù)據(jù)集約化、百PB級數(shù)據(jù)集中高效處理。
陳果,企業(yè)知識開源計劃創(chuàng)始人兼首席布道師,波士頓咨詢公司前董事總經(jīng)理,IBM咨詢前全球執(zhí)行合伙人。在管理咨詢和IT咨詢行業(yè)擁有24年從業(yè)經(jīng)驗,為消費品和零售、高科技、冶金和化工、汽車和機械、物流、銀行、保險等行業(yè)的100多家企業(yè)提供過咨詢服務。
第 1章 數(shù)字化與信息化
1.1 數(shù)據(jù)與信息1
1.2 數(shù)據(jù)處理的起源2
1.3 數(shù)字化的數(shù)據(jù)處理3
1.3.1 從機械化到數(shù)字化4
1.3.2 從數(shù)據(jù)處理到信息系統(tǒng)7
1.3.3 面向記錄事務的數(shù)據(jù)管理9
1.4 數(shù)據(jù)管理與分析12
1.5 商業(yè)智能與數(shù)據(jù)科學14
1.6 數(shù)據(jù)可視化16
1.7 現(xiàn)代企業(yè)數(shù)據(jù)組織19
1.7.1 數(shù)據(jù)工程師20
1.7.2 數(shù)據(jù)分析師21
1.7.3 數(shù)據(jù)科學家22
1.7.4 數(shù)據(jù)管理人員23
第 2章 數(shù)據(jù)價值的創(chuàng)造路徑
2.1 數(shù)據(jù)分析創(chuàng)造價值24
2.1.1 企業(yè)數(shù)據(jù)價值創(chuàng)造的階段化路徑24
2.1.2 國內(nèi)數(shù)字化的行業(yè)觀察27
2.2 數(shù)據(jù)價值:數(shù)字化決策30
2.2.1 運營管理的數(shù)字化30
2.2.2 風險管理的數(shù)字化32
2.2.3 營銷獲客的數(shù)字化34
2.3 數(shù)據(jù)價值:業(yè)務創(chuàng)新37
2.3.1 線下業(yè)務轉線上37
2.3.2 監(jiān)管的數(shù)字化39
2.4 數(shù)據(jù)價值:推動AI變革42
2.4.1 ImageNet42
2.4.2 數(shù)字療法43
2.5 數(shù)據(jù)價值創(chuàng)造的組織保障44
2.5.1 數(shù)據(jù)管理團隊能力建設47
2.5.2 數(shù)據(jù)產(chǎn)品團隊能力建設48
2.5.3 數(shù)據(jù)底座團隊能力建設49
第3章 數(shù)據(jù)管理的方法與技術
3.1 數(shù)據(jù)資產(chǎn)管理51
3.1.1 數(shù)據(jù)模型管理52
3.1.2 數(shù)據(jù)標準管理55
3.1.3 數(shù)據(jù)質(zhì)量管理57
3.1.4 主數(shù)據(jù)管理59
3.1.5 元數(shù)據(jù)管理61
3.1.6 數(shù)據(jù)安全管理63
3.1.7 數(shù)據(jù)資產(chǎn)管理平臺65
3.2 數(shù)據(jù)資產(chǎn)運營69
3.2.1 數(shù)據(jù)可視化69
3.2.2 商業(yè)智能71
3.2.3 數(shù)據(jù)洞察73
3.2.4 數(shù)據(jù)標簽74
3.2.5 數(shù)據(jù)指標76
3.2.6 數(shù)據(jù)資產(chǎn)盤點與編目77
3.2.7 數(shù)據(jù)資產(chǎn)運營平臺80
3.3 數(shù)據(jù)平臺架構82
3.3.1 數(shù)據(jù)倉庫82
3.3.2 數(shù)據(jù)湖86
3.3.3 數(shù)據(jù)集市89
3.3.4 數(shù)據(jù)中臺90
3.4 中國聯(lián)通的數(shù)據(jù)運營體系93
3.4.1 數(shù)據(jù)運營體系的建設由來93
3.4.2 數(shù)據(jù)運營的規(guī)范統(tǒng)一94
3.4.3 統(tǒng)一工具支撐“一體化運營”94
3.4.4 “一套數(shù)據(jù)管理體系”
保障數(shù)據(jù)供給95
第4章 數(shù)據(jù)要素價值化的路徑探索
4.1 數(shù)據(jù)要素:數(shù)據(jù)價值的產(chǎn)業(yè)化98
4.1.1 數(shù)據(jù)要素×醫(yī)療健康98
4.1.2 數(shù)據(jù)要素×金融服務101
4.1.3 數(shù)據(jù)要素×智慧農(nóng)業(yè)103
4.1.4 數(shù)據(jù)要素×氣象服務104
4.2 數(shù)據(jù)要素的基礎體系106
4.2.1 數(shù)據(jù)基礎設施106
4.2.2 數(shù)據(jù)基礎制度108
4.3 可信數(shù)據(jù)流通技術110
4.3.1 數(shù)據(jù)空間110
4.3.2 其他技術路徑115
4.4 數(shù)據(jù)資產(chǎn)入表118
4.4.1 數(shù)據(jù)資產(chǎn)的確認118
4.4.2 數(shù)據(jù)資產(chǎn)的會計計量120
4.4.3 數(shù)據(jù)資源入表管理平臺121
第5章 數(shù)據(jù)底座的技術與實踐
5.1 數(shù)據(jù)底座的架構要求124
5.1.1 數(shù)據(jù)底座的能力要求124
5.1.2 數(shù)據(jù)底座的核心功能126
5.2 分布式存儲技術128
5.2.1 分布式文件存儲HDFS130
5.2.2 對象存儲Ceph131
5.2.3 寬表存儲HBase132
5.2.4 文檔搜索引擎Elasticsearch135
5.3 分布式計算技術137
5.3.1 MapReduce140
5.3.2 Spark142
5.3.3 Presto145
5.4 分布式資源管理技術147
5.5 分析型數(shù)據(jù)庫151
5.5.1 MPP數(shù)據(jù)庫152
5.5.2 分布式分析型數(shù)據(jù)庫155
5.5.3 分析型數(shù)據(jù)庫的評價158
5.6 數(shù)據(jù)聯(lián)邦162
5.7 湖倉一體架構165
5.7.1 Hudi166
5.7.2 Iceberg168
5.7.3 Delta Lake171
5.8 流批一體架構172
5.8.1 Lambda架構173
5.8.2 Kappa架構174
5.8.3 Flink176
5.9 存算分離架構177
5.9.1 基于云存儲的存算分離179
5.9.2 基于本地存儲的存算分離180
5.10 中國聯(lián)通集團的數(shù)據(jù)底座建設183
5.10.1 大數(shù)據(jù)技術架構183
5.10.2 數(shù)據(jù)平臺架構188
第6章 數(shù)據(jù)與AI的融合
6.1 推薦系統(tǒng)191
6.1.1 協(xié)同過濾192
6.1.2 內(nèi)容過濾193
6.1.3 基于向量的近鄰召回的推薦系統(tǒng)193
6.1.4 基于點擊率預估模型的推薦系統(tǒng)194
6.2 基于LLM的數(shù)據(jù)治理與分析195
6.2.1 智能化數(shù)據(jù)治理195
6.2.2 基于LLM的數(shù)據(jù)分析199
6.3 數(shù)據(jù)標注200
6.4 向量數(shù)據(jù)庫202
6.4.1 特征與向量203
6.4.2 相似度的度量204
6.4.3 向量檢索的召回率與準確率205
6.4.4 向量檢索與索引技術206
6.5 知識圖譜211
6.5.1 知識的表示方法212
6.5.2 知識抽取與推理技術213
6.5.3 知識存儲與圖模型215
6.5.4 圖數(shù)據(jù)庫與圖計算技術216
6.6 AI數(shù)據(jù)安全的挑戰(zhàn)與防護技術217
6.6.1 對抗樣本攻擊與防御218
6.6.2 數(shù)據(jù)投毒攻擊與防御219
6.6.3 后門攻擊與防御220
6.6.4 預訓練大模型的數(shù)據(jù)風險221
第7章 企業(yè)AI應用的方法論與知識融合
7.1 通用模型、推理模型與智能體223
7.1.1 通用模型223
7.1.2 推理模型224
7.1.3 智能體224
7.1.4 典型案例:DeepSeek大模型226
7.2 企業(yè)AI應用落地方法論227
7.2.1 企業(yè)AI應用落地條件227
7.2.2 企業(yè)AI落地場景228
7.2.3 企業(yè)AI場景實踐案例229
7.3 大模型與企業(yè)知識融合229
7.3.1 大模型數(shù)據(jù)調(diào)優(yōu)難題:Demo與上線的差距229
7.3.2 LLM的知識機制230
7.3.3 企業(yè)AI應用的基礎設施只需要DeepSeek嗎231
7.4 知識工程中的大模型應用233
7.4.1 大模型參數(shù)差異與NER任務的影響233
7.4.2 知識增強對實體識別的優(yōu)化234
7.4.3 易混淆知識的識別策略236
7.4.4 知識長度與識別準確率的關系238
7.4.5 推理能力對大模型識別效果的影響240
7.4.6 大模型驅(qū)動的知識工程流水線242
第8章 數(shù)據(jù)領域技術趨勢與思考
8.1 數(shù)據(jù)技術的自主可控245
8.2 開源技術的發(fā)展與挑戰(zhàn)247
8.3 數(shù)據(jù)中臺的發(fā)展歷程與思考251
8.4 數(shù)據(jù)編織技術的原理與展望253