用戶(hù)畫(huà)像:方法論與工程化解決方案
定 價(jià):79 元
當(dāng)前圖書(shū)已被 48 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者:趙宏田
- 出版時(shí)間:2020/3/1
- ISBN:9787111635642
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類(lèi):F713.50
- 頁(yè)碼:0
- 紙張:
- 版次:
- 開(kāi)本:16開(kāi)
本書(shū)從技術(shù)維度系統(tǒng)講解了用戶(hù)畫(huà)像的方法論和一些常見(jiàn)的工程化解決方案。
全書(shū)共分為9個(gè)章節(jié)。
用戶(hù)畫(huà)像基礎(chǔ):講述用戶(hù)畫(huà)像的一些基礎(chǔ)概念、數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)、整個(gè)項(xiàng)目開(kāi)發(fā)的流程、以及畫(huà)像相關(guān)的表結(jié)構(gòu)設(shè)計(jì);
第二章 數(shù)據(jù)指標(biāo)體系:從用戶(hù)屬性、用戶(hù)行為、用戶(hù)消費(fèi)、風(fēng)險(xiǎn)控制等四個(gè)維度詳細(xì)羅列了常用到的用戶(hù)標(biāo)簽,這些標(biāo)簽基本涵蓋了大部分場(chǎng)景一半以上的標(biāo)簽需求。同時(shí)介紹了標(biāo)簽的規(guī)范化命名方式;
第三章 標(biāo)簽數(shù)據(jù)存儲(chǔ):講了為什么使用Hive、MySQL、hbase等數(shù)據(jù)庫(kù)對(duì)標(biāo)簽數(shù)據(jù)進(jìn)行存儲(chǔ),以及存儲(chǔ)實(shí)現(xiàn)方式;
第四章 標(biāo)簽數(shù)據(jù)開(kāi)發(fā):本章是全書(shū)的重點(diǎn)章節(jié),講述了統(tǒng)計(jì)類(lèi)標(biāo)簽、規(guī)則類(lèi)標(biāo)簽、挖掘類(lèi)標(biāo)簽、流式計(jì)算類(lèi)標(biāo)簽的開(kāi)發(fā)。以及用戶(hù)特征庫(kù)、人群計(jì)算、標(biāo)簽權(quán)重計(jì)算、打通數(shù)據(jù)服務(wù)層等方面的開(kāi)發(fā)。;
第五章 開(kāi)發(fā)性能調(diào)優(yōu):主要包括數(shù)據(jù)傾斜調(diào)優(yōu)、開(kāi)發(fā)中間表、讀取小文件處理、redis緩存熱數(shù)據(jù)等數(shù)據(jù)性能優(yōu)化方面;
第六章 作業(yè)流程調(diào)度:數(shù)據(jù)的ETL調(diào)度是數(shù)據(jù)開(kāi)發(fā)中的重要內(nèi)容,本章主要講了如何使用當(dāng)下熱門(mén)的開(kāi)源調(diào)度工具Airflow進(jìn)行數(shù)據(jù)的調(diào)度及場(chǎng)景調(diào)度異常的排查工作;
第七章 用戶(hù)畫(huà)像產(chǎn)品化:開(kāi)發(fā)畫(huà)像后的標(biāo)簽數(shù)據(jù),如果只是“躺在”數(shù)據(jù)倉(cāng)庫(kù)中,并不能發(fā)揮更大的業(yè)務(wù)價(jià)值。只有將畫(huà)像數(shù)據(jù)產(chǎn)品化后才能更方便業(yè)務(wù)方的使用。本章主要講述了產(chǎn)品端的用戶(hù)畫(huà)像是什么樣子?如何幫助業(yè)務(wù)人員進(jìn)行分析,提供服務(wù)的;
第八章 用戶(hù)畫(huà)像應(yīng)用:用戶(hù)畫(huà)像的應(yīng)用包括用戶(hù)分析、商品分析、流量分析、push、短信、郵件等營(yíng)銷(xiāo)以及站內(nèi)的個(gè)性化推薦等應(yīng)用場(chǎng)景;
第九章 實(shí)踐案例詳解:前面的八個(gè)章節(jié)主要從工程化開(kāi)發(fā)的角度講了如何從0到1搭建起用戶(hù)畫(huà)像系統(tǒng)及其應(yīng)用場(chǎng)景,本章從完整的工業(yè)實(shí)踐應(yīng)用角度,通過(guò)兩個(gè)實(shí)踐案例幫助讀者更好地理解畫(huà)像系統(tǒng)是如何切入到應(yīng)用場(chǎng)景中幫助提升工作效率、提高ROI的。
前言
第1章 用戶(hù)畫(huà)像基礎(chǔ)1
1.1 用戶(hù)畫(huà)像是什么1
1.1.1 畫(huà)像簡(jiǎn)介1
1.1.2 標(biāo)簽類(lèi)型3
1.2 數(shù)據(jù)架構(gòu)4
1.3 主要覆蓋模塊5
1.4 開(kāi)發(fā)階段流程7
1.4.1 開(kāi)發(fā)上線流程7
1.4.2 各階段關(guān)鍵產(chǎn)出9
1.5 畫(huà)像應(yīng)用的落地10
1.6 某用戶(hù)畫(huà)像案例11
1.6.1 案例背景介紹11
1.6.2 相關(guān)元數(shù)據(jù)12
1.6.3 畫(huà)像表結(jié)構(gòu)設(shè)計(jì)16
1.7 定性類(lèi)畫(huà)像21
1.8 本章小結(jié)22
第2章 數(shù)據(jù)指標(biāo)體系23
2.1 用戶(hù)屬性維度23
2.1.1 常見(jiàn)用戶(hù)屬性23
2.1.2 用戶(hù)性別26
2.2 用戶(hù)行為維度27
2.3 用戶(hù)消費(fèi)維度27
2.4 風(fēng)險(xiǎn)控制維度29
2.5 社交屬性維度30
2.6 其他常見(jiàn)標(biāo)簽劃分方式31
2.7 標(biāo)簽命名方式33
2.8 本章小結(jié)34
第3章 標(biāo)簽數(shù)據(jù)存儲(chǔ)35
3.1 Hive存儲(chǔ)35
3.1.1 Hive數(shù)據(jù)倉(cāng)庫(kù)35
3.1.2 分區(qū)存儲(chǔ)37
3.1.3 標(biāo)簽匯聚39
3.1.4 ID-MAP41
3.2 MySQL存儲(chǔ)45
3.2.1 元數(shù)據(jù)管理45
3.2.2 監(jiān)控預(yù)警數(shù)據(jù)47
3.2.3 結(jié)果集存儲(chǔ)47
3.3 HBase存儲(chǔ)50
3.3.1 HBase簡(jiǎn)介50
3.3.2 應(yīng)用場(chǎng)景52
3.3.3 工程化案例52
3.4 Elasticsearch存儲(chǔ)59
3.4.1 Elasticsearch簡(jiǎn)介59
3.4.2 應(yīng)用場(chǎng)景60
3.4.3 工程化案例64
3.5 本章小結(jié)67
第4章 標(biāo)簽數(shù)據(jù)開(kāi)發(fā)69
4.1 統(tǒng)計(jì)類(lèi)標(biāo)簽開(kāi)發(fā)69
4.1.1 近30日購(gòu)買(mǎi)行為標(biāo)簽案例70
4.1.2 最近來(lái)訪標(biāo)簽案例73
4.2 規(guī)則類(lèi)標(biāo)簽開(kāi)發(fā)74
4.2.1 用戶(hù)價(jià)值類(lèi)標(biāo)簽案例75
4.2.2 用戶(hù)活躍度標(biāo)簽案例79
4.3 挖掘類(lèi)標(biāo)簽開(kāi)發(fā)84
4.3.1 案例背景84
4.3.2 特征選取及開(kāi)發(fā)85
4.3.3 文本分詞處理86
4.3.4 數(shù)據(jù)結(jié)構(gòu)處理89
4.3.5 文本TF-IDF權(quán)重90
4.3.6 樸素貝葉斯分類(lèi)92
4.4 流式計(jì)算標(biāo)簽開(kāi)發(fā)95
4.4.1 流式標(biāo)簽建模框架95
4.4.2 Kafka簡(jiǎn)介96
4.4.3 Spark Streaming集成Kafka97
4.4.4 標(biāo)簽開(kāi)發(fā)及工程化99
4.5 用戶(hù)特征庫(kù)開(kāi)發(fā)104
4.5.1 特征庫(kù)規(guī)劃105
4.5.2 數(shù)據(jù)開(kāi)發(fā)107
4.5.3 其他特征庫(kù)規(guī)劃111
4.6 標(biāo)簽權(quán)重計(jì)算112
4.6.1 TF-IDF詞空間向量112
4.6.2 時(shí)間衰減系數(shù)114
4.6.3 標(biāo)簽權(quán)重配置115
4.7 標(biāo)簽相似度計(jì)算116
4.7.1 案例場(chǎng)景116
4.7.2 數(shù)據(jù)開(kāi)發(fā)118
4.8 組合標(biāo)簽計(jì)算122
4.8.1 應(yīng)用場(chǎng)景122
4.8.2 數(shù)據(jù)計(jì)算123
4.9 數(shù)據(jù)服務(wù)層開(kāi)發(fā)124
4.9.1 推送至營(yíng)銷(xiāo)系統(tǒng)125
4.9.2 接口調(diào)用服務(wù)127
4.10 GraphX圖計(jì)算用戶(hù)129
4.10.1 圖計(jì)算理論及應(yīng)用場(chǎng)景129
4.10.2 數(shù)據(jù)開(kāi)發(fā)案例132
4.11 本章小結(jié)135
第5章 開(kāi)發(fā)性能調(diào)優(yōu)137
5.1 數(shù)據(jù)傾斜調(diào)優(yōu)137
5.2 合并小文件141
5.3 緩存中間數(shù)據(jù)143
5.4 開(kāi)發(fā)中間表144
5.5 本章小結(jié)145
第6章 作業(yè)流程調(diào)度146
6.1 crontab命令調(diào)度146
6.2 Airflow工作平臺(tái)148
6.2.1 基礎(chǔ)概念149
6.2.2 Airflow服務(wù)構(gòu)成150
6.2.3 Airflow安裝151
6.2.4 主要模塊功能151
6.2.5 工作流調(diào)度155
6.2.6 腳本實(shí)例155
6.2.7 常用命令行158
6.2.8 工程化調(diào)度方案158
6.3 數(shù)據(jù)監(jiān)控預(yù)警161
6.3.1 標(biāo)簽監(jiān)控預(yù)警161
6.3.2 服務(wù)層預(yù)警162
6.4 ETL異常排查164
6.5 本章小結(jié)166
第7章 用戶(hù)畫(huà)像產(chǎn)品化167
7.1 即時(shí)查詢(xún)167
7.2 標(biāo)簽視圖與標(biāo)簽查詢(xún)169
7.3 元數(shù)據(jù)管理171
7.4 用戶(hù)分群功能173
7.5 人群分析功能175
7.6 本章小結(jié)177
第8章 用戶(hù)畫(huà)像應(yīng)用178
8.1 經(jīng)營(yíng)分析178
8.1.1 商品分析178
8.1.2 用戶(hù)分析179
8.1.3 渠道分析180
8.1.4 漏斗分析185
8.1.5 客服話(huà)術(shù)186
8.1.6 人群特征分析186
8.2 精準(zhǔn)營(yíng)銷(xiāo)187
8.2.1 短信/郵件營(yíng)銷(xiāo)187
8.2.2 效果分析188
8.3 個(gè)性化推薦與服務(wù)189
8.4 本章小結(jié)190
第9章 實(shí)踐案例詳解191
9.1 風(fēng)控反欺詐預(yù)警191
9.1.1 應(yīng)用背景191
9.1.2 用戶(hù)畫(huà)像切入點(diǎn)192
9.2 A/B人群效果測(cè)試193
9.2.1 案例背景194
9.2.2 用戶(hù)畫(huà)像切入點(diǎn)194
9.2.3 效果分析195
9.3 用戶(hù)生命周期劃分與營(yíng)銷(xiāo)195
9.3.1 生命周期劃分196
9.3.2 不同階段的用戶(hù)觸達(dá)策略201
9.3.3 畫(huà)像在生命周期中的應(yīng)用204
9.3.4 應(yīng)用案例206
9.4 高價(jià)值用戶(hù)實(shí)時(shí)營(yíng)銷(xiāo)209
9.4.1 項(xiàng)目應(yīng)用背景209
9.4.2 用戶(hù)畫(huà)像切入點(diǎn)209
9.4.3 HBase應(yīng)用場(chǎng)景小結(jié)209
9.5 短信營(yíng)銷(xiāo)用戶(hù)211
9.5.1 案例背景211
9.5.2 畫(huà)像切入及其應(yīng)用效果211
9.6 Session行為分析應(yīng)用213
9.6.1 關(guān)于用戶(hù)行為分析213
9.6.2 案例背景218
9.6.3 特征構(gòu)建219
9.6.4 分析方法與結(jié)論221
9.7 人群效果監(jiān)測(cè)報(bào)表搭建228
9.7.1 案例背景228
9.7.2 邏輯梳理228
9.7.3 自動(dòng)報(bào)表郵件237
9.8 基于用戶(hù)特征庫(kù)篩選目標(biāo)人群239
9.8.1 案例背景239
9.8.2 應(yīng)用方式及效果240
9.9 本章小結(jié)241
附錄 某產(chǎn)品用戶(hù)畫(huà)像項(xiàng)目規(guī)劃文檔242