數(shù)據(jù)科學與大數(shù)據(jù)技術導論實驗
定 價:32.8 元
叢書名:新世紀高等學校規(guī)劃教材·大數(shù)據(jù)系列
當前圖書已被 2 所學校薦購過!
查看明細
- 作者:陳明
- 出版時間:2018/8/1
- ISBN:9787303234509
- 出 版 社:北京師范大學出版社
- 中圖法分類:TP274-33
- 頁碼:
- 紙張:膠版紙
- 版次:
- 開本:16開
本書是《數(shù)據(jù)科學與大數(shù)據(jù)技術導論實驗》課程的實驗教材,可以配合主教材使用。主要內容包括:Linux環(huán)境部署、Hadoop開發(fā)環(huán)境部署、網頁數(shù)據(jù)采集、大數(shù)據(jù)去重、大數(shù)據(jù)*值計算、大數(shù)據(jù)排序、大數(shù)據(jù)倒排索引、大數(shù)據(jù)平均值計算、大數(shù)據(jù)單表關聯(lián)、大數(shù)據(jù)可視化。
本書選材先進、特點鮮明,注重應用。通過本書所提供的實驗練習,可以提高大數(shù)據(jù)處理能力?捎糜诖髷(shù)據(jù)實驗教材,也可以作為科學技術人員學習和應用大數(shù)據(jù)的科技參考書。
基于開源的大數(shù)據(jù)處理軟件工具 呈現(xiàn)數(shù)據(jù)生命周期中的典型實驗
本書中的十個實驗,涉及了大數(shù)據(jù)生命周期中的內容的基本實驗,主要在大數(shù)據(jù)處理平臺Hadoop開發(fā)環(huán)境下完成。主要應用了MapReduce分布編程模型,完成基本的分析處理功能。
陳明,博士生導師,曾任吉林大學計算機科學系副教授、教研室主任;大連理工大學計算機科學與工程系教授、系主任;中國石油大學(北京)計算機科學與技術系教授、系主任。北京高校計算機與信息類專業(yè)群專家委員會委員兼教學協(xié)作委員會委員。
實驗1 Linux操作系統(tǒng)部署
實驗2 Hadoop開發(fā)環(huán)境部署
實驗3 網頁數(shù)據(jù)獲取
實驗4 大數(shù)據(jù)去重
實驗5 大數(shù)據(jù)最大值計算
實驗6 大數(shù)據(jù)排序
實驗7 Hadoop倒排索引
實驗8 大數(shù)據(jù)平均值計算
實驗9 大數(shù)據(jù)單表關聯(lián)
實驗10 大數(shù)據(jù)可視化
參考文獻