本書通過講解Mudeler(Clementine)軟件的應(yīng)用,幫助讀者發(fā)現(xiàn)隱藏在大量數(shù)據(jù)中的規(guī)律,并且把他們成功的植入營銷方案中。書中的每一章都設(shè)立了一個或者多個具體的應(yīng)用場景,通過案例場景的介紹、問題的提出、問題解決的操作過程、輸出結(jié)果的詳解、關(guān)鍵統(tǒng)計知識點的溫習(xí)等步驟,幫助大家掌握常見的關(guān)聯(lián)性分析、決策樹、時間序列
應(yīng)急大數(shù)據(jù)的空間分析與多因素關(guān)聯(lián)挖掘
這是一本將數(shù)據(jù)科學(xué)三要素商業(yè)理解、量化模型、數(shù)據(jù)技術(shù)全面打通的實戰(zhàn)性著作,是來自騰訊、滴滴、快手等一線互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師和算法工程師的經(jīng)驗總結(jié),得到了SQLFlow創(chuàng)始人以及騰訊、網(wǎng)易、快手、貝殼找房、谷歌等企業(yè)的專家一致好評和推薦。 全書三個部分,內(nèi)容相對獨立,既能幫助初學(xué)者建立知識體系,又能幫助從
本書將通過具有中國特色的具體案例來講授Python編程的基本語法規(guī)則,并通過Python語言來介紹數(shù)據(jù)科學(xué)的基本內(nèi)容以及數(shù)據(jù)分析方法的基本思想。內(nèi)容分為兩部分,第一部分介紹Python編程的基本概念,包括常用表達(dá)式、數(shù)據(jù)類型、表格處理、數(shù)據(jù)可視化等;第二部分結(jié)合Python語言介紹數(shù)據(jù)分析方法的基本思想,比如假設(shè)檢驗、
本書詳細(xì)闡述了培養(yǎng)具有數(shù)據(jù)素養(yǎng)的技術(shù)技能型人才所需要的大數(shù)據(jù)相關(guān)基礎(chǔ)知識。本書在確定知識布局時,秉持的一個基本原則是,緊緊圍繞大數(shù)據(jù)通識教育核心理念,培養(yǎng)學(xué)生的數(shù)據(jù)意識、數(shù)據(jù)思維、數(shù)據(jù)安全和數(shù)據(jù)分析能力。全書共7章,內(nèi)容包括大數(shù)據(jù)概述,大數(shù)據(jù)思維,數(shù)據(jù)庫基礎(chǔ)知識,大數(shù)據(jù)分析技術(shù)及相關(guān)應(yīng)用,數(shù)據(jù)可視化概論,大數(shù)據(jù)安全,大
本書系統(tǒng)、全面地介紹大數(shù)據(jù)技術(shù)的基礎(chǔ)知識。全書共13章,首先介紹大數(shù)據(jù)行業(yè)與技術(shù)趨勢;然后介紹大數(shù)據(jù)生態(tài)圈的各項技術(shù),包括分布式文件系統(tǒng)、Hive分布式數(shù)據(jù)倉庫、HBase技術(shù)原理、MapReduce和YARN技術(shù)原理、Spark基于內(nèi)存的分布式計算、Flink流批一體分布式實時處理引擎、數(shù)據(jù)采集與數(shù)據(jù)裝載工具、Kaf
《大數(shù)據(jù)百科術(shù)語辭典》漢外對照系列叢書是全球首套系統(tǒng)研究大數(shù)據(jù)術(shù)語的多語種智能化專業(yè)辭典。本叢書對大數(shù)據(jù)知識體系進(jìn)行了全面梳理,提出了九個方面的術(shù)語架構(gòu),形成了統(tǒng)一規(guī)范、符合國際通用規(guī)則的多語種學(xué)術(shù)話語體系;叢書系統(tǒng)性提供漢語與其他二十個語種的術(shù)語規(guī)范表述,以中外文對照的形式展示;叢書開創(chuàng)性融入知識圖譜、有聲點讀、平臺
Hadoop是當(dāng)前熱門的大數(shù)據(jù)處理與分析平臺!禜adoop大數(shù)據(jù)開發(fā)基礎(chǔ)項目化教程》將大數(shù)據(jù)平臺相關(guān)內(nèi)容劃分為8個項目,分別是大數(shù)據(jù)時代、Hadoop基礎(chǔ)環(huán)境、Hadoop環(huán)境搭建、分布式存儲HDFS、MapReduce分布式編程、Hadoop數(shù)據(jù)倉庫Hive、Hadoop數(shù)據(jù)庫HBas、協(xié)調(diào)系統(tǒng)Zookeeper,
本書介紹數(shù)據(jù)分析的統(tǒng)計基礎(chǔ)、種類劃分,并列舉大量實例以說明數(shù)據(jù)分析方法和算法。內(nèi)容主要分為4部分,第1部分為第1章,介紹一些概念,簡單描述數(shù)據(jù)分析方法和一些實例;第2部分包括第2~7章,介紹描述性分析和數(shù)據(jù)預(yù)處理的主要方法,包括描述統(tǒng)計、多元描述分析、聚類以及頻繁模式挖掘等;第3部分包括第8~12章,介紹預(yù)測性分析的主