對于入門和學(xué)習(xí)大數(shù)據(jù)技術(shù)的讀者來說,大數(shù)據(jù)技術(shù)的生態(tài)圈和知識體系過于龐大,可能還沒有開始學(xué)習(xí)就已經(jīng)陷入眾多的陌生名詞和泛泛的概念中。本書的切入點明確而清晰,從Hadoop生態(tài)系統(tǒng)的明星Cloudera入手,逐步引出各類大數(shù)據(jù)基礎(chǔ)和核心應(yīng)用框架。本書分為18章,系統(tǒng)介紹Hadoop生態(tài)系統(tǒng)大數(shù)據(jù)相關(guān)的知識,包括大數(shù)據(jù)概述
本書涉及與自動化生產(chǎn)線相關(guān)的技術(shù)及理論,主要包括自動化生產(chǎn)線概述、自動化生產(chǎn)線的組成結(jié)構(gòu)、自動化生產(chǎn)線的控制單元、自動化生產(chǎn)線安裝與調(diào)試以及自動化生產(chǎn)線設(shè)計、工業(yè)機(jī)器人及智能裝備、柔性自動化生產(chǎn)線技術(shù)等內(nèi)容。
本書共分為10章,主要內(nèi)容包括:大數(shù)據(jù)分析生命周期概述、數(shù)據(jù)采集、數(shù)據(jù)清洗、可視化工具、數(shù)據(jù)建模、模型評估與優(yōu)化、出租車數(shù)據(jù)分析、音樂分類、知識圖譜制作、電影評論情感分析。
本書分為基礎(chǔ)篇和提高篇兩部分,共7章,主要內(nèi)容包括:Spark初識、Spark核心概念、Spark架構(gòu)與執(zhí)行流程、Spark流式計算、SparkSQL、Spark與機(jī)器學(xué)習(xí)、案例分析。
本書是學(xué)術(shù)著作,共7章,主要內(nèi)容包括白酒窖泥微生物多樣性研究方法及進(jìn)展,基于Miseq高通量測序技術(shù)古襄陽酒窖泥細(xì)菌多樣性評價,丟糟窖窖泥細(xì)菌多樣性評價,退化和正常窖泥微生物多樣性的比較分析,基于DGGE的窖泥細(xì)菌與乳酸菌多樣性研究,濃香型白酒窖泥中乳酸菌的分離及其在柑橘酒中的應(yīng)用,古襄陽濃香型白酒窖泥中乳酸菌分離株目
《大數(shù)據(jù)背景下數(shù)據(jù)挖掘及處理分析》內(nèi)容首先對大數(shù)據(jù)及數(shù)據(jù)挖掘技術(shù)原理進(jìn)行論述,然后對于數(shù)據(jù)的獲取、可視化分析以及基于R語言的數(shù)據(jù)分析進(jìn)行探索,針對數(shù)據(jù)的甄別模式和知識圖譜與圖數(shù)據(jù)挖掘分析,將數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)進(jìn)行對比分析,結(jié)合應(yīng)用實例探索數(shù)據(jù)挖掘的發(fā)展趨勢!洞髷(shù)據(jù)背景下數(shù)據(jù)挖掘及處理分析》可使大家全面了解數(shù)據(jù)挖掘的技
大數(shù)據(jù)可視化這種新的視覺表達(dá)形式是應(yīng)信息社會蓬勃發(fā)展而出現(xiàn)的——因為我們不僅要呈現(xiàn)世界,更重要的是要通過呈現(xiàn)來處理更龐大的數(shù)據(jù),理解各種各樣的數(shù)據(jù)集合,表現(xiàn)多維數(shù)據(jù)之間的關(guān)聯(lián)。換句話說,就是歸納數(shù)據(jù)內(nèi)在的模式、關(guān)聯(lián)和結(jié)構(gòu)。復(fù)雜數(shù)據(jù)可視化既涉及科學(xué)也涉及設(shè)計,它的藝術(shù)性實際上是使用獨特手法展示萬千世界的某個局部,從而提出
本課程的教學(xué)內(nèi)容主要包括聚類、關(guān)聯(lián)、降維、變量選擇、分類與預(yù)測、集成算法、圖模型與推薦系統(tǒng)等。每一部分都是本課程授課的主要內(nèi)容,都力求深入淺出,精講細(xì)講,不光講解各種方法的過程與原理,還要加強(qiáng)學(xué)生對各種方法的深入理解。
本書著力于介紹數(shù)據(jù)挖掘基礎(chǔ)知識、基本原理、常用算法,主要內(nèi)容包括數(shù)據(jù)挖掘概述、數(shù)據(jù)的描述與可視化、數(shù)據(jù)的采集和預(yù)處理、數(shù)據(jù)的歸約、關(guān)聯(lián)規(guī)則挖掘、分類與預(yù)測、非線性預(yù)測模型、聚類分析、深度學(xué)習(xí)簡介、使用Weka進(jìn)行數(shù)據(jù)挖掘。本書通俗易懂,注重基礎(chǔ)知識、基本原理和基本方法,注重啟發(fā)和引申,以培養(yǎng)學(xué)生獨立思考和獨立發(fā)現(xiàn)的能力
本書呈現(xiàn)了文本挖掘領(lǐng)域先進(jìn)的算法,同時從學(xué)術(shù)界和產(chǎn)業(yè)界的角度介紹了文本挖掘。本書涉及的業(yè)界學(xué)者跨越多個國家,來自多個機(jī)構(gòu):大學(xué)、企業(yè)和政府實驗室。本書介紹了文本挖掘在多個領(lǐng)域中的自動文本分析和挖掘計算模型,這些領(lǐng)域包括:機(jī)器學(xué)習(xí)、知識發(fā)現(xiàn)、自然語言處理和信息檢索等。本書適合作為