《大數(shù)據(jù)技術(shù)與應(yīng)用》主要介紹大數(shù)據(jù)技術(shù)的基本概念與應(yīng)用。全書共分10章,內(nèi)容包括大數(shù)據(jù)介紹、云計算與大數(shù)據(jù)、大數(shù)據(jù)架構(gòu)、數(shù)據(jù)采集與清洗、大數(shù)據(jù)存儲、大數(shù)據(jù)分析與挖掘、大數(shù)據(jù)可視化、大數(shù)據(jù)安全、大數(shù)據(jù)的行業(yè)應(yīng)用以及大數(shù)據(jù)綜合實訓(xùn)。本書注重理論與實踐操作相結(jié)合,通過大量的案例幫助讀者快速了解并掌握大數(shù)據(jù)相關(guān)技術(shù)!洞髷(shù)據(jù)技
《實時數(shù)據(jù)處理和分析指南》主要介紹實時大數(shù)據(jù)計算領(lǐng)域的相關(guān)技巧和經(jīng)驗,包括Flink、Spark和Storm等流處理框架技術(shù)。全書從搭建開發(fā)環(huán)境開始,逐步實現(xiàn)流處理,循序漸進地引導(dǎo)讀者學(xué)習(xí)如何利用RabbitMQ、Kafka和NiFi以及Storm、Spark、Flink和Beam等組件協(xié)同應(yīng)用來解決實際問題。 本書內(nèi)
本書主要介紹一套系統(tǒng)的過程控制方法,以解決過程控制規(guī)劃、計劃、執(zhí)行、評價、改進中的一些基本問題。第1~3章主要闡述全套方法的基本內(nèi)容以及方法的采用理由和依據(jù),具體內(nèi)容包括:討論過程的定義與表示、過程的基本特征和過程中斷、延續(xù)、變更、結(jié)束等概念;討論過程的三種集合、過程控制框架、過程控制點控制與評價、過程結(jié)果評價;介紹幾
本書分五部分,第一部分?jǐn)?shù)據(jù)科學(xué)引導(dǎo),闡述數(shù)據(jù)科學(xué)的基本概念、原則和方法等內(nèi)容;第二部分?jǐn)?shù)據(jù)分析的數(shù)學(xué)基礎(chǔ),闡述相關(guān)的數(shù)學(xué)知識;第三部分?jǐn)?shù)據(jù)采集與管理,闡述數(shù)據(jù)采集、清洗、管理等知識;第四部分?jǐn)?shù)據(jù)分析基本方法與軟件實現(xiàn),闡述描述性統(tǒng)計分析方法等內(nèi)容;第五部分?jǐn)?shù)據(jù)分析案例與實訓(xùn)。
本書共五章,內(nèi)容包括:大數(shù)據(jù)技術(shù)研究、高校大數(shù)據(jù)技術(shù)的信息化研究、高校大數(shù)據(jù)技術(shù)的信息化創(chuàng)新研究、高校大數(shù)據(jù)技術(shù)與應(yīng)用專業(yè)人才培養(yǎng)等。
《自動線安裝與調(diào)試》遵循“以服務(wù)為宗旨、以就業(yè)為導(dǎo)向、以能力為本位”的高職教育理念,根據(jù)職業(yè)能力培養(yǎng)要求,采用工作過程為導(dǎo)向的模塊化課程開發(fā)模式,打破學(xué)科知識的界線,針對實際工作任務(wù)需要,重新組織和設(shè)計教學(xué)方式,突出“做中學(xué)”“學(xué)中做”,使學(xué)生在完成任務(wù)的同時,掌握相關(guān)知識和技能,凸顯職業(yè)教育特色。該書由學(xué)校、企業(yè)專家
數(shù)據(jù)清洗是大數(shù)據(jù)預(yù)處理的關(guān)鍵環(huán)節(jié)。面對錯綜復(fù)雜的數(shù)據(jù),傳統(tǒng)的清洗“臟”數(shù)據(jù)工作單調(diào)且異常辛苦,如果能利用正確的工具和方法,可以讓數(shù)據(jù)清洗工作變得事半功倍!稊(shù)據(jù)清洗》講解數(shù)據(jù)清洗的理論知識和實際應(yīng)用,《數(shù)據(jù)清洗》共8章:第1章主要帶領(lǐng)大家簡單認(rèn)識數(shù)據(jù)清洗;第2章主要講解ETL技術(shù)相關(guān)的知識;第3章講解Kettle工具的
本書以實戰(zhàn)開發(fā)為原則,以Hadoop3.X生態(tài)系統(tǒng)內(nèi)的主要大數(shù)據(jù)工具整合應(yīng)用及項目開發(fā)為主線,通過Hadoop大數(shù)據(jù)開發(fā)中常見的11個典型模塊和3個完整項目案例,詳細(xì)介紹HDFS、MapReduce、HBase、Hive、Sqoop、Spark等主流大數(shù)據(jù)工具的整合使用。本書附帶資源包括本書核心內(nèi)容的教學(xué)視頻,本書所涉
主要內(nèi)容·大數(shù)據(jù)技術(shù)和Spark概述。·通過實例學(xué)習(xí)DataFrame、SQL、Dataset等Spark的核心API。·了解Spark的低級API實現(xiàn),包括RDD以及SQL和DataFrame的執(zhí)行過程。·了解Spark如何在集群上運行。·Spar
本書以Python作為開發(fā)Spark應(yīng)用程序的編程語言,系統(tǒng)介紹了Spark編程的基礎(chǔ)知識。全書共8章,內(nèi)容包括大數(shù)據(jù)技術(shù)概述、Spark的設(shè)計與運行原理、Spark環(huán)境搭建和使用方法、RDD編程、SparkSQL、SparkStreaming、StructuredStreaming、SparkMLlib等。