本書分為10章,其中第1~9章探討了排序、推薦系統(tǒng)、聚類、線性回歸等內(nèi)容,每章都以一個(gè)具體的實(shí)際問題開始,其主要目的是激發(fā)對某一特定大數(shù)據(jù)分析技術(shù)的研究。接下來探討其背后的數(shù)學(xué)原理——包括重要的定義、輔助陳述和得出的結(jié)論。案例研究有助于將所學(xué)知識應(yīng)用于跨學(xué)科的環(huán)境中,包括對逐步任務(wù)的描述和有用的提示。每章之后都配有習(xí)題
討論大數(shù)據(jù)技術(shù)時(shí),首先需要了解大數(shù)據(jù)的基本處理流程,主要包括數(shù)據(jù)采集、存儲(chǔ)、分析和結(jié)果呈現(xiàn)等環(huán)節(jié)。數(shù)據(jù)無處不在,互聯(lián)網(wǎng)網(wǎng)站、政務(wù)系統(tǒng)、零售系統(tǒng)、辦公系統(tǒng)、自動(dòng)化生產(chǎn)系統(tǒng)、監(jiān)控?cái)z像頭、傳感器等,每時(shí)每刻都在不斷產(chǎn)生數(shù)據(jù)。這些分散在各處的數(shù)據(jù),需要采用相應(yīng)的設(shè)備或軟件進(jìn)行采集。采集到的數(shù)據(jù)通常無法直接用于后續(xù)的數(shù)據(jù)分析,因
本書共分為六個(gè)部分:基礎(chǔ)入門、研究設(shè)計(jì)和基礎(chǔ)工具、文本挖掘基礎(chǔ)、人文社會(huì)科學(xué)與文本分析、計(jì)算機(jī)科學(xué)與文本挖掘、寫作和展示,在內(nèi)容安排上由淺入深、循序漸進(jìn)。相較于單一且詳盡的方法教程,本書的目的更多是在于指導(dǎo)學(xué)生運(yùn)用社會(huì)世界的文本數(shù)據(jù)來設(shè)計(jì)一項(xiàng)可行的社會(huì)科學(xué)研究。本書涵蓋了文本挖掘研究多個(gè)方面的關(guān)鍵問題,包括網(wǎng)絡(luò)抓取和爬
大數(shù)據(jù)技術(shù)與應(yīng)用發(fā)展不僅改變著網(wǎng)絡(luò)信息環(huán)境,而且決定數(shù)據(jù)的存在形態(tài)與數(shù)字信息資源的分布和利用結(jié)構(gòu),直接關(guān)系到用戶的認(rèn)知需求表達(dá)與數(shù)字信息交互機(jī)制。在這一背景下,本書從大數(shù)據(jù)技術(shù)基礎(chǔ)、數(shù)據(jù)內(nèi)容管理和數(shù)字信息利用出發(fā),按照大數(shù)據(jù)應(yīng)用與服務(wù)基礎(chǔ)構(gòu)架進(jìn)行理論和實(shí)踐的歸納;通過基本問題的分析和實(shí)證探索,圍繞大數(shù)據(jù)需求、數(shù)字資源形
本教材立足“大數(shù)據(jù)”的時(shí)代背景,面向企業(yè)數(shù)字化轉(zhuǎn)型升級對數(shù)字化人才的需求,堅(jiān)持大數(shù)據(jù)通識教育核心理念,采用理論與實(shí)踐相結(jié)合的方式,選取了六個(gè)項(xiàng)目,助力讀者提升大數(shù)據(jù)分析相關(guān)的數(shù)字技能與數(shù)字素養(yǎng),培養(yǎng)學(xué)生的大數(shù)據(jù)意識、大數(shù)據(jù)思維、大數(shù)據(jù)安全和大數(shù)據(jù)基本處理能力。本教材根據(jù)行業(yè)企業(yè)大數(shù)據(jù)的實(shí)際應(yīng)用和高職學(xué)生認(rèn)知規(guī)律,選取了
本書以項(xiàng)目任務(wù)為載體串聯(lián)知識與技能,介紹基于SparkSQL技術(shù)的大數(shù)據(jù)分析方法,培養(yǎng)學(xué)習(xí)者使用SparkSQL技術(shù)解決實(shí)際數(shù)據(jù)分析問題的能力,主要內(nèi)容有大數(shù)據(jù)分析概述、實(shí)踐環(huán)境準(zhǔn)備、學(xué)生信息處理分析、房產(chǎn)大數(shù)據(jù)分析與探索、電商大數(shù)據(jù)分析與探索、Zepplin數(shù)據(jù)可視化。在實(shí)現(xiàn)任務(wù)的過程中詳細(xì)闡述了Scala語言基礎(chǔ)、
本書從初學(xué)者的角度詳細(xì)介紹大數(shù)據(jù)的核心技術(shù)。全書共11章,包括緒論、Linux的基礎(chǔ)操作、Hadoop大數(shù)據(jù)處理架構(gòu)、HDFS分布式文件系統(tǒng)、MapReduce分布式計(jì)算框架、ZooKeeper分布式協(xié)調(diào)服務(wù)、YARN資源管理器、HBase分布式數(shù)據(jù)庫、Hive數(shù)據(jù)倉儲(chǔ)、PySpark數(shù)據(jù)處理與分析及綜合案例。此外,本
架構(gòu)大數(shù)據(jù)系統(tǒng)涉及的技術(shù)和工具種類繁多,但技術(shù)和工具背后的大數(shù)據(jù)處理需求和解決問題的思維邏輯卻恒久不變。本書采用軟件工程化方法,從大數(shù)據(jù)架構(gòu)的需求出發(fā),籍由理性和常識的指引,推導(dǎo)和梳理大數(shù)據(jù)架構(gòu)之術(shù)(大數(shù)據(jù)處理的基本原理和技術(shù)方法),進(jìn)而討論大數(shù)據(jù)架構(gòu)之器(具體軟件工具的功能、設(shè)計(jì)、實(shí)現(xiàn)以及使用方法),建立大數(shù)據(jù)架構(gòu)教
本書以項(xiàng)目實(shí)踐作為主線,結(jié)合必需的理論知識,以任務(wù)的形式設(shè)計(jì)內(nèi)容,每個(gè)任務(wù)都包含任務(wù)描述及任務(wù)實(shí)施的步驟,讀者按照實(shí)施步驟進(jìn)行操作就可以完成相應(yīng)的學(xué)習(xí)任務(wù),從而不斷提升項(xiàng)目實(shí)踐能力。本書主要內(nèi)容涉及流式數(shù)據(jù)的基礎(chǔ)知識、Flink的簡介及發(fā)展歷史、Flink的系統(tǒng)架構(gòu)及FlinkAPI介紹、Flink的集群部署模式、Fl
《智能控制》(第2版)(ISBN為9787302581611)是全國工程碩士專業(yè)學(xué)位教育指導(dǎo)委員會(huì)推薦教材,全面涵蓋模糊控制、神經(jīng)控制、專家控制、仿人智能控制、遞階智能控制、學(xué)習(xí)控制、**智能控制及其工程應(yīng)用實(shí)例。本書配套于該教材,為智能控制研究生課程教學(xué)提供全面而系統(tǒng)的教學(xué)設(shè)計(jì)與指導(dǎo),包括學(xué)習(xí)理論、指導(dǎo)教學(xué)的系統(tǒng)科學(xué)