本書基礎理論和案例分析相結合,全面介紹了大數(shù)據(jù)技術的基礎知識,以提升讀者對大數(shù)據(jù)的認知。全書共11章,內容包括大數(shù)據(jù)概述、大數(shù)據(jù)時代的思維變革、大數(shù)據(jù)的采集與存儲、數(shù)據(jù)可視化、支撐大數(shù)據(jù)的技術、商業(yè)大數(shù)據(jù)、民生大數(shù)據(jù)、工業(yè)大數(shù)據(jù)、政務大數(shù)據(jù)、安全大數(shù)據(jù)和大數(shù)據(jù)的未來。本書既可作為全國高等學校計算機及相關專業(yè)“大數(shù)據(jù)導論
《精通Hadoop3》詳細闡述了與Hadoop3相關的基礎知識,主要包括Hadoop3簡介、深入理解Hadoop分布式文件系統(tǒng)、YARN資源管理器、MapReduce內部機制、Hadoop中的SQL、實時處理引擎、Hadoop生態(tài)圈組件、定義Hadoop中的應用程序、Hadoop中的實時流處理、Hadoop中的機器學習
本書是大數(shù)據(jù)教育系列教材之一。本書的主要內容包括:認識大數(shù)據(jù)、大數(shù)據(jù)技術基礎、大數(shù)據(jù)治理、大數(shù)據(jù)統(tǒng)計分析、數(shù)據(jù)挖掘、大數(shù)據(jù)可視化、大數(shù)據(jù)安全、大數(shù)據(jù)應用案例實操(零售、互聯(lián)網(wǎng)、金融保險、制造、網(wǎng)絡游戲、廣告、旅游等)等。本書編寫是以國運數(shù)據(jù)自主研發(fā)的大數(shù)據(jù)分析工具——“魔鏡”為平臺,理論結合實踐,通過具體案例介紹如何進
數(shù)據(jù)分析是指用適當?shù)臄?shù)學方法對收集來的大量數(shù)據(jù)進行分析,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用信息和形成結論而對數(shù)據(jù)加以詳細研究及概括總結的過程。數(shù)據(jù)分析的目的在于把隱藏在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來。 數(shù)據(jù)科學是高等學校非計算機專業(yè)本科學生必修的一門公共基礎課程,
保障和促進“新基建”的健康發(fā)展,重點在于建立健全以數(shù)據(jù)為中心的治理法治化架構與體系。本書緊緊圍繞新基建與數(shù)據(jù)治理法治化的各方面展開,主要論及新基建與數(shù)據(jù)權屬治理、數(shù)據(jù)競爭治理、數(shù)據(jù)綠色治理、數(shù)據(jù)跨境流動治理、數(shù)據(jù)安全發(fā)展治理等方面的現(xiàn)實問題與潛在風險,在此基礎上提出了相應對策和治理方案。
本書沿著時間的軌跡,講述了物理世界中宇宙和地球的誕生與演變,探討了生物世界中生命和人類的誕生與進化,討論了數(shù)字世界中科學技術的產(chǎn)生與進步。數(shù)據(jù)與物質和能量并駕齊驅,構成了人類宇宙的三個基本要素,并以此為基礎建立了物理、生物和數(shù)字三個各有千秋卻密切相連的世界!叭齻世界”的概念和框架構成了本書討論數(shù)據(jù)智能的基礎,為認識、
《數(shù)據(jù)挖掘原理(第4版)》解釋、探索了數(shù)據(jù)挖掘的主要技術,可以從數(shù)據(jù)中自動提取隱式和潛在有用的信息。數(shù)據(jù)挖掘越來越多地用于商業(yè)、科學和其他應用領域,它側重于分類、關聯(lián)規(guī)則挖掘和聚類。書中對每個主題都進行了清晰的解釋,重點是算法而不是數(shù)學公式,并通過詳細的有效示例加以說明。本書是為沒有強數(shù)學或統(tǒng)計學背景的讀者寫的,并詳細
本書理論聯(lián)系實際,配以大量實例,系統(tǒng)地介紹了大數(shù)據(jù)有關的基礎知識。全書共分10章,內容包括大數(shù)據(jù)概述,大數(shù)據(jù)、云計算與物聯(lián)網(wǎng),大數(shù)據(jù)架構與Hadoop,數(shù)據(jù)采集與預處理,大數(shù)據(jù)分析與大數(shù)據(jù)挖掘,數(shù)據(jù)存儲與HDFS,MapReduce,數(shù)據(jù)可視化,大數(shù)據(jù)安全,大數(shù)據(jù)應用案例。本書主要作為本科和高職高專相關專業(yè)的教材,也可
大數(shù)據(jù)分析與挖掘已經(jīng)廣泛應用于各行各業(yè)。本書以項目實踐為基礎,對大數(shù)據(jù)分析與挖掘的基礎知識進行了介紹,總結了機器學習、大數(shù)據(jù)分析與挖掘過程、數(shù)據(jù)分析挖掘框架和庫,分析了當前的研究熱點與前沿技術。為了增強本書的實用性、提高讀者的動手能力,本書結合案例討論了爬蟲與數(shù)據(jù)處理、Echarts和Python可視化、描述性分析、并
本書系統(tǒng)介紹數(shù)據(jù)科學的核心概念、基本方法和關鍵技術,內容涵蓋數(shù)據(jù)科學的導向目標,涉及科學計算、數(shù)據(jù)處理和分析、數(shù)據(jù)可視化等關鍵知識環(huán)節(jié)。本書基于Python技術框架實現(xiàn),內容注重理論和實踐的有機融合,克服單調、晦澀的知識累積之苦,以問題為導向,學以致用,提供了大量的案例代碼和樣本數(shù)據(jù)集,可以為學習者平添幾分學習的樂趣。