本書的編寫目的是向讀者介紹大數(shù)據(jù)分析的基本概念和相應的技術應用。全書共10章,分別介紹大數(shù)據(jù)概述、爬蟲和大數(shù)據(jù)相關技術、Scrapy爬蟲、Python與MySQL數(shù)據(jù)庫連接與查詢、數(shù)據(jù)可視化基礎與應用、大數(shù)據(jù)存儲與清洗、數(shù)據(jù)格式與編碼技術、數(shù)據(jù)抽取與采集、pandas數(shù)據(jù)分析與清洗以及綜合實訓。本書將理論與實踐操作相結
本書為電氣化鐵路變電所預應力混凝土圓桿(TBT2824-2008)的英文譯本CircularPrestressedConcretePoleforSubstationofElectrifiedRailway。為國家鐵路局頒布的2022年第2批英文鐵標(共9種,國鐵科法[2022]10號文)的一種。本標準規(guī)定了電氣化鐵路變
本書系統(tǒng)地介紹了大數(shù)據(jù)的基礎知識和前沿技術。全書共8章,內(nèi)容包括大數(shù)據(jù)概述、大數(shù)據(jù)處理平臺Hadoop、數(shù)據(jù)采集與預處理、數(shù)據(jù)存儲與管理、數(shù)據(jù)處理與分析、數(shù)據(jù)可視化、大數(shù)據(jù)思維與安全、城市空氣質量大數(shù)據(jù)分析實戰(zhàn)。
為落實國家戰(zhàn)略,加速新一代信息技術人才培養(yǎng),滿足數(shù)字經(jīng)濟發(fā)展的人才需求,為實現(xiàn)經(jīng)濟高質量發(fā)展提供人才支撐,中國科協(xié)策劃并主編中國科協(xié)新一代信息技術系列叢書,中國自動化學會受中國科協(xié)委托組編《智能控制導論》一書。本書系統(tǒng)地闡述了主流的智能控制概念、框架、流程、方法、算法及典型案例,希望有助于讀者全面深入地了解智能控制理論
本書分為三篇,涵蓋11個項目。第一篇為概論篇,介紹了大數(shù)據(jù)導論、大數(shù)據(jù)中的數(shù)據(jù)庫等內(nèi)容;第二篇為分析篇,介紹了大數(shù)據(jù)采集、大數(shù)據(jù)預處理基礎、大數(shù)據(jù)預處理實施等內(nèi)容;第三篇為附錄篇,介紹了大數(shù)據(jù)中的統(tǒng)計學、大數(shù)據(jù)前沿等內(nèi)容。
本書分上下兩篇,上篇共9章,在介紹測量與儀表、誤差及其處理的基礎上,闡述溫度、壓力、流量、物位、機械量與成分等流程工業(yè)中主要參數(shù)的檢測原理、方法及相關的儀表;下篇共6章,介紹過程控制裝置及系統(tǒng)相關的知識。
本書以Scala作為開發(fā)Spark應用程序的編程語言,系統(tǒng)地介紹了Spark編程的基礎知識。全書共9章,內(nèi)容包括大數(shù)據(jù)技術概述、Scala語言基礎、Spark的設計與運行原理、Spark環(huán)境搭建和使用方法、RDD編程、SparkSQL、SparkStreaming、StructuredStreaming和SparkML
《分布式智能算法及在大數(shù)據(jù)中的應用》主要包括智能算法技術與大數(shù)據(jù)概述;基于Hadoop的分布式雜交水稻算法;基于Hadoop的隨機奇異值分解算法;基于Hadoop的分布式水波優(yōu)化算法;基于Spark的分布式關聯(lián)規(guī)則挖掘算法;基于Spark的分布式飛蛾撲火優(yōu)化算法;基于Spark的分布式蟻獅算法等內(nèi)容。本書既可以作為計算
數(shù)字經(jīng)濟時代,數(shù)據(jù)已經(jīng)成為國家的重要戰(zhàn)略資源,已經(jīng)成為國家核心競爭優(yōu)勢的關鍵要素。近年來,隨著數(shù)字經(jīng)濟的迅猛發(fā)展,數(shù)據(jù)的跨境流動規(guī)模呈指數(shù)量級增長,對全球經(jīng)濟的貢獻度也引人矚目?缇硵(shù)據(jù)流動已成為關系各國政治、經(jīng)濟、社會的核心議題。全球主要經(jīng)濟體已經(jīng)圍繞跨境數(shù)據(jù)流動所涉及的重要議題出臺規(guī)制方案,并積極參與國際規(guī)則制定。
本書以任務為導向,較為全面地介紹了Spark大數(shù)據(jù)技術的相關知識。全書共9章,具體內(nèi)容包括Spark概述、Scala基礎、Spark編程基礎、Spark編程進階、SparkSQL--結構化數(shù)據(jù)文件處理、SparkStreaming--實時計算框架、SparkGraphX--圖計算框架、SparkMLlib--功能強大的