本書闡述詞法分析、文本分類、文本聚類、文本檢索、垃圾郵件過濾、情感分析、個性化推薦等文本分析與文本挖掘方面的理論方法。人工智能技術(shù)與互聯(lián)網(wǎng)的發(fā)展更是為該領(lǐng)域研究提出新的需求,書中相關(guān)理論和技術(shù)可以直接用于解決具體文本分析與文本挖掘的問題,也可以為進一步研究提供理論方法基礎(chǔ)。本書包括理論、技術(shù),既適合理論方法的學習,又適
“大數(shù)據(jù)”近年成為IT領(lǐng)域的熱點話題,人們每天都會通過互聯(lián)網(wǎng)、移動設(shè)備等產(chǎn)生大量數(shù)據(jù)。如何管理大數(shù)據(jù)、掌握大數(shù)據(jù)的核心技術(shù)、理解大數(shù)據(jù)相關(guān)的生態(tài)系統(tǒng)等,是作為大數(shù)據(jù)開發(fā)者必須學習和熟練掌握的。本系列書以“大數(shù)據(jù)開發(fā)者”應(yīng)掌握的技術(shù)為主線,共分兩卷,以7個模塊分別介紹如何管理大數(shù)據(jù)生態(tài)系統(tǒng)、如何存儲和處理數(shù)據(jù)、如何利用H
大數(shù)據(jù)管理與應(yīng)用主要以信息科學、計算機科學和管理科學等學科為理論基礎(chǔ),其研究內(nèi)容包括大數(shù)據(jù)科學基礎(chǔ)理論、大數(shù)據(jù)預(yù)處理、大數(shù)據(jù)計算、大數(shù)據(jù)管理和分析等。本書力圖通過對大數(shù)據(jù)科學相關(guān)數(shù)據(jù)管理方面內(nèi)容的綜合介紹,面向大數(shù)據(jù)時代的電子商務(wù)智能數(shù)據(jù)計算領(lǐng)域,從大數(shù)據(jù)采集、大數(shù)據(jù)預(yù)處理、大數(shù)據(jù)存儲與計算、多源異構(gòu)大數(shù)據(jù)分析、大數(shù)據(jù)
本書結(jié)合作者在大數(shù)據(jù)安全與隱私保護領(lǐng)域的科研實踐,提出大數(shù)據(jù)安全與隱私保護理論基礎(chǔ)和技術(shù)體系框架,并對大數(shù)據(jù)安全與隱私保護面臨的主要問題進行系統(tǒng)性闡述。本書重點介紹安全檢索技術(shù)、隱私保護技術(shù)、安全存儲與訪問控制技術(shù),以及安全處理技術(shù),從技術(shù)核心貢獻、領(lǐng)域發(fā)展綜述和最新研究進展等不同角度進行闡述,有助于感興趣的讀者較為全
本書以10堂課的形式全面、系統(tǒng)地對工業(yè)控制系統(tǒng)信息安全進行介紹。其中,第一堂課介紹工業(yè)控制系統(tǒng)信息安全概況,主要包括典型工業(yè)控制信息安全事件回顧、威脅分析、概念解析、基本需求、發(fā)展趨勢等;第二堂課闡述工業(yè)控制系統(tǒng)信息安全標準體系;第三堂課介紹工業(yè)控制系統(tǒng)架構(gòu)與漏洞分析;第四堂課至第八堂課是工業(yè)控制系統(tǒng)信息安全的技術(shù)部分
隨著工業(yè)生產(chǎn)過程變得越來越復(fù)雜,對非線性控制系統(tǒng)的研究正逐漸成為熱點和難點。《非線性算子控制及其應(yīng)用》以半導(dǎo)體制冷系統(tǒng)和液位系統(tǒng)為主要控制對象,詳細介紹了基于算子理論的非線性控制系統(tǒng)設(shè)計,既包括算子的定義、系統(tǒng)建模、控制器設(shè)計等主要內(nèi)容,也對故障診斷和優(yōu)化控制等關(guān)鍵問題進行了系統(tǒng)地探討!斗蔷性算子控制及其應(yīng)用》可作為
大數(shù)據(jù)和人工智能是今天計算機學科的兩個重要的分支。近年來,有關(guān)大數(shù)據(jù)和人工智能這兩個領(lǐng)域所進行的研究一直從未間斷。《大數(shù)據(jù)與人工智能研究》從大數(shù)據(jù)技術(shù)的發(fā)展出發(fā),分析了大數(shù)據(jù)依靠人工智能技術(shù)的發(fā)展前景。其次,分析了人工智能的發(fā)展也必須依托大數(shù)據(jù)技術(shù),需要大數(shù)據(jù)進行支撐。*后描述了大數(shù)據(jù)時代背景下未來人工智能會有哪些創(chuàng)新
本書提出采用對等計算模式組織分布式時空索引的建立,主要從節(jié)點同構(gòu)和異構(gòu)兩個角度出發(fā),并結(jié)合用戶的時空查詢類型,從面向歷史查詢、面向?qū)眍A(yù)測查詢和面向描述時空信息的數(shù)據(jù)的查詢出發(fā),研究設(shè)計查詢性能良好、更新能力穩(wěn)定、支持半結(jié)構(gòu)化描述查詢的分布式時空索引機制。
本書共8章,具體內(nèi)容包括:數(shù)據(jù)與大數(shù)據(jù)、大數(shù)據(jù)感知與獲取、大數(shù)據(jù)處理、大數(shù)據(jù)分析、大數(shù)治理、大數(shù)據(jù)安全與隱私及大數(shù)據(jù)行業(yè)應(yīng)用。本書既可共高校相關(guān)專業(yè)教學使用,也可供大數(shù)據(jù)領(lǐng)域工程師或者有志于大數(shù)據(jù)領(lǐng)域工作或研究的科技人員使用。
本書作者比爾·錢伯斯和馬太·扎哈里亞在強調(diào)Spark2.0的改進和新功能的同時,將Spark題分為不同的部分,每個部分都有其獨特的目標。你將探索Spark的結(jié)構(gòu)化API的基本操作和常見功能以及StructuredStreaming,后者是用于構(gòu)建端到端流應(yīng)用的一種全新的高層API。開發(fā)人員和系統(tǒng)管理員會學Spark監(jiān)控