網(wǎng)絡(luò)信息采集加工與應(yīng)用技術(shù)
定 價:98 元
當前圖書已被 1 所學校薦購過!
查看明細
- 作者:尹寶生著
- 出版時間:2024/1/1
- ISBN:9787559133458
- 出 版 社:遼寧科學技術(shù)出版社
- 中圖法分類:TP393.07
- 頁碼:325頁
- 紙張:
- 版次:1
- 開本:26cm
本書重點介紹了網(wǎng)絡(luò)信息采集的主要技術(shù)方法、信息加工的主要技術(shù)以及信息應(yīng)用具體實踐等內(nèi)容。其中的信息采集部分主要介紹了基于RSS訂閱、網(wǎng)絡(luò)爬蟲、網(wǎng)站API、物聯(lián)網(wǎng)傳感器、問答大模型等信息采集方式,以及信源發(fā)現(xiàn)技術(shù)、主題采集技術(shù)、定點采集技術(shù)和常用采集工具等;信息加工部分主要介紹了時間信息識別與標準化技術(shù)、實體關(guān)系分類技術(shù)、文本摘要生成技術(shù)、事件抽取技術(shù)、文獻聚類技術(shù)、技術(shù)脈絡(luò)分析技術(shù)等;信息應(yīng)用部分主要介紹了信息推薦技術(shù)、信息采集平臺的構(gòu)建以及知識管理平臺的構(gòu)建等。
第一部分信息采集技術(shù)
1互聯(lián)網(wǎng)信息資源的值
2網(wǎng)絡(luò)信息采集的主要方式
2.1基于RSS 訂閱的信息采集
2.2基于網(wǎng)絡(luò)爬蟲的信息采集
2.3基于網(wǎng)站API的信息采集
2.4基于物聯(lián)網(wǎng)傳感器的信息采集
2.5基于問答大模型的信息采集
3網(wǎng)絡(luò)信息采集的主要技術(shù)
3.1定點采集技術(shù)
3.2主題采集技術(shù)
3.3采集技術(shù)
3.4實時流數(shù)據(jù)采集技術(shù)
4網(wǎng)絡(luò)信息采集的主要工具
4.1 Scrapy
4.2BeautifulSoup
4.3Selenium
4.4PySpider
4.pache Nutch
4.6Goutte
4.7Crawlera
4.8Apify
4.9Octoparse
4.10Import. io
4.11Content Grabber
4.12ParseHub
4.13WebHarvy
5基于網(wǎng)站特征分析的信源發(fā)現(xiàn)技術(shù)
5.1問題的提出及相關(guān)研究
5.2網(wǎng)站特征分析及數(shù)據(jù)處理
5.3基于網(wǎng)站特征分析的相關(guān)度計算
5.4信源發(fā)現(xiàn)技術(shù)系統(tǒng)設(shè)計與實現(xiàn)
5.5研究結(jié)論
延伸閱讀
……
第二部分信息加工技術(shù)
第三部分信息應(yīng)用技術(shù)