圖書(shū)館資源組織語(yǔ)義化理論及方法研究
定 價(jià):58 元
叢書(shū)名:國(guó)家社會(huì)科學(xué)基金項(xiàng)目“圖書(shū)館資源組織語(yǔ)義化理論及方法研究”組織
當(dāng)前圖書(shū)已被 4 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者:劉耀 著
- 出版時(shí)間:2018/2/1
- ISBN:9787518936427
- 出 版 社:科學(xué)技術(shù)文獻(xiàn)出版社
- 中圖法分類(lèi):G253.5
- 頁(yè)碼:185
- 紙張:膠版紙
- 版次:1
- 開(kāi)本:16開(kāi)
圖書(shū)館資源組織語(yǔ)義化是圖書(shū)館資源語(yǔ)義標(biāo)注的淺層標(biāo)注,是內(nèi)容語(yǔ)義化與形式語(yǔ)義化交互實(shí)現(xiàn)的過(guò)程!秷D書(shū)館資源組織語(yǔ)義化理論及方法研究》在借鑒國(guó)內(nèi)外研究成果的前提下,提出了形式語(yǔ)義化與內(nèi)容語(yǔ)義化交互的資源組織語(yǔ)義化理論與技術(shù)方案。在整體上以“原理方法、技術(shù)實(shí)現(xiàn)、案例應(yīng)用”為結(jié)構(gòu)體例,以“技術(shù)工具化、工具業(yè)務(wù)化、業(yè)務(wù)自動(dòng)化”為目標(biāo),詳細(xì)闡述了圖書(shū)館資源組織語(yǔ)義化涉及的資源獲取、資源解析、數(shù)據(jù)交換、資源加工、資源結(jié)構(gòu)化、本體構(gòu)建、語(yǔ)義標(biāo)注等關(guān)鍵技術(shù)的原理、流程及方法,并以真實(shí)的行業(yè)領(lǐng)域應(yīng)用案例闡述了實(shí)現(xiàn)資源組織語(yǔ)義化的全過(guò)程,以便讀者能夠從理論和實(shí)踐兩個(gè)方面理解相關(guān)思想及方法,達(dá)到既能掌握知識(shí)又能運(yùn)用技術(shù)進(jìn)行資源組織語(yǔ)義化實(shí)踐的目標(biāo)。
光陰荏苒,我在中國(guó)科學(xué)技術(shù)信息研究所工作已有10年光景。2007年,我從北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所博士后出站,之后一直從事自然語(yǔ)言處理、知識(shí)組織與知識(shí)工程相關(guān)的工作。多年在一線(xiàn)進(jìn)行研究與實(shí)踐工作,一路走來(lái)積累了豐富的經(jīng)驗(yàn),在不斷迭代和升華中,逐漸形成了一套完整的覆蓋資源獲取、資源加工到知識(shí)服務(wù)全流程的思想理論。在該理論思想的指導(dǎo)下,圍繞著技術(shù)目標(biāo),我領(lǐng)導(dǎo)團(tuán)隊(duì)逐步開(kāi)展工程實(shí)踐研究,對(duì)理論方法進(jìn)行驗(yàn)證。同時(shí),根據(jù)工程實(shí)踐中的具體問(wèn)題,進(jìn)行關(guān)鍵技術(shù)攻關(guān),對(duì)其中的一些流程、步驟、細(xì)節(jié)等進(jìn)行了微調(diào)和補(bǔ)充,不斷升級(jí)與完善PYROIS系統(tǒng)。PYROIS系統(tǒng)初建于2007年,2011年年初,PYROIS系統(tǒng)1.0版本上線(xiàn),目前該系統(tǒng)3.0版本已研發(fā)完成。
我在很早之前就有想要寫(xiě)這本書(shū)的想法,分享研究實(shí)踐中的一些想法和體會(huì),為從事相關(guān)研究的人員提供一些思路、方法和參考,但一直沒(méi)有時(shí)間。其間,也陸陸續(xù)續(xù)地發(fā)表了一些研究論文,但沒(méi)有進(jìn)行系統(tǒng)性闡述。PYROIS系統(tǒng)3.O版上線(xiàn)之后,空閑時(shí)間較以前也多了些,我便抓緊時(shí)間完成了早已有的寫(xiě)書(shū)的想法。
本書(shū)的主要思想是利用自然語(yǔ)言處理技術(shù)和機(jī)器學(xué)習(xí)方法對(duì)已有的公認(rèn)領(lǐng)域知識(shí)進(jìn)行重構(gòu)并加以利用;在構(gòu)建領(lǐng)域本體的基礎(chǔ)上,對(duì)相關(guān)文獻(xiàn)進(jìn)行語(yǔ)義標(biāo)注;并在大量?jī)?nèi)容相對(duì)語(yǔ)義化的基礎(chǔ)上,結(jié)合傳統(tǒng)組織資源,通過(guò)機(jī)器學(xué)習(xí)等方法,生成初始語(yǔ)義元數(shù)據(jù);然后,在輔助平臺(tái)的幫助下,實(shí)現(xiàn)圖書(shū)館資源組織語(yǔ)義化過(guò)程與語(yǔ)義元數(shù)據(jù)體系構(gòu)建同步進(jìn)行,將語(yǔ)義標(biāo)注文獻(xiàn)與語(yǔ)義索引分別存儲(chǔ),實(shí)現(xiàn)圖書(shū)館資源組織語(yǔ)義化。
在思想理論指導(dǎo)及技術(shù)目標(biāo)的驅(qū)動(dòng)下,相關(guān)研究及實(shí)踐工作體現(xiàn)在以下幾個(gè)方面。
知識(shí)元數(shù)據(jù)庫(kù)構(gòu)建技術(shù)。從充分開(kāi)發(fā)和利用百科全書(shū)資源的角度出發(fā),利用自然語(yǔ)言處理技術(shù)和語(yǔ)言分析工具分析百科全書(shū)資源,發(fā)現(xiàn)其中隱含的知識(shí)點(diǎn)及其之間的內(nèi)在關(guān)聯(lián),將大量的、不斷出現(xiàn)的知識(shí)點(diǎn)結(jié)構(gòu)化地組織和關(guān)聯(lián)起來(lái),構(gòu)成智能連接的網(wǎng)狀圖,建立知識(shí)元數(shù)據(jù)庫(kù)。
語(yǔ)義元數(shù)據(jù)構(gòu)建與標(biāo)注一體化技術(shù)。將圖書(shū)館資源組織語(yǔ)義化看作圖書(shū)館資源語(yǔ)義標(biāo)注的淺層標(biāo)注,是內(nèi)容語(yǔ)義化與形式語(yǔ)義化交互實(shí)現(xiàn)的過(guò)程,基于NIP理論與方法,結(jié)合傳統(tǒng)圖書(shū)館資源組織方式與領(lǐng)域本體構(gòu)建技術(shù),搭建輔助構(gòu)建及標(biāo)注一體化平臺(tái),實(shí)現(xiàn)語(yǔ)義元數(shù)據(jù)體系構(gòu)建與資源組織語(yǔ)義化過(guò)程同步實(shí)施。
領(lǐng)域本體自動(dòng)構(gòu)建技術(shù)。通過(guò)領(lǐng)域本體構(gòu)建、語(yǔ)義標(biāo)注等信息技術(shù)的融合與集成,將行業(yè)領(lǐng)域知識(shí)合理分類(lèi),構(gòu)建以知識(shí)點(diǎn)為基本單元的圖書(shū)、期刊、專(zhuān)利數(shù)據(jù)庫(kù),以智能檢索、知識(shí)語(yǔ)義導(dǎo)航、可視化等方式為科學(xué)研究、技術(shù)開(kāi)發(fā)、工程設(shè)計(jì)、工程應(yīng)用的開(kāi)展提供知識(shí)服務(wù),實(shí)現(xiàn)知識(shí)的共享與重用。
一體化爬蟲(chóng)技術(shù)。針對(duì)語(yǔ)義爬蟲(chóng)存在的不足,實(shí)現(xiàn)從一個(gè)概念出發(fā),自動(dòng)生成語(yǔ)義結(jié)構(gòu),用該語(yǔ)義結(jié)構(gòu)指導(dǎo)爬蟲(chóng)抓取數(shù)據(jù)資源;同時(shí),在爬蟲(chóng)爬行過(guò)程中,不斷從數(shù)據(jù)庫(kù)中抽取相關(guān)的概念及其之間的關(guān)系,并填充進(jìn)語(yǔ)義結(jié)構(gòu),實(shí)現(xiàn)語(yǔ)義結(jié)構(gòu)進(jìn)化和爬蟲(chóng)爬行迭代一體化。
劉耀,博士,中國(guó)科學(xué)技術(shù)信息研究所研究員;國(guó)家科技信息資源綜合利用與公共服務(wù)中心副主任:北京大學(xué)信息管理系管理學(xué)博士:北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所出站博士后;中國(guó)社會(huì)科學(xué)情報(bào)學(xué)會(huì)理事會(huì)常務(wù)理事、副秘書(shū)長(zhǎng):中國(guó)計(jì)算機(jī)學(xué)會(huì)杰出會(huì)員:北京大學(xué)軟件與微電子學(xué)院外聘碩士研究生導(dǎo)師;主要從事自然語(yǔ)言處理、知識(shí)工程方向研究。先后發(fā)表學(xué)術(shù)論文80余篇,出版學(xué)術(shù)著作5部,主編、副主編教材各1部,參編著作6部;先后主持、參加完成包括國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家科技支撐計(jì)劃、國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973)、國(guó)家社會(huì)科學(xué)基金在內(nèi)的科研項(xiàng)目30余項(xiàng)(主持10余項(xiàng));獲省部級(jí)獎(jiǎng)勵(lì)5項(xiàng)、行業(yè)及協(xié)會(huì)獎(jiǎng)5項(xiàng),申請(qǐng)發(fā)明專(zhuān)利3項(xiàng),申請(qǐng)軟件著作權(quán)20余項(xiàng)。
1 緒論
1.1 研究意義
1.2 研究思路
1.3 研究?jī)?nèi)容
1.4 關(guān)鍵問(wèn)題
1.5 創(chuàng)新之處
1.6 撰寫(xiě)思路
1.7 本章小結(jié)
2 多資源融合
2.1 資源獲取
2.1.1 網(wǎng)絡(luò)資源獲取
2.1.2 數(shù)據(jù)庫(kù)資源獲取
2.1.3 本地資源獲取
2.2 資源解析
2.2.1 多種資源類(lèi)型解析
2.2.2 多模態(tài)資源的解析
2.3 數(shù)據(jù)交換
2.3.1 數(shù)據(jù)交換技術(shù)
2.3.2 標(biāo)準(zhǔn)化體系建設(shè)
2.4 資源存儲(chǔ)
2.5 本章小結(jié)
3 資源加工與結(jié)構(gòu)化
3.1 占構(gòu)化語(yǔ)料加工
3.1.1 詞性標(biāo)注及消歧
3.1.2 詞性標(biāo)注及消歧的主要功能
3.1.3 句法自動(dòng)標(biāo)注
3.1.4 語(yǔ)義角色自動(dòng)標(biāo)注
3.1.5 文本分割
3.1.6 句間及段落關(guān)系標(biāo)注
3.2 結(jié)構(gòu)化詞表構(gòu)建
3.2.1 專(zhuān)業(yè)詞典構(gòu)建
3.2.2 語(yǔ)義詞典構(gòu)建
3.2.3 概念詞表構(gòu)建
3.2.4 同義詞表構(gòu)建
3.3 定制化處理
3.3.1 基本原理
3.3.2 模型構(gòu)建
3.3.3 實(shí)驗(yàn)與結(jié)果分析
3.4 本章小結(jié)
4 本體構(gòu)建技術(shù)
4.1 相關(guān)理論
4.2 總體框架
4.2.1 基礎(chǔ)流程
4.2.2 擴(kuò)充流程
4.3 模型構(gòu)建
4.3.1 樹(shù)狀結(jié)構(gòu)到多層嵌套網(wǎng)狀結(jié)構(gòu)
4.3.2 文獻(xiàn)檢索到專(zhuān)家系統(tǒng)
4.3.3 自然語(yǔ)言描述到主題詞描述
4.4 概念獲取
4.4.1 基本思想
4.4.2 技術(shù)實(shí)現(xiàn)
4.4.3 實(shí)驗(yàn)與結(jié)果分析
4.5 屬性獲取
4.5.1 基本思想
4.5.2 技術(shù)實(shí)現(xiàn)
4.5.3 實(shí)驗(yàn)與結(jié)果分析
4.6 關(guān)系獲取
4.6.1 基本思想
4.6.2 技術(shù)實(shí)現(xiàn)
4.6.3 實(shí)驗(yàn)與結(jié)果分析
4.7 本章小結(jié)
5 語(yǔ)義資源生成與標(biāo)注一體化
5.1 語(yǔ)義資源生成
5.1.1 基于種子文件
5.1.2 基于本體結(jié)構(gòu)與語(yǔ)料
5.2 語(yǔ)義標(biāo)注
5.2.1 技術(shù)框架與思路
5.2.2 語(yǔ)義標(biāo)注算法
5.2.3 實(shí)驗(yàn)與結(jié)果分析
5.3 語(yǔ)義資源評(píng)價(jià)
5.3.1 概念覆蓋程度評(píng)價(jià)
5.3.2 屬性完整性評(píng)價(jià)
5.3.3 語(yǔ)義關(guān)系復(fù)雜度評(píng)價(jià)
5.4 本章小結(jié)
6 應(yīng)用案例研究
6.1 雷達(dá)語(yǔ)義資源生成與標(biāo)注一體化
6.1.1 目標(biāo)與要求
6.1.2 分析與構(gòu)建
6.1.3 構(gòu)建結(jié)果
6.1.4 拓展應(yīng)用
6.2 面向技術(shù)創(chuàng)新的鋁行業(yè)資源組織語(yǔ)義化
6.2.1 目標(biāo)與需求
6.2.2 分析與構(gòu)建
6.2.3 構(gòu)建結(jié)果
6.2.4 應(yīng)用服務(wù)
6.3 本章小結(jié)
參考文獻(xiàn)