本書聚焦通用人工智能的學科內(nèi)涵與發(fā)展趨勢,以一套基于能力與價值雙系統(tǒng)的通用人工智能認知架構(gòu)與測試模式為核心,梳理形成一個定義、兩個完備性、三個特征、八個關(guān)鍵問題的理論框架。
本書共6章,從人工智能的歷史、內(nèi)涵與哲學基礎(chǔ)切入,依次介紹通用人工智能的定義與特征、測試與評級、訓練與測試平臺,以及TongAI理論框架,最后給出對發(fā)展通用人工智能的建議。本書既有助于科技領(lǐng)域的管理者和投資者提綱挈領(lǐng),把握前瞻性科技目標,也可為專業(yè)研究人員提供通用人工智能標準、評級、測試、架構(gòu)的參照系與發(fā)展指南。同時,本書還可供希望了解通用人工智能基本概念與關(guān)鍵問題的大眾讀者參考。
1. 聚焦通用人工智能基礎(chǔ)理論的著作,以一套基于"能力與價值雙系統(tǒng)"的通用人工智能認知架構(gòu)與測試模式為核心,戰(zhàn)略意義重大;
2. 系統(tǒng)給出通用人工智能的目標、理論架構(gòu)、發(fā)展路徑,以及測試與評級標準,"一個定義、兩個完備性、三個特征、八個關(guān)鍵問題"的理論框架,極具實踐價值;
3. 作者朱松純是全球人工智能科學家,該領(lǐng)域的全球主要推動者之一,凝聚北京通用人工智能研究院成立四年以來研究成果精華,創(chuàng)新價值高。
朱松純,北京通用人工智能研究院院長,北京大學人工智能研究院院長、智能學院院長,清華大學與北京大學講席教授。曾三次問鼎計算機視覺領(lǐng)域國際最高獎項馬爾獎,也是斯隆獎、赫爾姆霍茨獎得主,兩次擔任國際計算機視覺與模式識別會議(CVPR)主席。長期致力于構(gòu)建計算機視覺、認知科學乃至人工智能科學的統(tǒng)一數(shù)理框架。 彭玉佳,美國加利福尼亞大學洛杉磯分校博士,北京大學心理與認知科學學院助理教授、人工智能研究院研究員,北京通用人工智能研究院研究員。入選第七屆中國科協(xié)青年人才托舉工程,承擔國家自然科學基金青年科學基金項目。任PsychologicalReview 和Journal of Anxiety Disorder 客座編輯,及Behaviour Research and Therapy和《心理科學》編委。主要研究領(lǐng)域為計算精神病學、認知神經(jīng)科學、社會認知和人工智能。 王亦洲,博士,北京大學博雅特聘教授、博士生導師,F(xiàn)任北京大學前沿計算研究中心副主任。主要研究領(lǐng)域為計算機視覺、人工智能、統(tǒng)計建模與計算、認知計算、醫(yī)學影像分析和計算藝術(shù)。 韓佳衡,研究生畢業(yè)于北京大學智能學院,獲理學碩士學位;本科畢業(yè)于北京大學信息科學技術(shù)學院計算機科學技術(shù)系,獲理學學士學位。曾在北京通用人工智能研究院前沿研究中心擔任實習研究助理,主要研究領(lǐng)域為通用人工智能評級與測試、情感計算等。
第1章 人工智能的歷史、內(nèi)涵與哲學基礎(chǔ) 1
1.1 智能是什么 1
1.1.1 智能的心理學定義與測量 2
1.1.2 智能現(xiàn)象 4
1.2 人工智能的歷史與發(fā)展趨勢 7
1.2.1 人工智能的早期探索與概念提出 8
1.2.2 人工智能發(fā)展的歷史階段 9
1.3 智能的學科內(nèi)涵 12
1.3.1 智能學科的基本定位與建設(shè)目標 12
1.3.2 智能學科與計算機學科的關(guān)系 15
1.3.3 人工智能與大數(shù)據(jù)、大算力、大模型的關(guān)系 17
1.3.4 智能的暗物質(zhì)與小數(shù)據(jù)、大任務(wù)范式 19
1.4 智能的哲學思想 23
1.4.1 從理到心:中國傳統(tǒng)哲學思想的啟示 23
1.4.2 智能研究的哲學思想轉(zhuǎn)變 26
第2章 通用人工智能的定義與特征 29
2.1 通用人工智能的定義 30
2.1.1 智能生物的心智空間 30
2.1.2 通用人工智能的停機問題與學習極限問題 37
2.2 通用人工智能的兩個完備性 41
2.2.1 認知架構(gòu)完備性 41
2.2.2 測試環(huán)境完備性 42
2.3 通用人工智能的3個基本特征 43
2.3.1 無限任務(wù) 43
2.3.2 自主生成任務(wù) 44
2.3.3 價值驅(qū)動 45
2.4 通用人工智能的8個關(guān)鍵問題 50
2.5 大模型是不是通用人工智能 58
2.5.1 大模型的特點 58
2.5.2 大模型相關(guān)評論與測試研究 62
第3章 通用人工智能測試與評級 73
3.1 經(jīng)典人工智能測評方法與局限性 74
3.1.1 人類鑒別測試 74
3.1.2 基于數(shù)據(jù)集任務(wù)導向的基準測試 82
3.1.3 基于虛擬環(huán)境的任務(wù)導向基準測試 83
3.1.4 新型測試體系:探索人工智能的能力維度 85
3.1.5 測試體系的應(yīng)用:工業(yè)生產(chǎn)中的智能評價體系 87
3.2 通用人工智能定義、評級與測試的現(xiàn)狀及比較 91
3.2.1 通用人工智能定義的比較 91
3.2.2 通用人工智能評級的比較 93
3.2.3 通用人工智能測試的比較 95
3.3 人類智能發(fā)展對通用人工智能測試的啟示 101
3.3.1 智力理論與發(fā)展階段 102
3.3.2 智力測試與兒童智力測驗 104
3.3.3 經(jīng)典兒童能力測驗中的實驗任務(wù) 112
3.4 構(gòu)建通用人工智能評測系統(tǒng) 121
3.4.1 通智測試的整體設(shè)計思路 121
3.4.2 動態(tài)具身物理社會交互環(huán)境 124
3.4.3 無限任務(wù)生成系統(tǒng) 131
3.4.4 基于能力與價值雙系統(tǒng)的評級框架 138
3.4.5 以四論為標準闡釋基于能力與價值雙系統(tǒng)的評級
框架 149
第4章 通用人工智能訓練與測試平臺 161
4.1 測試環(huán)境的完備性 162
4.2 具身智能體仿真平臺的現(xiàn)狀與挑戰(zhàn) 163
4.2.1 具身智能體仿真平臺 164
4.2.2 機器人底層控制仿真平臺 170
4.2.3 現(xiàn)有具身智能體仿真平臺的局限性 174
4.3 通用人工智能訓練與測試平臺:機器人仿真 175
4.3.1 自主生成無限場景 176
4.3.2 機器人場景理解 177
4.3.3 任務(wù)與運動規(guī)則 179
4.3.4 多模態(tài)交互接口 182
4.4 通用人工智能訓練與測試平臺:虛擬人仿真 184
4.4.1 訓練數(shù)據(jù)離線生成 184
4.4.2 虛擬人感知與執(zhí)行 185
4.4.3 物理仿真組件 187
4.4.4 平臺接口 188
4.5 通用人工智能評測實踐:通用-專項-行業(yè)應(yīng)用 190
4.5.1 通用能力測試 191
4.5.2 專項能力測試 204
4.5.3 行業(yè)應(yīng)用能力測試 227
第5章 TongAI理論框架:通用人工智能的一種實現(xiàn)途徑 243
5.1 為機器立心 243
5.2 認知架構(gòu):通用人工智能的表示框架 245
5.3 認知-能力-價值框架體系 248
5.3.1 CUV框架體系概覽 248
5.3.2 認知-能力-價值框架體系的理論構(gòu)建 251
5.3.3 價值體系構(gòu)建 263
5.3.4 CUV體系的同步迭代與演化 275
5.4 通信式學習:基于認知架構(gòu)的統(tǒng)一學習模式 278
5.4.1 通信理論基礎(chǔ) 278
5.4.2 認知架構(gòu)的擴展 279
5.4.3 通信式學習 281
5.5 倫理道德與信任的形成 285
第6章 通用人工智能安全與治理 291
6.1 通用人工智能發(fā)展對人類和社會的影響 292
6.1.1 人類正邁向智能時代 292
6.1.2 智能時代的風險與挑戰(zhàn) 294
6.1.3 智能時代的使命 299
6.2 人工智能安全框架 303
6.2.1 可控性和安全性設(shè)計原則 304
6.2.2 模型安全評測 306
6.2.3 人工智能對齊:讓AI與人類心有靈犀 315
6.2.4 人工智能對齊技術(shù):如何讓AI學會聽話 323
6.2.5 人工智能對齊驗證與確認:確保AI言行一致 329
6.2.6 價值對齊:讓AI成為社會的好公民 334
6.3 人機共生:探索中國式AGI安全治理 339
6.3.1 為天地立心:社會模擬探索AGI的社會尺度 340
6.3.2 CUV體系輔助AGI治理:構(gòu)建并引領(lǐng)人機共生的
新文明 342
參考文獻 347