昇騰AI處理器架構與編程-深入理解CANN技術原理及應用 華為智能計算機技術叢書 華為官方授權
定 價:69 元
叢書名:華為智能計算技術叢書
本書系統論述了基本達芬奇架構的昇騰(Asccnd)AI處理器的原理、架構與開發(fā)技術。全書共分6章,內容涵蓋了神經網絡理論基礎、計算芯片與開源框架、昇騰AI處理器軟硬件架構、編程理論與方法,以及典型案例等。為便于讀者學習,書中還給出了基本昇騰AI處理器的豐富的技術文檔、開發(fā)實例等線上資源。本書可以作為普通高等學校人工智能、智能科學與技術、計算機科學與技術、電子信息工程、自動化等專業(yè)的本科生及研究生教材,也適合作為從事人工智能系統設計的科研和工程技術人員的參考用書。
本書是華為公司官方出品!華為輪值董事長徐直軍、中國工程院院士高文、中國科學院院士毛軍發(fā)作序!揭開達芬奇架構AI處理器的神秘面紗、掌握強大算力的使用方法!昇騰Ascend AI處理器是業(yè)界領先的人工智能運算芯片,可以應用于未來的各類人工智能場景。本書由上海交大梁曉峣教授執(zhí)筆,華為公司一線技術支持,并提供了大量可以運行的算例。本書可以作為廣大AI工程師的參考用書,也可以作為高等學校人工智能、計算機等專業(yè)微處理器/微控制器/人工智能芯片等相關課程教材。視頻公開課: 愛課程或中國大學MOOC(慕課) 現代科學運算MATLAB語言與應用控制系統仿真與CAD(非嚴格配套本書視頻,僅供讀者參考)。配書源代碼: 配書源代碼可以到清華大學出版社網站本書頁面下載。薛定宇大講堂系列圖書將陸續(xù)出版:薛定宇教授大講堂(卷Ⅰ):MATLAB程序設計薛定宇教授大講堂(卷Ⅱ):MATLAB微積分運算薛定宇教授大講堂(卷Ⅲ):MATLAB線性代數運算薛定宇教授大講堂(卷Ⅳ):MATLAB*化計算薛定宇教授大講堂(卷Ⅴ):MATLAB微分方程求解薛定宇教授大講堂(卷Ⅵ):MATLAB/Simulink仿真
PREFACE
前言
日出東方,其道大光;鯤鵬展翅,旭日昇騰!一款芯片的研發(fā),是一個漫長的過程;一款芯片的研發(fā),也許就是一代人的心路歷程。隨著深度學習在人工智能諸多領域的異軍突起,從CPU到GPU,再到各類專屬領域的定制芯片,我們迎來了計算機體系結構的黃金時代!然而一款處理器芯片的研發(fā)周期,少則數年,多則數十年。在滾滾向前的時代大潮中,只有那一批最耐得住寂寞,經得起誘惑的匠人,才能打造出計算機行業(yè)皇冠上最閃亮的明珠。所以,當華為邀請我為昇騰AI處理器寫一本教材時,我毫不猶豫地答應了。也許是出于對硬科技公司的高度認同,也許是出于對同道中人的由衷尊敬,更可能是出于一種骨子里的使命感,我深深地覺得我們這個時代太需要一顆代表國內科技最高水平的中國芯了!華為推出面向人工智能計算場景的昇騰AI處理器,是希望通過更強的算力、更低的功耗,為深度學習的各類應用場景鋪平道路。但是千里之行,始于足下,昇騰的使命任重道遠。對于一款高端處理器來說,生態(tài)圈的培養(yǎng)和用戶編程習慣的養(yǎng)成可謂重中之重,也是決定該款產品生死存亡的關鍵。編寫本書的目的就是第一次向世人揭開昇騰AI處理器的神秘面紗,探索其內在的設計理念,從軟硬件兩方面闡述其架構特點,教會讀者上手使用昇騰系列開發(fā)平臺。不積跬步,無以至千里,如果把打造昇騰生態(tài)圈當作千里之行,那么本書便是嘗試邁出的第一步。本書定位人工智能芯片領域選修教材,面向工程科技類普通讀者,盡可能刪減繁雜抽象的公式、定理和理論推導。讀者除需要具備基本的數學知識和編程能力外,無須預修任何課程。本書特別理想的受眾是人工智能、計算機科學、電子工程、生物醫(yī)藥、物理、化學、金融統計等領域需要用到大規(guī)模深度學習計算的研發(fā)人員; 本書也為AI處理器的設計公司和開發(fā)者提供了有價值的參考。本書共分6章,內容涵蓋了神經網絡理論基礎、計算芯片與開源框架、昇騰AI處理器軟硬件架構、編程理論與方法,以及典型案例等,希望能夠從理論到實踐,幫助讀者了解昇騰AI處理器所使用的達芬奇架構,并掌握其具體的編程和使用方法,助力讀者打造屬于自己的人工智能應用。空談誤國,實干興邦。愿與諸位讀者共勉。感謝江子山和李興對本書撰寫工作做出的極大貢獻,他們在資料整理與文字編排上注入了極大精力,并且編寫和校對了本書中所有的程序示例代碼。如果沒有他們的全心投入,本書將很難順利完成。感謝陳子淵等對本書中的插圖進行精心編輯和修改,使得本書的內容更加清晰形象、概念的解釋更加具體明確。感謝華為公司在本書寫作過程中提供的資源和支持。感謝清華大學出版社盛東亮老師和鐘志芳老師等的大力支持,他們認真細致的工作保證了本書的質量。由于編者水平有限,書中難免有疏漏和不足之處,懇請讀者批評指正!
作者2019年8月
梁曉峣 上海交通大學計算機科學與工程系教授、博士生導師、學科帶頭人。畢業(yè)于美國哈佛大學,獲得博士學位。研究方向包括計算機體系結構、集成電路設計、通用圖形處理器和人工智能芯片架構等。發(fā)表論文80余篇(包括國際頂級學術會議(ISCA、HPCA、MICRO、ISSCC、DAC、ICCAD等)論文),其中2篇入選計算機體系結構年度最佳論文(IEEE MICRO TOP PICKS)。
CONTENTS
目錄
第1章基礎理論00
1.1人工智能簡史00
1.2深度學習概論00
1.3神經網絡理論0
1.3.1神經元模型0
1.3.2感知機0
1.3.3多層感知機0
1.3.4卷積神經網絡0
1.3.5應用示例0
第2章行業(yè)背景0
2.1神經網絡芯片現狀0
2.1.1CPU0
2.1.2GPU0
2.1.3TPU0
2.1.4FPGA0
2.1.5昇騰AI處理器0
2.2神經網絡芯片加速理論0
2.2.1GPU加速理論0
2.2.2TPU加速理論0
2.3深度學習框架0
2.3.1MindSpore0
2.3.2Caffe0
2.3.3TensorFlow0
2.3.4PyTorch0
2.4深度學習編譯框架TVM0
第3章硬件架構0
3.1昇騰AI處理器總覽0
3.2達芬奇架構0
3.2.1計算單元0
3.2.2存儲系統0
3.2.3控制單元0
3.2.4指令集設計0
3.3卷積加速原理0
3.3.1卷積加速0
3.3.2架構對比0
第4章軟件架構0
4.1昇騰AI軟件?傆[0
4.2神經網絡軟件流
4.2.1流程編排器
4.2.2數字視覺預處理模塊
4.2.3張量加速引擎(TBE)
4.2.4運行管理器
4.2.5任務調度器
4.2.6框架管理器
4.2.7神經網絡軟件流應用
4.3開發(fā)工具鏈
4.3.1功能簡介
4.3.2功能框架
4.3.3工具功能
第5章編程方法
5.1深度學習開發(fā)基礎
5.1.1深度學習編程理論
5.1.2深度學習推理優(yōu)化原理
5.1.3深度學習推理引擎
5.2昇騰AI軟件棧中的技術
5.2.1模型生成階段
5.2.2應用編譯與部署階段
5.3自定義算子開發(fā)
5.3.1開發(fā)步驟
5.3.2AI CPU算子開發(fā)
5.3.3AI Core算子開發(fā)
5.4自定義應用開發(fā)
第6章實戰(zhàn)案例
6.1評價標準
6.1.1精度
6.1.2交并比
6.1.3均值平均精度
6.1.4吞吐量和時延
6.1.5能效比
6.2圖像識別
6.2.1數據集:ImageNet
6.2.2算法:ResNet
6.2.3模型遷移實踐
6.3目標檢測
6.3.1數據集:COCO
6.3.2算法:YoloV3
6.3.3自定義算子實踐
附錄A縮略詞列表
附錄BAscend開發(fā)者社區(qū)及資料下載
附錄C智能開發(fā)平臺ModelArts簡介