我非常欣喜地看到由呂鵬、范曉光、陳忱、計湘婷、李軒涯等一批青年才俊撰寫的《計算社會科學導論》的書稿。他們“社計師”團隊已經連續(xù)兩年開展了關于“計算社會科學”的培訓課程,受到廣泛歡迎,沒想到這么快他們就完成了課程教材的編寫。我一直在關注著計算社會科學前沿的發(fā)展,也積極支持青年學者在這方面大力開拓。因為隨著信息社會的突飛猛進,社會科學對社會變遷的理解和研究方法都會發(fā)生極其深刻的變化,有些變化甚至是顛覆性的。我并不是計算社會科學的專家,但也不揣淺陋,應邀談幾點對這方面學科發(fā)展的看法,算是為青年學者們站臺。
一、計算社會科學將異軍突起
長期以來,學科的研究方法總是從屬和輔佐學科研究的理論、內容和對象,但隨著互聯網、大數據和人工智能等技術的飛速發(fā)展,計算社會科學成為一種認識世界和社會生活的新型學科,對整個社會科學將會產生革命性的影響。但迄今為止,我國在這個領域的學科發(fā)展和人才儲備都還很難適應時代發(fā)展的要求。
根據我國工業(yè)和信息化部人才交流中心發(fā)布的 《人工智能產業(yè)人才發(fā)展報告(2019—2020年版)》,人工智能相關企業(yè)數量不斷增加與相關人才供需不平衡,成為我國人工智能產業(yè)強勁發(fā)展的突出矛盾。當前,我國人工智能產業(yè)的有效人才缺口高達30余萬人。人工智能的人才不僅要具備計算科學背景,還要具備社會科學素養(yǎng)。
在世界范圍內,“計算社會科學”(Computational Social Sciences)作為一門新興學科正在蓬勃發(fā)展。2009年2月,以拉澤(David Lazer)為首的15位學者在《科學》(Science)雜志上發(fā)表題為“計算社會科學”的文章,是公認的宣示這一學科誕生的重要作品。計算社會科學是采用計算科學和數據科學的方法研究社會科學問題的新興交叉學科。這種新興性體現在以下幾方面。
第一,數據來源形式的大幅度擴展!扒蓩D難為無米之炊”,實證社會科學的發(fā)展離不開數據采集和處理技術的進步。傳統社會科學研究的數據來源或是結構化的宏微觀數據(定量研究),或是小樣本的文字(訪談研究)、歷史資料(歷史比較研究)。隨著電子計算機運算能力的提升,計算社會科學可以廣泛地采用數量龐大的網絡數據、文本數據、圖像數據、視頻數據、空間地理數據進行研究,為社會科學研究的發(fā)展注入新的生機。
第二,提升預測和決策的科學性。傳統的預測和決策多依賴于對常規(guī)性事實的研究,而計算社會科學為現代國家和機構提供了一個應對高度復雜和快速變化環(huán)境的高效能、低成本的工具,將革命性地改變決策科學。比如,政府部門對疫情發(fā)布數據、流調數據、防控輿情數據進行挖掘,預測疫情的擴散趨勢,也可以使用計算機模擬疫情防控政策施行的效果進行預測,提升決策的科學性。與此同時,政策制定者應該鼓勵對預測模型進行公開的驗證,同時提供標準數據集,作為解釋性模型的驗證性數據框架。
第三,為因果推斷提供新的解決思路。2021年10月,約書亞·安格里斯特(Joshua D. Angrist)和吉多·因本斯(Guido W. Imbens)因為對因果分析方法學的貢獻而被授予諾貝爾經濟學獎。因果推斷是社會科學經久不衰的議題,學者們提出了各種各樣的解決方法,如隨機試驗、工具變量、傾向值匹配等。如今,計算社會科學的發(fā)展為因果推斷提供新的思路,大數據挖掘有利于探索信息的關聯模式,并據此提出更精確的解釋性問題,同時機器學習可以更好地應對維度災難,進行統計估計。對因果關系的檢驗是計算社會科學研究中的重要部分。
計算社會科學的發(fā)展對于中國社會科學的未來發(fā)展同樣具有重要的意義,F代文明歷史上有多次技術革命,在這次數字化引領的新變革中,中國具有獨特的優(yōu)勢。其一,中國數字社會建設走在世界前列,從大眾生活的移動支付到數字政府的大力建設,無一不突顯數字中國的發(fā)展活力; 其二,中國的數據規(guī)模十分龐大,一條信息可能沒有太大的意義,一億條信息就會產生重大的價值。因此,在這一場計算社會科學的大變革中,中國與世界的距離最小,這為中國社會科學的發(fā)展實現“彎道超車”或是“換道超車”提供新的契機。當前,大數據和人工智能技術越來越多地進入社會科學研究領域,“計算社會科學”作為新興學科蓬勃發(fā)展,“新文科”建設方興未艾,一個由社會科學家、計算機科學家、統計物理學家和其他領域的研究人員組成的研究生態(tài)正在形成。
二、大力培養(yǎng)計算社會科學新人才
最近一段時間以來,以教育部新文科建設工作組發(fā)布的《新文科建設宣言》和組織的一系列會議為標志,促進文科與理工科的學科交叉成為學術界的討論熱點。中國社會科學院時任院長謝伏瞻大聲呼吁,要針對交叉學科建設的一些短板,加快發(fā)展具有重要現實意義的新興學科和交叉學科。中國社會科學院是中國哲學社會科學研究的最高學術機構和綜合研究中心,學科齊全,人才集中,資料豐富。近年來,中國社會科學院的一些研究團隊,發(fā)揮國家隊的平臺優(yōu)勢,在數字經濟、數字鄉(xiāng)村、智慧社會、國家智治、智慧法治等眾多領域積累了豐富的研究成果。
然而,總體來看,當前國內的社會科學界在人工智能與大數據方面的知識儲備與能力建設仍有不足。很有必要倡導和鼓勵廣大社會科學工作者、青年學子就大數據和人工智能在社會科學中的作用展開研討與交流。尤其是需要推動社會科學界與計算科學界的跨界合作,探索社會科學研究的新研究范式與方法。特別是在以下幾方面,要加快推進。
第一,建立技術與社會相結合的學術知識體系。計算社會科學通常是利用特定的研究方法,開發(fā)和應用復雜的、大規(guī)模人類行為的數據。但支撐計算社會科學學術生態(tài)的,不應只是廣義上的定量研究方法。傳統的社會科學和計算社會科學實際上正在變得越來越緊密。所涉及的主要內容,既涵蓋系統仿真、知識圖譜、文本分析與建模、數據可視化等“計算方法”,又包括算法審計、數據治理、數字公益等“社會治理”技術。這需要培養(yǎng)一批社會科學和計算科學的復合型人才。
第二,推動社會領域的知識圖譜、數據庫、實訓平臺建設。完善新型數據基礎設施是計算社會科學的生命線,因為這是一門以數據為基礎的學科,就如同人工智能技術也是一門以數據為基礎的技術一樣。在大數據時代,如何進一步合法合規(guī)地獲取大數據、分析大數據,成為制約未來中國社會科學進一步發(fā)展的一個嚴峻挑戰(zhàn)。要善于把“沉默的文本”變成“活動的知識圖譜”,這就需要發(fā)揮人文社會科學專家的專業(yè)知識,而不僅僅是靠計算機技術解決技術難題。
第三,整合力量,設立計算社會科學的專業(yè)學位。國內外眾多大學和科研機構,已經設立了計算社會科學的學位教育體系。國際高校社會科學類博士研究生輔修大數據第二學位也蔚然成風。例如,芝加哥大學設立了計算社會科學的碩士和博士學位,清華大學也已經在相關學科的學位項目里設立了相應的研究方向,中國社會科學院大學成立了計算社會科學研究中心。我們應鼓勵建設計算社會科學課程體系,培養(yǎng)這方面的人才。
十年樹木,百年樹人。培養(yǎng)人才不僅是為滿足當前之需,更要為未來做儲備。
三、編好用好計算社會科學的基礎教材
當前雖然存在諸多大數據、人工智能的教學工具和內容,但大多數是為計算機專業(yè)的學生和學者開發(fā)的,尤其是在應用場景上,不能適應人文社會科學類學生的專業(yè)背景和訓練需求。這本以社會學的青年學者為主體編寫的計算社會科學教材,是專門為人文社會科學相關專業(yè)的學生掌握計算社會科學的知識而量身定做的,有以下幾個特色。
第一,計算社會科學理論與軟件操作相結合。學習計算社會科學的目的是應用,因此離不開軟件應用,同時軟件的應用有利于加深對理論知識的理解。除緒論外,本教材各章都先講解理論知識,再提供應用理論知識的案例,并且案例給出了詳盡的Python代碼及操作說明,方便使用者上手操作。對于案例,編者特別選擇了人文社會科學領域的案例。
第二,服務于計算社會科學的教學與人才培養(yǎng)。本教材目的在于幫助一線的高校教師為人文社會科學專業(yè)學生講授計算社會科學的基本知識,因此在緒論中編者特別提供了如何使用本書授課的建議,并在每章精心設計了習題供學生們鞏固練習?梢钥闯鼍幷叩挠眯模窍M麕椭宋纳鐣茖W專業(yè)學生掌握計算社會科學的基本技能,這也有利于培養(yǎng)兼具科學精神與人文情懷的數字社會建設者。
第三,體現學科交叉性。計算社會科學的發(fā)展離不開多學科的知識共享、人員協作。盡管諸多學者都認識到這一問題的重要性,然而現實中不同類型機構之間、機構內部不同部門之間的壁壘始終存在。我很欣喜地看到,本教材既有百度公司與國內知名學術機構的深度合作,比如學者們借助百度AI平臺實現軟件操作,同時又有來自社會學、公共管理、網絡科學、計算機科學與技術等專業(yè)學者的精誠合作。我相信,打破機構壁壘、學科壁壘,這對計算社會科學的發(fā)展和未來非常重要。
期待本書能夠成為一個引子,帶動更多的人投身到交叉學科建設的事業(yè)中來。
是為序。
李培林: 社會學家、中國社會科學院學部委員、社會政法學部主任、原副院長、第十三屆全國人大常委會委員、社會建設委員會副主任委員.
2023年5月3日于北京