學界|清華大學人工智慧研究院知識中心成立儀式隆重舉行,發布知識計算開放平台
AI 科技評論按,1 月 21 日,清華大學人工智慧研究院知識中心(以下簡稱「知識中心」)成立儀式暨知識平台發布會在清華大學東南門內 FIT 樓隆重舉行。作為清華人工智慧研究院成立的首個研究中心,知識中心的成立是清華大學推進人工智慧發展的重要舉措,也是中國人工智慧研究院的里程碑事件。
知識中心主任由李涓子老師擔任。
打開今日頭條,查看更多圖片李涓子,清華大學長聘教授,博士生導師。中國中文信息學會語言與知識計算專委會主任。研究方向為知識工程、語義 Web 和文本挖掘。近年來在重要國際會議和學術期刊上發表論文 100 余篇,編著出版《Mining User Generated Content》,《Semantic Mining in Social Networks》。主持國家自然科學基金重點課題、歐盟第七合作框架等多項國家、國際和部委項目。獲得 2017 年北京市科技進步一等獎、2013 年人工智慧學會科技創新一等獎等多個獎項。
知識智能研究中心成立儀式
清華大學人工智慧研究院常務副院長孫茂松教授是本次會議的主持人,清華大學人工智慧研究院院長張鈸院士,清華大學副校長、清華大學人工智慧研究院管委會主任尤政院士分別進行了致辭,並為知識中心舉行了揭牌儀式。李涓子老師被聘任為知識中心主任,董振東先生被聘任為知識中心學術顧問。
清華大學人工智慧研究院院長張鈸院士首先代表清華大學人工智慧研究院致辭。他指出知識是人類智能的重要特徵,我們已經進入後深度學習時代,讓計算機擁有大規模、高質量的形式化知識,是實現安全可信人工智慧的重要使命,知識表示、獲取、推理與計算將是新一代人工智慧研究面臨的核心問題。清華大學在知識智能方面有著深厚的研究積累,清華大學人工智慧研究院目標是從事人工智慧基礎理論與方法研究,希望通過成立知識中心,打造國際一流的知識智能創新高地,推動魯棒可解釋人工智慧的跨越式發展。
張鈸院士致辭
清華大學副校長、清華大學人工智慧研究院管委會主任尤政院士在致辭中表示,成立知識中心是清華大學推進人工智慧發展的重要舉措,也是清華大學人工智慧研究院的一個里程碑事件。希望知識智能研究中心更好地匯聚校內外相關研究力量,在知識智能方面開展原創性的研究工作和技術創新,在實現魯棒可解釋人工智慧方向上取得跨越式進展,更好地服務於國家和清華的人工智慧發展戰略。
尤政院士致辭
清華大學人工智慧研究院於 2018 年 6 月 28 日在李兆基科技大樓揭牌成立。清華大學計算機系教授、中國科學院院士張鈸出任首任院長,清華大學交叉信息研究院院長、圖靈獎獲得者姚期智擔綱學術委員會主任。研究院以人工智慧基礎理論和基本方法研究為核心,積極推進大跨度的學科交叉融合,積極推進大範圍的技術與產業、學校與企業融合,充分發揮清華大學在多學科綜合、優秀人才匯聚、高水平國際合作等方面的獨特優勢,在人工智慧的基礎理論和基本方法上開展源頭性和顛覆性創新,力爭將人工智慧研究院打造成為一個具有全球影響力的人工智慧高端研究機構。
知識中心成立於 2019 年 1 月 21 日,是清華大學人工智慧研究院設立的首個研究中心。中心將致力於知識智能相關基礎理論研究和應用基礎研究,建設融通語言知識、常識知識、世界知識的大規模知識圖譜及典型行業知識庫,建設具有國際影響力的知識計算開放平台,同時積極開展高水平國際學術交流,促進產學研深度合作。
除了李涓子老師之外,知識中心的知名學者還包括孫茂松、朱小燕、唐傑、許斌、劉洋、黃民烈、劉知遠等。
知識中心的知名學者
知識中心目前有三個實驗室:
知識中心自然語言處理實驗室(THUNLP):由孫茂松教授、劉洋副教授、劉知遠副教授帶領,主要從事中文信息處理、社會計算和知識圖譜研究。最近在孫茂松教授牽頭的 973 項目支持下,提出融合知識的統一語義表示框架和知識指導的自然語言處理的學術思想,取得一系列原創成果。
知識工程實驗室(THUKEG):由李涓子教授、唐傑教授、許斌老師帶領,主要從事知識工程、社會網路分析研究。最近研製的科技知識挖掘系統 AMiner 和跨語言知識圖譜 XLORE,獲得國內外廣泛關注與使用,曾獲北京市科技進步一等獎,中國人工智慧學會科技進步一等獎。
互動式人工智慧實驗室(THUCoAI):由朱小燕教授、黃民烈副教授帶領。主要從事機器學習與自然語言處理應用基礎研究,主要研究方向包括深度學習、強化學習、問答系統、對話系統、情感理解、邏輯推理、語言生成等。最近探索將常識知識融入對話系統與文本生成,取得一系列原創成果。
清華大學知識計算開放平台(THUKC)發布會
知識中心在成立儀式上還發布了體現國內領先水平的清華大學知識計算開放平台(http://ai.tsinghua.edu.cn/kirc/),內容涵蓋語言知識、常識知識、世界知識和科技知識庫,包括:
在我國著名機器翻譯專家董振東先生畢三十年之功建立的語言和常識知識庫《知網》(HowNet)基礎上所研製的 OpenHowNet;
中英文跨語言百科知識圖譜 XLORE;
科技知識挖掘平台 AMiner。
基於AMiner的《清華大學人工智慧技術系列報告》(THUAITR)。
XLORE:中英文跨語言百科知識圖譜
網址:https://xlore.org/
XLORE 是融合中英文維基、法語維基和百度百科,對百科知識進行結構化和跨語言鏈接構建的多語言知識圖譜,是中英文知識規模較平衡的大規模多語言通用知識圖譜。
XLORE 是中英文知識規模平衡的大規模跨語言百科知識圖譜。該圖譜通過融合維基百科和百度百科,並對百科知識進行結構化和跨語言鏈接構建而成。該圖譜以結構化形式描述客觀世界中的概念、實例、屬性及其豐富語義關係。XLORE 目前包含約 247 萬概念、44.6 萬屬性/關係、1628 萬實例和 260 萬跨語言鏈接。XLORE 作為世界知識圖譜,將為包括搜索引擎、智能問答等人工智慧應用提供有力支撐。
XLORE 集成了多項創新研究成果:
利用基於鏈接因子圖模型的知識鏈接方法,實現對不同語言知識資源之間的實體知識關聯;
利用跨語言概念層次關係的驗證保證生成跨語言本體中概念關係的質量,並進一步研究了跨語言知識圖譜的概念層次剪枝和優化演算法以規範知識分類體系;
利用因子圖模型建立跨語言屬性間的對應關係,減少知識圖譜的冗餘;
聯合使用 DBpedia 分類樹、維基分類體系、百度百科詞條標籤對未分類實體進行類別標註。相關成果發表在 WWW、IJCAI、ACL、EMNLP 等人工智慧和自然語言處理領域重要國際會議上。
與著名知識圖譜 DBpedia 相比,XLORE 的中文實體數量是其的 3.6 倍,中英文跨語言鏈接增加 39%。XLORE 還提供多樣化數據 API 服務,系統累計訪問次數過億次,訪問來自 53 個不同國家或地區;2018 年 API 響應調用 160 萬餘次。XLORE 項目計劃於 2019 年正式發布跨語言實體鏈接服務 XLINK。
在世界知識的獲取、表示與計算方面,中心還研製發布了很多開源工具和評測數據集,如知識表示學習工具包 OpenKE(https://github.com/thunlp/OpenKE)、神經網路關係抽取工具包 OpenNRE(https://github.com/thunlp/OpenNRE)、Few shot learning 關係抽取數據集 FewRel(https://github.com/thunlp/FewRel)等,自發布以來獲得學術界與產業界廣泛使用。
OpenHowNet:基於義原的開放語言知識庫
網址:https://openhownet.thunlp.org/
OpenHowNet 是一個以詞語的概念為抽象描述對象,以「義原」為基本語義單位,以揭示概念與概念之間以及概念所具有的屬性之間的關係為基本內容的常識語言知識圖譜。
HowNet 是由董振東先生、董強先生父子畢三十年之功建立的一個以漢語和英語的詞語所代表的概念為描述對象,以揭示概念與概念之間、以及概念所具有的屬性之間的關係為基本內容的語言和常識知識庫。知網 HowNet 秉承還原論思想,認為詞義概念可以用更小的語義單位來描述,這種語義單位被稱為「義原」(Sememe),是最基本的、不易於再分割的意義的最小單位。在不斷標註的過程中,HowNet 逐漸構建出了一套精細的義原體系(約 2000 個義原)。HowNet 基於該義原體系累計標註了數十萬辭彙/詞義的語義信息,自 1999 年正式發布以來引起了中文信息處理領域極大的研究熱情,在辭彙相似度計算、文本分類、信息檢索等方面探索了 HowNet 的重要應用價值,建立了廣泛而深遠的學術影響力。
2017 年以來,清華大學研究團隊系統探索 HowNet 知識庫在深度學習時代的應用價值,並在辭彙語義表示、句子語義表示、詞典擴展等任務上均得到了驗證。研究發現,HowNet 通過統一的義原標註體系直接精準刻畫語義信息,一方面能夠突破辭彙屏障,深入了解辭彙背后豐富語義信息;另一方面每個義原含義明確固定,可被直接作為語義標籤融入機器學習模型,使自然語言處理深度學習模型具有更好的魯棒可解釋性。相關成果均發表在 AAAI、IJCAI、ACL、EMNLP 等人工智慧和自然語言處理領域頂級國際會議上。
為了讓 HowNet 知識庫及其學術思想得到更廣泛的應用,知識中心聯合董氏父子共同開源 HowNet 知識庫核心數據,研製了知識庫的訪問與計算工具包,並將在清華大學知識計算平台上持續地維護、更新和擴展。
AMiner:科技知識挖掘平台
網址:https://aminer.cn/
「AMiner」是一個研究者學術搜索類網站,能夠為計算機科學相關領域的研究者提供更全面的領域知識和更具針對性的研究話題和合作者信息,為科研人員提供信息獲取和幫助。
AMiner 作為科技情報網路大數據挖掘平台,包含超過 2 億篇學術論文和專利以及 1.36 億科研人員學術網路。該平台於 2006 年上線,已經累計吸引全球 220 個國家和地區的 800 多萬獨立 IP 訪問,數據下載量 230 萬次,年度訪問量超過 1000 萬,成為學術搜索和社會網路挖掘研究的重要數據和實驗平台。
AMiner 項目團隊與中國工程科技知識中心、微軟學術搜索、ACM、IEEE、DBLP、美國艾倫研究所、英國南安普頓大學等機構建立了良好的合作關係,項目成果及核心技術應用於中國工程院、科技部、國家自然科學基金委、華為、騰訊、阿里巴巴等國內外 20 多家企事業單位,為各單位的專家系統建設及產品升級提供了重要數據及技術支撐。
THUAITR:清華大學人工智慧技術系列報告
網址:https://reports.aminer.cn/
「THUATIR」是以 AMiner 全球科技情報大數據挖掘服務平台為基礎,聘請領域頂級專家作為顧問,採用人工智慧自動生成技術,彙集而成的科技領域洞察報告。
THUAITR 以 AMiner 全球科技情報大數據挖掘服務平台為基礎,聘請領域專家作為顧問,結合人工智慧自動生成技術,以嚴謹、嚴肅、負責的態度製作發布的人工智慧技術評論及人才分析。報告內容涵蓋技術趨勢、前沿預測、人才分布、實力對比、以及洞察情報等。
2018 年共發布 14 份技術報告(主題包括:自動駕駛 [基礎版]、機器人、區塊鏈、行為經濟學、機器翻譯、通信與人工智慧、自動駕駛、自然語言處理、計算機圖形學、超級計算機、3D 列印、智能機器人、人臉識別、人工智慧晶元),累計閱讀量超過 120 萬人次。本次將新發布「知識圖譜研究報告」和「數據挖掘研究報告」。
董強先生、李涓子教授、唐傑教授、黃民烈副教授、劉知遠副教授分別介紹了知識計算開放平台本次發布的相關資源及應用案例。知識中心負責人李涓子教授表示,中心將在清華大學和人工智慧研究院的支持下,以本次發布會為起點,堅持做好做強知識計算開放平台,用知識為 AI 賦能。
閱讀原文