這周日,北理工將邀數位大咖研討「知識圖譜與智能問答」
雷鋒網 AI科技評論按:9月10日,北京理工大學 大數據創新學習中心 將在北京理工大學召開「知識圖譜與智能問答研討會」,屆時將邀請學術界與知名業界的專家做主題報告和面對面的研討。
「北京理工大學大數據創新學習中心」於2016年12月成立,長期開展大數據挖掘的學習與交流活動。在過去幾個月中,其有效地融合了高校資源和業界資源推出了Python、知識圖譜、機器學習等系列專題學習與研討活動,其中知識圖譜專題涉及了知識圖譜構建技術、知識圖譜應用、大規模知識圖譜數據存儲、知識圖譜與聊天機器人等主題,引起了北京地區廣大師生和業界人員的高度關注。
報告專家
陳華鈞,浙江大學計算機科學與技術學院教授
陳華鈞教授為浙江大學計算機科學與技術學院教授、博導,主要研究方向為語義 互聯網與知識圖譜、大數據、生物信息計算等。浙江省大數據智能計算重點實驗 室副主任、中國中文信息學會理事/語言與知識計算專家委員會副主任、中國人工智慧學會知識工程與分布智能專委會委員等。在 IJCAI, WWW, AAAI/IAAI, ICDE, TKDE, Briefings in Bioinforamtics 等國際頂級會議或期刊上發表多篇論文, 並曾獲國際語義互聯網會議 ISWC 最佳論文獎。作為主要參與者,獲得教育部技 術發明一等獎、國家科技進步二等獎等獎勵。全國知識圖譜與語義計算大會CCKS2016 程序委員會主席,聯合創辦國際語義技術聯合會議 JIST 等。
漆桂林,東南大學教授
漆桂林教授為東南大學教授、博導,獲得「六大人才高峰」資助,中國中文信息學 會語言與知識計算專業委員會副主任和中國科學技術情報學會知識組織專業委 員會副主任,開放知識圖譜聯盟 openKG 的聯合創始人之一,新華社中國經濟信 息社特約專家語義 Web 著名國際期刊 Journal of Web Semantics 的編委。曾任中 國語義 Web 和 Web 科學大會主席、國際會議 JIST 程序委員會主席。指導學生在 國際會議 ICTAI 獲得最佳學生論文獎。發表高水平學術論文 100 余篇,出版專著 一部。6 項專利獲得授權或者受理。先後承擔包括國家自然科學基金和歐洲第七 框架項目Marie Curie IRSES在內的多項科研項目,並且承擔了華為、百度等企 業項目,作為第二負責人參與了由科大訊飛牽頭的 863 課題「高考機器人」的一個 子課題。在知識工程、大數據語義分析、知識圖譜等領域有將近 20 年的研究和 產業化經驗。
閆峻,微軟亞洲研究院高級研究員
Dr Jun Yan graduated from Peking University in 2006 and then joined Microsoft Research Asia. He is currently research manager of Data Mining and Enterprise Intelligence Group. His research interests include Text Data Analysis, Knowledge Mining, Information Retrieval etc. He has more than 80 papers published in conferences and journals of related areas and has played as PC, senior PC of conferences including SIGKDD, SIGIR, AAAI etc. He is currently deputy director of Microsoft-Peking University joint lab.
丁力,全球首款語義 搜索引擎 Swoogle 作者
丁力是海知智能CTO,聯合創始人,OpenKG 發起人之一,全球首款語義 搜索引擎 Swoogle 作者,美國開放政府數據 Data.gov 語義技術專家,國際語義 網大會挑戰賽第二名。北京大學計算機系本科及碩士。UMBC 博士,斯坦福博 士後,RPI 研究員。前高通研究院科學家。主要研究方向為語義搜索,知識圖譜政府數據公開,機器學習與中文自然語言處理等。發表上百篇論文,引用量過萬,Google H-index >30。
肖國輝,義大利博爾扎諾自由大學計算機學院助理教授
肖國輝現為義大利博爾扎諾自由大學計算機學院助理教授,北京大學應用數學 本科、碩士,奧地利維也納工業大學計算機博士。目前他的主要研究領域包括知 識表示與推理,數據集成,時空數據推理,專攻基於本體的數據訪問(OBDA)的 理論和技術。並研究如何將這些技術和理論應用於實際的工業案例。目前為Ontop 研究團隊的負責人,主持 OBDA 技術的研究,開發和應用。Ontop 為當前 最先進的 OBDA 系統,其研發主要依託於歐盟第 7 框架項目 Optique。發表論文50 余篇,其中多篇發表在國際頂級學術會議及期刊。
王昊奮,OpenKG 發起人之一
王昊奮,上海瓦歌智能科技公司總經理,深圳狗尾草智能科技公司 CTO,OpenKG 發起人之一。在語義技術和圖數據管理方面有比較豐富的經驗和 積累,共發表 75 余篇高水平論文,其中包括 35 余篇 CCF A 類和 B 類論文。作 為技術負責人,他帶領團隊構建的語義搜索系統在十億三元組挑戰賽 (Billion Triple Challenge)中獲得全球第 2 名的好成績;在著名的本體匹配競賽OAEI 的實體匹配任務中獲得全球第 1 名的好成績。他帶領團隊構建了第一份中 文語義互聯知識庫 zhishi.me,被邀請參加 W3C 的 multilingual 研討會並做報告。 他還帶領團隊參加了百度知識圖譜競賽獲得所有任務第一名的好成績。此外,他 還長期作為 ISWC, WWW, AAAI 等國際頂級會議程序委員會委員。目前,王昊 奮擔任 CCF YOCSEF 上海主席,中文信息學會語言與知識計算專委會副秘書長, 中國計算機學會術語工作委員會執行委員等社會職位。
鄒磊博士,北大副教授
Lei Zou received his BS degree and Ph.D. degree in Computer Science at Huazhong University of Science and Technology (HUST) in 2003 and 2009, respectively. He received a CCF (China Computer Federation) Doctoral Dissertation Nomination Award in 2009 and won Second Class Prize of CCF Natural Science Award in 2014. Since September 2009, he joined Institute of Computer Science and Technology (ICST) of Peking University (PKU) as a faculty member. He has been an associate professor in PKU since August 2012. His recent research interests include graph databases, knowledge graph, particularly in graph-based RDF data management. He has published more than 30 papers, including more than 20 papers published in reputed journals and major international conferences, such as SIGMOD, VLDB, ICDE, TODS, TKDE, VLDB Journal.Lei Zou』s research is supported by NSFC-Young Excellent Talent Project and National Key Research and Development Program of China. His work has been cited by more than 1300 (Google Scholar Citation statistics).
鮑捷,中國中文信息學會語言與知識計算專 委會委員
鮑捷博士有十餘年的人工智慧研究經驗,研究領域有神經網路、知識表現與推 理、語義網、機器學習、自然語言處理等。中國中文信息學會語言與知識計算專 委會委員。歷任美國三星研發中心研究員,MIT 訪問研究員,BBN 訪問研究員,RPI 博士後,Iowa State Univ 博士,W3C Web 本體語言工作組成員,國際語義網 會議 ISWC 組委會和程序委員會成員。
魏晨,圖靈機器人認知計算小組負責人
魏晨,圖靈機器人認知計算小組負責人。於 2012 年獲得碩士學位。碩士期間在 數據挖掘領域發表了 2 篇會議論文,1 篇 ISF 期刊,Springer 書的一章,和 1 本 書(在亞馬遜售賣)。曾經是美國政府特邀訪問學者,也曾在科英布拉大學做研 究員。目前在圖靈機器人工作。研究興趣包括推薦系統,知識圖譜和文本挖掘。 圖靈機器人公司是以語義理解為核心驅動力的人工智慧公司,致力於「讓機器理 解世界」, 產品服務包括機器人開放平台,機器人 OS 和場景方案。公司成立於2010 年,2013 年推出全球第一款中文人工智慧語音助手-蟲洞語音助手,累計4500 萬用戶量。2014 年推出開放人工智慧機器人平台,至今已有 60 多萬合作伙 伴和開發者。讓開發者和廠商能夠在 10 分鐘內創建專屬的聊天機器人。2015 年 推出圖靈 OS。2016 年推出圖靈 OS 1.5。
報告內容
1、cnschema:開放中文知識圖譜的進展
丁力,9:40—10:20
報告內容:cnSchema.org 是一個基於社區維護的開放的知識圖譜 Schema 標準。cnSchema 的辭彙集包括了上千種概念分類(classes)、數據類型(data types)、屬性(propertities)和關係(relations)等常用概念定義,以支持知識圖譜數據的通用性、復用性和流動性。結合中文的特點,我們復用、連接並擴展了 Schema.org,Wikidata,Wikipedia 等已有的知識圖譜 Schema 標準,為中文領域的開放知識圖譜、聊天機 器人、搜索引擎優化等提供可供參考和擴展的數據描述和介面定義標準。通過cnSchema, 開發者也可以快速對接上百萬基於 Schema.org 定義的網站,以及 Bot的知識圖譜數據 API。本報告描述了我們遇到的挑戰和工作方向,給出了案例分 析和發展路徑。最後介紹了 schema 目前完成/在研的若干志願者任務。
2、虛擬化知識圖譜的關鍵技術和應用
肖國輝,10:20—10:40
報告內容:基於本體的數據訪問技術(ontology-based data access,OBDA)可以 將現有的資料庫虛擬化為知識圖譜。虛擬化的知識圖譜通過提供了一種高層次的 查詢介面,使得最終用戶不需關心底層的數據存儲和組織。此技術的核心為查詢 重寫,可以重用現有的資料庫的功能。本報告首先將介紹 OBDA 技術的基本知 識。然後講解 Ontop 系統怎樣實現知識圖譜虛擬化。最後,我們討論知識圖譜虛 擬化技術在石油、能源、醫療、考古、測繪、海事安全、電子商務等領域的具體 應用案例和前景。
3、聊天機器人產業化落地的思考和實踐
王昊奮,10:50—11:30
報告內容:近年來,聊天機器人作為 AI 技術的殺手級應用,發展得如火如荼, 各種智能硬體層出不窮。本次演講將系統地闡述聊天機器人的分類和關鍵技術, 並分析 Apple Siri、IBM Watson、Google Allo、Facebook Messenger 和 Amazon Echo等典型代表的優缺點,並第一次給出聊天機器人行業的技術面面觀。在此基礎上, 將展望聊天機器人通往更智能化、更人性化、更趣味化的道路上所面臨的挑戰, 並聚焦到知識圖譜技術在問答、推理和服務融合等方面的機遇和挑戰。
4、OpenKG 與 cnSchema
陳華鈞,11:30—12:10
報告內容:OpenKG 旨在促進知識圖譜數據的開放與互聯,促進知識圖譜與語義 技術的廣泛應用與普及,本報告概要介紹了開放知識圖譜 OpenKG 的一些正在開展的工作,這包括開放圖譜資源庫、鏈接的開放中文百科知識圖譜、開放知識 圖譜的 Schema——cnSchema。並結合 cnSchema 的一些工作,介紹了知識圖譜 在智能搜索及問答領域的潛在應用場景。
5、佛學和農業知識圖譜構建及問答系統介紹
漆桂林,13:30—14:10
報告內容本報告中,我們首先介紹佛學和農業知識圖譜構建的相關技術,包括 如何從百科中抽取領域相關的知識,以及然後對百科中缺失的數據進行補全;其 次,我們將介紹佛學和農業知識圖譜問答的相關技術,並做系統演示。
6、Knowledge Learning for Question Answering in Healthcare Domain
閆 峻,14:10—14:50
報告內容:In this talk, we will mainly introduce an application of knowledge mining and natural language processing in healthcare domain, including bi-direction knowledge graph construction, knowledge explicit representation by synonym learning and question retrieval with knowledge data with application scenarios.
7、Natural Language Question Answering over Knowledge Graph
鄒磊,15:00—15:40
報告內容:AS more and more structured data become available on the web, the question of how end users can access this body ofknowledge becomes of crucial importance. As a de facto standard of a knowledge base, RDF (Resource Description Framework)repository is a collection of triples, denoted as. Although SPARQL is a standard way to access RDF data, it remains tedious and difficult for end users because of the complexity of the SPARQL syntax and the RDF schema. An ideal system should allow end users to profit from the expressive power of Semantic Web standards (such as RDF and SPARQLs) while at the same time hiding their complexity behind an intuitive and easy-to-use interface. In this talk, I first review two categories of existing methods on natural language question answering (Q/A) over RDF knowledge graph---one is IR (Information Retrieval)-based and the other one is called semantic parsing method. Then, I will talk about our RDF Q/A system (gAnswer), which is based on graph matching-based technique. The most challenge to RDF Q/A task is the ambiguity of natural language question sentence. The contribution of our method is that we combine the disambiguation and query evaluation in a uniform process, i.e., we push down the disambiguation into the query evaluation stage. Based on the queryresults over RDF graphs, we can address the ambiguity issue efficiently. gAnswer joined QALD-6 knowledge graph Q/A competition (hosted by ESWC) and it won the second place in the Q/A precision. We host an online demo of our system at ganswer.gstore-pku.com.
8、精益地構造問答系統
鮑捷,15:40—16:20
報告內容:問答系統是一種複雜系統,難以一次性整體構造,也不存在單一演算法 的解決方案。端到端的訓練演算法在現實落地中經常會遇到困難。本次講座探討如 何精益地構造問答系統,即如何循序漸進的從簡單到複雜,去「生長」一個問答系 統。
9、如何搭建 Chatbot 以及聊天機器人理論框架
魏晨,16:20—17:00
報告內容:隨著人工智慧的高潮,聊天機器人漸漸引起了人們的青睞。如何快速 的搭建一個聊天機器人,其背後的主要技術是什麼。在搭建的過程中,需要借鑒 怎樣的理論框架。圖靈機器人將會進行分享。
活動信息
本次活動面向北京理工大學師生、北京地區高校師生及科研機構免費開放,提供茶歇,參會人員食宿與交通費用自理。
時間:2017年9月10日(周日) 9:00—17:30
地點:北京理工大學(中關村校區) 研究生院 101報告廳
報名方式:點擊這裡(雷鋒網註:由於座位有限,人數規模將控制在150人左右)
主辦方:北京理工大學大數據創新學習中心
協辦方:雪晴數據網,北京友萬信息科技有限公司
合作媒體:雷鋒網
※美的空氣凈化器H32評測:美觀、實用以及更多
※出門問問攜手Google,發布TicHome Mini
※明勢資本黃明明:未來出行的終局是無人駕駛,將誕生萬億美金市值公司
※阿里要開購物中心,名叫「貓MALL」;中國超級高鐵計劃,最高時速4000km/h
※口述歷史:回顧塑造無人駕駛行業的 DARPA 挑戰賽
TAG:雷鋒網 |