清華大學人工智慧研究院成立智能信息獲取研究中心,進一步促進產學合作
雷鋒網 AI 科技評論按:2019 年 6 月 19 日,清華大學人工智慧研究院智能信息獲取研究中心成立儀式暨學術交流會在信息科學技術大樓多功能廳舉行。這是繼知識智能研究中心、聽覺智能研究中心、基礎理論研究中心、智能機器人研究中心、智能人機交互研究中心之後成立的第六個研究中心。清華大學副校長、人工智慧研究院管委會主任尤政院士,人工智慧研究院院長張鈸院士出席成立儀式並共同為中心揭牌,並為智能信息獲取研究中心主任計算機系馬少平教授頒發了聘書。
尤政院士與張鈸院士共同為智能信息獲取研究中心揭牌
尤政院士與張鈸院士致辭
成立儀式在人工智慧研究院常務副院長孫茂松教授的主持下,首先請清華大學副校長、人工智慧研究院管委會主任尤政院士與人工智慧研究院院長張鈸院士為清華大學人工智慧研究院智能信息獲取研究中心的成立致辭。
尤政院士在致辭中指出,在當前信息爆炸時代,人類有限的認知能力和近乎無限的海量信息之間矛盾日益顯著。智能信息獲取研究旨在實現人與信息的高效匹配,在這一領域的技術突破和應用已經也必將繼續對社會發展和大眾生活產生巨大影響。希望智能信息獲取研究中心更好地集中優勢力量,以智能信息處理研究為切入點,取得一批具有重大影響的原創成果,培養一批人工智慧領域的優秀人才,帶動對人工智慧的深入研究與應用,更好地服務於國家和清華的人工智慧發展戰略。
尤政院士致辭
張鈸院士代表清華大學人工智慧研究院致辭。他表示,當今社會的信息獲取,尤其是從互聯網上進行信息獲取,幾乎成為了每個人生活與工作不可或缺的部分。信息獲取研究中心團隊近 20 年中在相關研究領域已經取得了顯著成績,但也還有很多待研究解決的新問題等待著我們去克服。發展人工智慧的理論與技術是極其艱難的,並非一朝一夕能夠完成,希望研究中心繼續努力,為國家與社會做出更大的貢獻。
張鈸院士致辭
致辭結束後,尤政院士與張鈸院士在大家的熱烈掌聲之下,共同為智能信息獲取研究中心揭牌。然後向智能信息獲取研究中心主任計算機系馬少平教授頒發了聘書,同時聘請新加坡國立大學蔡達成教授與加拿大蒙特利爾大學聶建雲教授作為學術顧問。
全面揭曉智能信息獲取研究中心
緊接啟動儀式之後,智能信息獲取研究中心主任馬少平教授向我們介紹了中心的各方面情況,包括關注領域、研究內容以及人員構成。馬教授表示,智能信息獲取研究中心旨在研究如何智能地幫助人們更簡單和高效地獲得、分析和處理信息:
3 個關注重點
開展相關理論研究:結合認知心理學、經濟學等相關領域,探究人類信息獲取行為的內在規律,研究支持智能信息獲取、處理和分析的基礎理論和方法;
構建數據計算平台:建設包含互聯網數據、用戶行為數據的數據平台和支持智能檢索、個性化推薦、智能問答、對話系統的智能計算平台;
促進學術交流合作:舉辦開放的、國際化的與人工智慧和信息獲取相關學術活動,增進學術交流;普及智能信息獲取和處理分析技術,促進產學合作。
主要研究內容
智能信息檢索:理解用戶背後多樣化信息需求來幫助用戶快速有效地訪問和利用海量互聯網信息;
個性化推薦與用戶建模:挖掘用戶屬性、興趣偏好,主動為每個用戶對信息進行智能過濾和推薦,解決信息過載的問題;
智能問答和智能對話系統:得用戶能夠通過問答、對話等更自然的方式與信息系統進行交互;
用戶行為分析與挖掘:通過對海量用戶在線行為信息進行收集、處理和挖掘,利用其中蘊含的豐富群體智慧信息開展用戶行為分析,形成信息閉環,不斷提升智能信息獲取系統的性能。
馬少平教授介紹智能信息獲取研究中心情況
6 個代表性成果
基於用戶的搜索引擎新能評價及滿意度分析:如何在存在諸多偏置的環境下對搜索引擎的性能進行有效和準確的評價是一個挑戰性的問題,中心基於收益與代價因素,設計二者融合的用戶滿意度研究體系與用戶停止評價策略。相關研究獲得了頂級國際會議 SIGIR2017 的最佳學生論文獎。
針對互聯網搜索的深度點擊模型與異質結果排序:搜索結果頁中豐富多樣的多模態結果(文本、圖像、視頻、新聞、百科知識……)使得傳統基於文本相似度的排序方式面臨極大挑戰,中心基於文本、視覺以及結構等多種類型的信息,對異質結果進行重排序。相關研究論文在重要國際會議 CIKM 2018 上獲得全面最佳論文獎。
個性化推薦中的用戶行為和滿意度研究:用戶的行為被廣泛應用於推薦系統的訓練和評價中,但其與用戶實際偏好和滿意度之間存在差異。針對該問題,中心設計了深入的用戶實驗並結合大規模真實日誌分析,全面探究了行為、偏好和滿意度之間的關係,並引入質量和用戶負向體驗的效應,改善了隱式反饋的構建和在線評價指標,提出了質量和負向體驗的識別模型。相關研究論文發表在 SIGIR 2018,WWW 2019,SIGIR 2019 等頂級會議上。
可解釋的推薦演算法研究及應用:推薦結果的可解釋性一直是推薦領域重點關注的研究內容。針對這一課題,一方面,中心嘗試從用戶的主觀偏好來解釋推薦結果,利用用戶的歷史評論和社交關係等信息給出推薦解釋;另一方面,中心還從知識圖譜中挖掘除了商品間的關係信息,嘗試利用這些客觀的商品互補/互斥關係來進行推薦的解釋。相關研究論文發表在 WSDM 2015,CIKM 2018,WWW 2018,WWW 2019 等頂級國際會議上。
常識知識驅動的開放領域對話生成:常識只是在許多自然語言處理任務中起到了至關重要的作用。此項工作中,我們提出了一種全新的開放領域對話生成模型,來展示大規模的常識知識如何促進自然語言的理解與生成。這是將大規模常識知識引入對話生成任務的首次嘗試。與其他獨立利用知識庫三元組或實體的模型不同,中心提出了圖注意力模型,將知識圖譜的信息結構化地作為一個整體進行表示。相關研究論文在頂級國際會議 IJCAI 2018 上獲傑出論文獎。
情緒化聊天機器人:情緒智能是人類智能行為的重要特徵。在對話系統中感知情緒和表達情緒對於提高對話系統的一致性和交互性十分重要。中心提出了情緒化對話內容生成模型,首次在大規模神經對話生成模型中考慮了情感因素,並採取情緒狀態嵌入、內部記憶、外部記憶等技術控制文本中的情感表達。論文發表在 AAAI 2018。
之後,馬教授還向我們介紹了研究中心開放的數據集,包括互聯網語料,搜索數據,專業領域,輸入法語料四方面的資源,可供學界和業界研究使用。
五大學術專場報告
隨後,學術研討交流會進入學術專場報告環節。首先由來自加拿大蒙特利爾大學的聶建雲教授帶來了題為「Representation learning in information retrieval – What to represent」的特邀報告。聶建雲教授以信息檢索領域中文檔和查詢詞的表示學習為切入點,深入探討了傳統的內容匹配和基於神經網路的內容表示兩種檢索思路的優劣與結合方式,指出兩類特徵對於檢索來說同樣重要。此外,聶教授還特別指出,研究數據、匹配信息的融合方式以及知識的應用方式在信息檢索研究中仍然是巨大挑戰,期待研究中心在相關領域取得更大突破。
聶建雲教授報告
接著由清華大學張敏副教授圍繞「個性化推薦中的可解釋性與公平性」展開報告。張敏副教授介紹了團隊在特徵、評論、商品三個層次上,將用戶產生內容及基於知識圖譜的規則推理學習與推薦演算法相融合,開展的可解釋性推薦方法研究成果;同時還介紹了在推薦公平性方面,團隊在深入理解用戶行為、改進推薦演算法和改善評價指標方面的研究工作。她指出,可解釋性和公平性是當前信息檢索、特別是個性化推薦領域的研究重點和熱點;而提出可解釋性和公平性是兩個緊密關聯的具有挑戰性的問題。這也呼籲更多研究者們一起加入到相關研究中來,以提升用戶對推薦內容的滿意度。
張敏副教授報告
然後是清華大學劉奕群副教授做了題為「群體智能支撐的互聯網搜索技術」的報告。在報告中,劉奕群副教授首先強調了搜索對信息化社會和信息安全具有重要的意義,並簡要回顧了研究團隊在利用群體智能改進互聯網搜索技術方面取得的一系列進展。隨後,劉奕群副教授介紹了團隊在用戶行為指導的機器閱讀模型和相關性計算兩方面最新研究成果,闡述了通過分析人類認知行為,改進計算模型的新研究範式。
劉奕群副教授報告
來自業界的搜狗公司副總裁許靜芳博士也帶來了相關主題的報告——「問答—精準信息的智能獲取方式」。在報告中,許靜芳博士先簡單介紹了對信息獲取方式的演化歷程,指出隨著交互方式和用戶習慣的變化,問答引擎在為用戶帶來精準信息方面扮演著越來越重要的角色。因此,問題的表達、答案的連接和答案的生成是問答研究中面臨的主要挑戰。針對這些挑戰,許靜芳博士也向我們介紹了當前相關的研究進展,同時也期待能與研究中心在相關方向取得更多研究成果。
許靜芳博士報告
最後一個學術報告由清華大學黃民烈副教授針對「對話系統中的強語義、弱語義」做了探討。黃民烈副教授介紹了在智能對話場景下,強語義信息與弱語義信息在相關研究中的優劣和應用情況,並展示了當前課題組通過結合知識圖譜信息、神經計算等手段在應對這些挑戰的研究進展與成果。他指出,語義問題、一致性問題和交互性問題是現在對話機器人研究領域的主要挑戰。
黃民烈副教授報告
本次會議出席嘉賓還有華宇元典公司總經理鄒劭坤、首席技術官李東海等。大會結束時,馬少平教授對於學界和業界同仁的積极參与表示了感謝,並表示智能信息獲取研究中心今後將整合多學科交叉的優勢力量,深入開展相關研究,以促進清華和國家信息獲取和人工智慧研究與發展為宗旨,打造一個具有廣泛影響力的學術研究平台與學術交流中心。
智能信息獲取研究中心成立儀式合影
雷鋒網 AI 科技評論 雷鋒網
※惠普發布了一款新背包:可連 VR 頭顯,也可當電腦主機
※10 萬個名人,1000 萬張照片,全球最大人臉識別資料庫被刪除了
TAG:雷鋒網 |