2018 機器閱讀理解技術競賽

知識 03-17

機器閱讀理解 (Machine Reading Comprehension) 是指讓機器閱讀文本，然後回答和閱讀內容相關的問題。閱讀理解是自然語言處理和人工智慧領域的重要前沿課題，對於提升機器智能水平、使機器具有持續知識獲取能力具有重要價值，近年來受到學術界和工業界的廣泛關注。

為了促進閱讀理解技術發展，中國中文信息學會、中國計算機學會和百度公司聯手舉辦「2018 機器閱讀理解技術競賽」。競賽將提供面向真實應用場景的大規模中文閱讀理解數據集，旨在為研究者提供學術交流平台，進一步提升閱讀理解的研究水平，推動語言理解和人工智慧領域技術和應用的發展。競賽將在第三屆 "語言與智能高峰論壇"舉辦技術交流和頒獎。誠邀學術界和工業界的研究者和開發者參加本次競賽！

競賽詳情

1. 競賽任務

對於給定問題q及其對應的文本形式的候選文檔集合D=d1, d2, ..., dn，要求參評閱讀理解系統自動對問題及候選文檔進行分析，輸出能夠滿足問題的文本答案 a。目標是 a 能夠正確、完整、簡潔地回答問題q。

2. 數據簡介

本次競賽數據集來自搜索引擎真實應用場景，其中的問題為百度搜索用戶的真實問題，每個問題對應 5 個候選文檔文本及人工整理的優質答案。

數據集共包含 30 萬問題，包括 27 萬的訓練集，1 萬開發集和 2 萬測試集。其中 20 萬數據已在DuReader（https://arxiv.org/abs/1711.05073）發布，包括 18 萬訓練集、1 萬的開發集和 1 萬的測試集。這部分數據可自由下載（http://suo.im/4oKKPA），供參賽者訓練和測試使用。報名截止後，新增的 10 萬數據集也將在數據下載區發布。

3. 評價方法

競賽基於測試集的人工標註答案，採用ROUGH-L（http://suo.im/HWmPz）和BLEU4（http://suo.im/KFx9D）作為評價指標，以ROUGH-L（http://suo.im/HWmPz）為主評價指標。針對是非及實體類型問題，對 ROUGE-L 和 BLEU4 評價指標進行了微調，適當增加了正確識別是非答案類型及匹配實體的得分獎勵，一定程度上彌補傳統 ROUGE-L 和 BLEU4 指標對是非和實體類型問題評價不敏感的問題。

* 詳細的評價指標說明參見數據集中包含的「評測細則「文檔。

4. 基線系統

競賽將提供兩個開源的閱讀理解基線系統，基線系統的實現及結果評價請參考：開源系統（http://suo.im/4oKKPA）和數據集論文（https://arxiv.org/abs/1711.05073）。

參賽方式

1. 參賽對象

本次技術競賽面向全社會開放，相關領域的個人、科研機構、高等院校、企業單位等人員均可報名參加。

2. 報名方式

競賽網站將於 2018 年 3 月 1 日開放註冊報名，請及時關注。

* 正式報名並最終提交有效結果的團隊, 每位成員均可獲得一件大賽定製紀念 T 恤。

3. 報名時間

2018 年 3 月 1 日至 2018 年 3 月 31 日

獎項設置

競賽將評出一等獎 1 名，二等獎 2 名，三等獎 3 名。由主辦方中國中文信息學會（CIPS）和中國計算機學會（CCF）為獲獎者提供榮譽證書認證；由百度公司為獲獎者提供獎勵和參會交流贊助。

* 註：

1. 以上所有提及金額均為稅前金額。

2. 獲獎評定需選手提供系統報告（包括方法說明、系統代碼和數據、參考文獻和引用開源工具等）及團隊成員名單。

組織單位

1. 主辦方

中國中文信息學會中國計算機學會

2. 承辦方

百度公司中國中文信息學會評測工委會中國計算機學會中文信息技術專委會

3. 指導委員會

孫樂中國科學院軟體技術研究所

周明微軟亞洲研究院

楊爾弘北京語言大學

4. 評測委員會

呂雅娟百度公司

韓先培中國科學院軟體研究所

萬小軍北京大學

限時拼團

3 大模塊，30 個課時

高校數學系教授帶班

100% 學員好評

與 100 + 同學一起夯實數學基礎，走穩機器學習入門第一步！

新人福利

關注 AI 研習社（okweiwu），回復1領取

【超過 1000G 神經網路 / AI / 大數據，教程，論文】

Github 項目推薦 | 可提取結構化信息的自然語言理解 Python 庫 Snips NLU

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 AI研習社 的精彩文章:

※人工智慧的聽覺，多的是你不知道的事：J叔帶你全盤剖析智能語音微課程
※新手必看的十種機器學習演算法

TAG:AI研習社 |