當前位置：

首頁 > 新聞 > AAAI大會獎項全公布，獲獎論文都因何種理由當選？

AAAI大會獎項全公布，獲獎論文都因何種理由當選？

新聞 02-07

雷鋒網 AI 科技評論消息，第 32 屆 AAAI 大會（AAAI 2018）日前已經進入到第三天。當地時間 2 月 6 日上午，AAAI 組委會進行了 AAAI 大會獎項（AAAI Conference Awards）的宣布，頒獎儀式同期進行。

雷鋒網AI 科技評論作為持續關注頂級學術會議的雷鋒網學術頻道，從 2016 年開始涉足、參與並報道國際學術會議，不僅為讀者帶來一線精彩報道，更為人工智慧相關領域的學者們提供更多縱覽全球學術會議的機會。如果讀者們想了解雷鋒網 AI 科技評論 2017 年走遍全球 11 個學術頂會所帶來的精彩報道，歡迎掃描文章底部二維碼，了解 AI 科技評論的年度特輯。

論文獎項

AAAI 2018 今年共收到論文投稿 3808 篇，接收論文 938 篇，接收率約為 24%。AAAI 大會評出傑出論文、傑出學生論文各一篇，傑出論文提名、傑出學生論文提名各一篇，以及經典論文一篇。儘管《Memory-Augmented Monte Carlo Tree Search》獲得 AAAI 2018 傑出論文的消息早已傳播開來，但論文內容直到上周末才正式公開；此外，這篇傑出論文的第一作者和第二作者均為華人。

傑出論文獎

《Memory-Augmented Monte Carlo Tree Search》記憶增強的蒙特卡洛樹搜索

AAAI大會獎項全公布，獲獎論文都因何種理由當選？

作者：Chenjun Xiao，Jincheng Mei，Martin Müller

獲獎理由：這篇論文基於記憶結構的值逼近，為實時蒙特卡羅樹搜索提供了理論分析和實踐驗證。

論文摘要：這篇論文提出並評估了記憶增強蒙特卡洛樹搜索（M-MCTS），這一方法為在線實時搜索提出了一種新的利用泛化性的方式。記憶增強蒙特卡洛樹搜索的關鍵思路是把蒙特卡洛樹搜索和一個記憶結構組合起來，記憶結構中的每個存儲位置都可以包含某個特定狀態的信息。通過綜合類似的狀態的估計結果，這些記憶可以生成逼近的估計值。作者們展示了，在隨機情況下，基於記憶的逼近值有更高可能性比原始的蒙特卡洛樹搜索表現更好。作者們也在圍棋遊戲中評估了記憶增強蒙特卡洛樹搜索，實驗結果表明，在同樣的模擬步數下記憶增強蒙特卡洛樹搜索也比原始版本有更好的表現。

AAAI大會獎項全公布，獲獎論文都因何種理由當選？

論文地址：https://webdocs.cs.ualberta.ca/~mmueller/ps/2018/Chenjun-Xiao-M-MCTS-aaai18-final.pdf

傑出論文提名

AAAI大會獎項全公布，獲獎論文都因何種理由當選？

《Generalized Adjustment Under Confounding and Selection Biases》對選擇偏倚和混雜偏倚的泛化調節處理方法

作者：Juan D. Correa，Jin Tian，Elias Bareinboim

獲獎理由：論文提出了一個新的方法，使之能排除選擇偏倚和混雜偏倚的干擾，以計算因果效應

論文摘要：選擇偏倚和混雜偏倚是限制常見推理方法在大尺度環境下使用的最常見的兩個障礙。在這篇論文中，作者們泛化了後門調節的想法，以便同時處理這兩種偏倚，並且在不引入選擇偏倚的情況下利用可能的外部數據（比如來自人口調查的數據）。作者們介紹了調節對（adjustment pair）的思路，並展示了通過調節方法識別因果關係的完整圖形條件。作者們還進一步設計了一個演算法，以多項式形式列出所有可以處理的調節對，對於希望評估以部分可處理的調節對的特定屬性（常見屬性包括開銷、變化、測量難度）的研究人員來說這會很有用。最後，作者們描述了一種統計性的估計過程，一旦確認了某個設置是可以處理的就可以執行這個過程；它可以用來處理有限樣本中的多種問題。

AAAI大會獎項全公布，獲獎論文都因何種理由當選？

論文地址：https://pdfs.semanticscholar.org/023a/a92487c037a7557b9b74e894003725afd00a.pdf

傑出學生論文

《Counterfactual Multi-Agent Policy Gradients》反事實多智能體策略梯度

AAAI大會獎項全公布，獲獎論文都因何種理由當選？

作者：Jakob Foerster, Gregory Farquhar, Triantafyllos Afouras, Nantas Nardelli, Shimon Whiteson

獲獎理由：提出了一種新穎的多智能體強化學習演算法以增加可應用於實時策略遊戲的信用賦值。

論文摘要：許多現實世界中的問題，比如網路數據包的路由，或者自動駕駛汽車之間的協調，都可以很自然地看作合作性的多智能體系統問題來建模。這就對新的強化學習方法提出了強烈的需求，以便為這些系統高效地學習到區中心化的運行策略。出於這個目的，作者們提出了一種新的多智能體的「執行者-批評者」方法：反事實多智能體策略梯度（COMA）。COMA 中使用一個中心化的批評者估計 Q 函數和區中心化的執行者，從而優化智能體的運行策略。除此之外，為了解決多智能體間互相建立信任的問題，它使用了一個會把單個智能體的動作邊緣化的反事實基準線，同時還能保證其它智能體的動作不變。COMA 中使用了一個批評式的表徵，從而使得這個反事實基準線可以在單個前饋流程中進行高效的計算。作者們在星際爭霸遊戲的單位控制測試環境中評估了 COMA 的表現，使用了非常便於分別觀察的去中心化變數。與這個環境下的其它多智能體執行者-批評者方法相比，COMA 的平均表現有顯著提高，而且 COMA 得到的最好的智能體的表現可以和頂尖的具有全狀態數據的中心化控制方法相提並論。

AAAI大會獎項全公布，獲獎論文都因何種理由當選？

論文地址：https://arxiv.org/abs/1705.08926

傑出學生論文提名（這一獎項在現場沒有頒布）

《Adapting a Kidney Exchange Algorithm to Align with Human Values》改造出和人類的價值一致的腎臟分配演算法

作者：Rachel Freedman，Jana Schaich Borg，Walter Sinnott-Armstrong，John P. Dickerson，Vincent Conitzer

論文摘要：如何高效分配有限的資源是經濟學和計算機科學兩個領域共有的經典問題。對於腎臟移植手術來說，通常會由一個中央市場把一切正常的腎臟捐贈者分配給等待腎臟的病人。在腎臟分配中，病人和捐贈者首先由委員會通過特設的權重決定優先順序，然後輸入一個分配演算法，由它決定哪個病人會分配到哪個捐贈者——以及決定哪個病人分配不到捐贈者。在這篇論文中，作者們提出了一種端到端的方法用於在腎臟分配中根據每個病人的檔案估計權重。作者們首先從人類被試者獲取了一組他們認為可以用於決定病人優先順序的屬性（比如醫療特徵，生活方式等等）。然後作者們根據不同病人的檔案向被試者提問對比問題，並根據他們的回答嚴格地計算出各個屬性的權重。作者們展示了如何在腎臟分配市場的分配演算法中使用這些權重。作者們接著在模擬環境下評估了這些權重的影響，發現他們算出的權重的精確值其實影響很小，實際上需要的只是由權重計算出的檔案的排序。不過，與完全不給病人排優先順序的情況相比，帶有權重的演算法還是取得了更好的表現，確實有部分類別的病人從前述的測試者的價值評價中獲得了優先匹配（或者延後匹配）。

論文地址：https://users.cs.duke.edu/~conitzer/kidneyAAAI18.pdf

傑出 SPC 和 PC

AAAI 2018 的傑出高級程序委員（SPC）獎項頒給了 J?rg Hoffmann 教授。

AAAI大會獎項全公布，獲獎論文都因何種理由當選？

J?rg Hoffmann 教授是德國薩爾蘭大學數學和計算機科學院長，領導人工智慧集團基金會（FAI）。他在弗萊堡大學獲得博士學位，他的主要研究領域包括和 problem solving 有關的一系列話題，特別是組合搜索問題的建模和解決方案。主要研究領域包括自動化規劃，SAT / CP，模型檢查，語義 Web 服務，業務流程管理，馬爾可夫決策過程，自然語言句子生成，模擬網路安全滲透測試等相關領域。

AAAI 2018 的 20 位傑出程序委員（PC）獲獎名單如下，其中，Haiping Lu（呂海平）和 Xiangyuan Lan 為獲獎的兩位華人。

AAAI大會獎項全公布，獲獎論文都因何種理由當選？

呂海平目前在英國謝菲爾德大學擔任機器學習領域的講師，於 2008 年獲得多倫多大學電子及計算機工程博士學位。他的主要研究領域包括: 模式識別，機器學習；多元統計分析，張量計算；圖像處理，視頻處理；生物識別，生物醫學工程等。於 2013 獲得 IEEE 傑出博士論文獎，2014／2015 年香港研究資助局 Early Career Award。他曾先後擔任 ICML-18, AAAI-18, NIPS-17, AAAI-17, AISTATS-17, NIPS-16, IJCAI-16 的組委會成員，也是 IJCAI－18 的高級組委會成員。

藍湘源目前在香港浸會大學擔任博士後研究員，研究興趣包括計算機視覺和模式識別問題的稀疏表示和深度學習。2012 年畢業於華南理工大學計算機科學系，2016 年在香港浸會大學獲得博士學位。他曾在 2015 年擔任美國馬里蘭大學的訪問學者。

最佳學生論文展示獎

AAAI大會獎項全公布，獲獎論文都因何種理由當選？

每篇論文在現場有三分鐘的展示時間，經過激烈角逐，Ellis Hoa 和 Janardhan Doppa 的 poster 論文《Bayesian Optimization Meets Search-Based Optimization：A Hybrid Approach for Multi-Fidelity Optimization》獲得了 AAAI 2018 的最佳學生論文展示獎。

以上便是 AAAI 會議獎項的全部內容。四篇最佳論文及提名論文將會在接下來兩天陸續進行展示，敬請期待雷鋒網 AI 科技評論帶來的後續報道。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷鋒網 的精彩文章:

※不帶高通也能玩得轉，恩智浦要通過合作笑傲自動駕駛市場
※獲馬雲、郭台銘B輪融資後，「敬畏傳統」的何小鵬還說了些什麼

TAG:雷鋒網 |