當前位置:
首頁 > 科技 > IBM AI與人類辯論賽全程:機器語義、邏輯分析能力突飛猛進

IBM AI與人類辯論賽全程:機器語義、邏輯分析能力突飛猛進

關鍵時刻,第一時間送達

來源 / 騰訊科技《潛望》欄目

作者 /紀振宇

歡迎下載騰訊新聞客戶端,關注科技頁卡,查看更多科技熱點新聞

由於AI背後的海量數據資源的優勢,AI在辯論過程中能夠隨意引用相關研究成果來佐證自己的觀點這一點,要絕對遠勝過人類。

你或許從來沒有見過這樣一場奇特的辯論賽:人類辯手在講台上正進行著精彩陳述,一旁是一台一人多高的黑色方形柱,中間屏幕上的三個光球不時彈跳、閃爍,隨後,從這台柱子身上傳出一個冷靜的女聲,保持著恆定的語速闡述自己的觀點。

這場備受矚目的人與人工智慧之間的辯論賽11日在IBM 2019年Think大會期間上演。台上的黑色柱子,是被IBM稱為「Project Debater」的人工智慧系統,誕生於IBM位於以色列海法的實驗室,最早於2011年由研究員Noam Slonim提出,去年6月,Project Debater首次在舊金山的一場媒體閉門活動上亮相,對陣兩名以色列辯論冠軍並取得勝利。

時隔半年多後,Project Debater的再次亮相則高調了許多,這場辯論賽對外進行了視頻直播,對陣的人類辯方是2012年歐洲辯論冠軍、入選2016年全球辯論大賽最終決賽圈的專業辯論選手Harish Natarajan。

當天的辯論賽分成三部分進行,首先正反雙方分別進行4分鐘的觀點陳述,然後進入各自4分鐘的反駁時間,最後是各自進行2分鐘的總結。

這場辯論的辯題為「是否應該對學前教育進行補貼?」Project Debater為正方,人類辯手為反方,每一輪都由Project Debater首先進行。

在開場陳述中,Project Debater表示,應該對學前教育進行補貼,「補貼」不僅僅是「錢」的問題,還關乎政治、社會和倫理道德等,根據許多過往的經驗及研究表明,學前教育能夠對社會帶來正效益,包括減少犯罪,幫助貧困等,Project Debater特別提到幫助貧困人群的問題,相關研究成果稱,學前教育可以幫助與貧困相關的兒童的一些缺陷。

AI隨後連續引用了三份研究結果來佐證自己的觀點,首先是引用經合組織的建議,稱應對貧困地區進行學齡前教育補貼,以改善這些地區兒童的未來表現。其次,AI還引用了60年代的一份研究稱,學前教育能夠對個人及社會未來長期發展帶來幫助,遠遠超過為此需要付出的成本。最後,AI還引用了疾控中心的研究,稱學前教育能夠減少醫療成本、降低犯罪、對福利的依賴以及虐待兒童等。

因而AI的結論是,對學前教育進行補貼,能夠讓貧困家庭的兒童支付的起相關教育,讓他們更好地為未來的教育做好準備。

Project Debater的整個陳述句式完整,邏輯清晰,尤其多次引用了過往的研究成果,包括經合組織的數據等,來佐證自己的觀點。

隨後人類辯手Natarajan做了針對性的開場陳述,不僅闡述了其在15分鐘時間內所準備的內容,還對Project Debater的陳述,進行了有針對性的質疑。他指出,Project Debater的主要觀點,基於一種「本能性」的結論,即我們如果認為學前教育總體上是好事,那麼就理所應當對其進行補貼,但他認為,僅憑此就做出這樣的結論還遠遠不夠,這樣的邏輯過於簡單直接,他給出了例子進行反駁,例如如果一國增加對醫療的投入,也能夠給整個社會帶來福利,也能夠對教育帶來推動。

此外,他還指出,Project Debater忽略了在現實情境下,簡單進行補貼並不一定能夠達到預期的效果,尤其是針對學前教育的補貼,最終實際上是補貼在中產階級身上,而這些階層原先就有能力支付學前教育的費用,而補貼的錢由來自於所有人,因而對於貧困人群來說,反而帶來了損害。Natarajan同時指出,如果目的是幫助貧困人群,那麼在政府資金資源有限的情況下,應該考慮現實的限制,將資源最優化配置在能夠達到這一目的的領域。

人類辯手的這一開場陳述,同樣邏輯清晰,並且體現了人類在進行辯論過程中,能夠根據對方的陳述,做出有針對性回應的特點,考慮到這位人類辯手是一位專業的辯論高手,因而在他的陳述中,也體現了許多專業性的辯論技巧,例如將辯題進一步細化,並引向對手方在陳述中暴露出的邏輯上的薄弱環節,比如Natarajan就針對了Project Debater在陳述中所表現出的「因為學前教育好,所以就要進行補貼」這樣的簡單粗暴的邏輯。

在接下來的駁論環節,辯論雙方需要對對方之前所做出的陳述,進行針對性的回應,以進一步鞏固自身的觀點。

就這一輪環節來說,對於人工智慧Project Debater的挑戰在於,需要首先理解人類辯手在陳述中所進行的闡述,同時在其中找出其論證的一些漏洞或邏輯不嚴密的地方並對這些薄弱環節進行針對性回擊。

Project Debater的設計者之一、IBM研究員Noam Slonim表示,這一輪對於AI來說是「挑戰最大」的部分,對於AI來說,首先需要獲得人類辯手之前陳述的詞語,然後將這些詞語組織成「有意義」的句子,再從這些句子中摘取出人類辯手陳述的要點,再對這些要點進行回應。

但遺憾的是,這一輪Project Debater的表現並不夠好,這一輪也是最能反映出人和人工智慧之間的區別的環節。儘管Project Debater準確地抓取了人類辯手在開場陳述中所提到的對於貧困人群幫助的問題,並進行進一步闡述,但卻錯誤地理解了人類辯手的意思,Project Debater稱,對方辯友說學前教育是有害(harmful)的,但實際上是AI錯誤地理解了人類辯手的意思,人類辯手說,過早的學前教育,可能讓兒童在心理上產生挫折感,這樣反而是有害的,而AI並沒有將這樣的完整的上下文全部吸收並進行正確理解。

隨後,Project Debater的大部分陳述依然圍繞著其相對簡單的邏輯進行,包括有數據和研究表明學前教育對於兒童接下來接受學校教育更有幫助,以及學前教育可以降低犯罪率,所以要對學前教育進行補貼。

人類辯手在接下來自己的反駁環節,繼續緊抓AI邏輯相對簡單以及對情境的闡述過於理想化這一點進行攻擊,指出,AI所提出的政府資金能夠滿足各個方面只是理想的狀況,現實情況下,在政府資源有限的情況下,直接將資金撥給學前教育,並不一定是最理想的選擇。

在最後總結陳詞環節,Project Debater依然給出了標準完整的陳述,人類辯手在進一步闡述自身觀點的同時,繼續指出Project Debater的觀點在論證邏輯上的不足。

本場辯論賽最終的輸贏是根據賽前賽後觀眾投票結果的變化來決定,在比賽進行之前,現場的觀眾對該辯題進行投票,結果為支持補貼學前教育的觀眾佔79%,不支持補貼學前教育的觀眾佔13%,在辯論結束後,支持補貼學前教育的觀眾比例變為62%,而不支持補貼學前教育的觀眾佔30%,也就是說,17%的觀眾的觀點因為受到辯論的影響,由支持變為反對,根據這樣的結果,本場辯論賽以人類辯手獲勝而告終。

與此同時進行的另一個投票結果則並不讓人意外,69%的觀眾認為,Project Debater讓他們增加了知識。

從整場辯論賽的進程來看,進行地十分順利流暢,無論是AI還是人類辯手,都在各自環節的指定時間內,準時無誤地完成了自身的陳述,Project Debater從始至終保持了冷靜平緩的語調,語速也從頭至尾保持一致,這也完全符合外界之前的預期。有些出人意料的地方在於,AI時不時還會冒出一兩句幽默,比如「對方辯友或許從來沒有和機器進行過辯論」,還有「或許我自己無法親身經歷貧困是什麼樣的,也不應對目前的生活水平有任何抱怨」,所有這些小花絮,都讓AI聽上去更像一個有著獨立思考能力和情感的人類,辯論賽的主持人也在開始前說,Project Debater是有性別的,是一位女性,並在辯論賽結束後稱,AI展現出了「魅力」(Charming)。

當然AI自身存在的不足,也在整個辯論賽過程中很明顯地暴露出來,而這些「弱點」也正好被其訓練有素的人類辯手所利用,例如AI的邏輯結論相對簡單,總體而言,AI的邏輯是,過往的經驗和研究數據表明,A能夠導致B、A也能夠導致C或者D,如果B、C、D都是好的,那麼就應該支持A,基於這樣簡單的因果邏輯所得出的結論在遇到很多現實問題制約以及其他變數因素時,並不能夠完全成立。

當然,由於AI背後的海量數據資源的優勢,AI在辯論過程中能夠隨意引用相關研究成果來佐證自己的觀點這一點,要絕對遠勝過人類,在賽後,人類辯手在接受短暫訪談時也提到,在辯論賽中,發現AI所具備的這種「潛力」,讓他十分驚嘆,他認為,如果人類也能夠具備這樣的能力,那麼將在分析問題得出結論過程中得到更多的助益。

Noam Slonim表示,Project Debater的資料庫包含100億的句子,而該系統的能力在於在短時間裡,從這些數據中找出能夠用於當前辯題的詞語,組成合乎邏輯的句子,再組成完整的陳述。

從當場AI的表現來看,Project Debater至少已經完成了在短時間內(15分鐘),從資料庫中尋找到能夠用於當前辯題的詞語,組成相關的句子,並形成邏輯相對嚴謹的陳述,但同時,在理解人類對手的陳述,抓住對方陳述的要點,甚至邏輯的薄弱環節方面,還存在很明顯的不足。

無論結果如何,這場辯論賽向世人展示了AI所具備的另一種能力,在我們親眼看到AI能夠在國際象棋、圍棋、電腦遊戲方面能夠輕鬆戰勝人類頂級選手以後,在對語義、邏輯要求更高的領域,已經取得了非常驚人的進展。

在辯論賽後,Slonim接受騰訊《潛望》等媒體採訪時表示,自己願意給Project Debater的表現打9分,他對於系統的表現十分滿意,同時也指出在駁論階段系統存在的不足。

「我們的最終目標是,當結果並不是非黑即白時,建立一個能夠幫助人們做出基於證據的決策的系統。」Slonim說。

正如IBM研究院主管Dario Gil在辯論賽開場之前所說,比賽的意義並不在於誰輸誰贏,而是通過這樣的方式,展示人類能夠將AI更好地運用到分析問題、解決問題以及做出決策等方面的另一種可能性。

近期精選


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 騰訊科技 的精彩文章:

中國5G新進展:運營商啟動招標,臨時牌照有望上半年發放

TAG:騰訊科技 |