當前位置:
首頁 > 新聞 > 「大咖解讀Bengio筆記」鄧侃:用深度學習模型,解構並重構人類思維

「大咖解讀Bengio筆記」鄧侃:用深度學習模型,解構並重構人類思維

「大咖解讀Bengio筆記」鄧侃:用深度學習模型,解構並重構人類思維

2017 年 11 月 8 日,在北京國家會議中心舉辦的 AI WORLD 2017 世界人工智慧大會開放售票!早鳥票 5 折 搶票倒計時 5 天開搶。還記得去年一票難求的AI WORLD 2016盛況嗎?今年,我們邀請了冷撲大師」之父 Tuomas 親臨現場,且谷歌、微軟、亞馬遜、BAT、訊飛、京東和華為等企業重量級嘉賓均已確認出席。

「大咖解讀Bengio筆記」鄧侃:用深度學習模型,解構並重構人類思維

2017 年 9月 26 日,深度學習大佬 Yoshua Bengio 在Arxiv 上發表了一篇筆記,標題是 The Consciousness Prior 意識先驗。

之所以說這篇文章,不是嚴謹的論文,而是筆記,是因為這篇文章,既沒有嚴謹的演算法和公式,也沒有嚴謹的實驗結果和分析,而是一篇冥想和提議。

但是筆記往往比論文更有啟發,就如同與教授喝咖啡聊天,往往更容易學到教授的思想方法。

Bengio 把人類思維解構為三個層次:感知、表徵、意識

Yoshua Bengio 在這篇文章里,把人類思維解構為三個層次,感知Perception、表徵 Representation、和意識 Consciousness。

面對一張人物照片,人類「感知」到的,是一堆像素。進而抽象到「表徵」,包括五官、髮型、服飾、背景等等。再進一步抽象到「意識」,包括凝重的表情、粗獷的外表、蒼涼的環境等等。

Yoshua Bengio 提議,可以借鑒深度學習模型,譬如 RNN,來模擬從感知到表徵的第一次抽象的過程。

h_{t} = F( s_{t}, h_{t-1} ),其中 s_{t} 是感知的像素,h_{t-1} 是前序的表徵,h_{t} 是修正後的表徵。

他進而又提議,從表徵到意識的第二次抽象的過程,也可以借鑒深度學習模型來完成。

c_{t} = C( h_{t}, c_{t-1}, z_{t} ),其中 c_{t} 是意識,z_{t} 是噪音。

之所以有噪音,是因為意識的界定,往往模糊。譬如粗獷和野性,雖然有區別,但是難以並沒有嚴格界定。

假如我們有大量做好標籤的照片,就可以訓練從感知到表徵的深度學習模型 F(* ),和從表徵到意識的模型 C( * )。

一個簡單的系統架構,是3-layer stacked RNN。當然也可以嘗試用更多層的複雜架構,或者用 CNN 替換 RNN,或者用 Attention-based Transformer 來替換 RNN。

通過重構人類思維來驗證解構過程

從感知,到表徵,到意識,是人類思維的解構過程。為了驗證解構的正確,Yoshua Bengio 提議通過重構來完成驗證。

訓練好從感知到表徵的模型 F(* ),和從表徵到意識的模型 C( * ) 以後,假如電腦能夠自動合成一張人像照片,表情凝重、外表粗獷、背景蒼涼,那麼重構宣告成功。

如果重構成功,那麼解構也被證明是成功的。

重構的模型可以用 GAN 和 VAE 來嘗試。

打破語言的束縛,解放思維

模型 F(* ) 的輸出,是表徵,譬如五官、髮型、服飾、背景等等。模型C( * ) 的輸出,是意識,譬如表情凝重、外表粗獷、背景蒼涼等等。

意識的形態是張量,是一組數字。但是人類習慣用辭彙來表達意識。YoshuaBengio 提議意識與辭彙之間的關係,仍然可以用深度學習模型來模擬,

u_{t} = U( c_{t}, u_{t-1} ),其中 c_{t} 是意識,u_{t-1} 是前序辭彙,u_{t} 是修正後的辭彙。

哲學家維特根斯坦曾說,「人有著這種感覺,他心裡想說的話,總比他用言辭表述得更為清楚」。U( * ) 這個模型,把維特根斯坦的判斷,表述得既清晰又簡練。

人類的知識,往往由事實 fact 和規則 rule 組成,而且人類習慣於用簡練的辭彙,來表達事實和規則。所以,維特根斯坦認為,人類思維受制於語言結構,語言的界限決定思維的界限。

Yoshua Bengio 提議,直接用意識 c_{t} 來表達知識,而不受語言 u_{t} 的制約。

進而推論,不妨嘗試用深度學習模型,或者強化學習模式,來重構思維邏輯,而不屈從於規則和一階邏輯那樣的推理演繹方式的束縛。

作者小傳:

「大咖解讀Bengio筆記」鄧侃:用深度學習模型,解構並重構人類思維

鄧侃,大數醫達創始人。(郵箱:kan.deng@qq.com)上海交通大學本科及碩士,美國卡內基梅隆大學(CMU)計算機學院暨機器人研究所博士,專攻人工智慧及數據挖掘。

歷任美國甲骨文公司(Oracle)主任系統架構師,美國泰為手機導航公司(Telenav)北京分公司總經理,百度高級總監並主管網頁搜索和知識圖譜。

2015年,鄧侃創建北京大數醫達科技有限公司,旨在將深度強化學習技術應用於醫療健康領域。

大數醫達對幾億份三甲醫院病歷,進行結構化解析,構建海量訓練數據,並結合臨床指南,訓練醫療深度強化學習模型。用於實現面向患者的醫療諮詢服務,面向基層醫生的臨床導航服務,以及面向醫院和醫療保險的全流程精細化質量控制和成本控制服務。

11 月 8 日,鄧侃將在北京國家會議中心 AI WORLD 2017 世界人工智慧大會智能醫療論壇發表題為《多模態智能疾病診斷系統的四大技術難點》。世界人工智慧大會的5 折早鳥票還有 5 天截止,搶票請點擊「閱讀原文」或直接去往活動行頁面 http://www.huodongxing.com/event/2405852054900?td=4231978320026

歡迎登錄 AI WORLD 2017 世界人工智慧大會官網了解大會詳情。

官網地址:http://www.aiworld2016.com/cn/2017.html

在此,讓我們透露一下鄧侃老師的精彩演講內容:

演講主題:多模態智能疾病診斷系統的四大技術難點

北京大數醫達科技有限公司,實現了多模態智能疾病診斷系統,該系統把 CNN、RNN、Attention、GAN、RL、MCTR、Knowledge Graph 等多種前沿技術融為一體,構建醫學智能診斷新體系。本演講重點介紹該系統以下 4 個方面的技術難點。

1. 把多模態數據,都轉換成以醫療知識圖譜為軸心的語義向量,在同一個參照系下進行相互比較和交叉操作。

2. 在知識圖譜為軸心的語義向量空間中,融合多模態數據,並使用生成對抗模型提供可行又可靠的質量評估方案。

3. 用卷積神經網路技術,從病情描述中提煉病情特徵,用聚焦機制,從醫學知識圖譜中補充相應病理邏輯,優化疾病的診斷與驗證。

4. 用深度強化學習和蒙特卡洛搜索樹技術,給醫生推薦最佳後續化驗和檢查項目,補充病情描述,用最小的代價,找到診斷金指標,提高診斷精度。

【掃一掃或點擊閱讀原文搶購五折「早鳥票」】

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

又一個ALL IN AI,全球最大資料庫提供商將AI注入雲
「普華永道重磅AI報告」2030年AI撬動15.7萬億經濟,中國成最大贏家
鄧侃:用深度學習模型,解構並重構人類思維
「最新消息」美國參議院將10月4日通過法案,允許無人駕駛汽車上路
「如何區分「好」和「偉大」」最具價值機器學習技能 Top10

TAG:新智元 |