「大咖解讀Bengio筆記」鄧侃：用深度學習模型，解構並重構人類思維

新聞 10-03

2017 年 11 月 8 日，在北京國家會議中心舉辦的 AI WORLD 2017 世界人工智慧大會開放售票！早鳥票 5 折搶票倒計時 5 天開搶。還記得去年一票難求的AI WORLD 2016盛況嗎？今年，我們邀請了冷撲大師」之父 Tuomas 親臨現場，且谷歌、微軟、亞馬遜、BAT、訊飛、京東和華為等企業重量級嘉賓均已確認出席。

「大咖解讀Bengio筆記」鄧侃：用深度學習模型，解構並重構人類思維

2017 年 9月 26 日，深度學習大佬 Yoshua Bengio 在Arxiv 上發表了一篇筆記，標題是 The Consciousness Prior 意識先驗。

之所以說這篇文章，不是嚴謹的論文，而是筆記，是因為這篇文章，既沒有嚴謹的演算法和公式，也沒有嚴謹的實驗結果和分析，而是一篇冥想和提議。

但是筆記往往比論文更有啟發，就如同與教授喝咖啡聊天，往往更容易學到教授的思想方法。

Bengio 把人類思維解構為三個層次：感知、表徵、意識

Yoshua Bengio 在這篇文章里，把人類思維解構為三個層次，感知Perception、表徵 Representation、和意識 Consciousness。

面對一張人物照片，人類「感知」到的，是一堆像素。進而抽象到「表徵」，包括五官、髮型、服飾、背景等等。再進一步抽象到「意識」，包括凝重的表情、粗獷的外表、蒼涼的環境等等。

Yoshua Bengio 提議，可以借鑒深度學習模型，譬如 RNN，來模擬從感知到表徵的第一次抽象的過程。

h_{t} = F( s_{t}, h_{t-1} )，其中 s_{t} 是感知的像素，h_{t-1} 是前序的表徵，h_{t} 是修正後的表徵。

他進而又提議，從表徵到意識的第二次抽象的過程，也可以借鑒深度學習模型來完成。

c_{t} = C( h_{t}, c_{t-1}, z_{t} )，其中 c_{t} 是意識，z_{t} 是噪音。

之所以有噪音，是因為意識的界定，往往模糊。譬如粗獷和野性，雖然有區別，但是難以並沒有嚴格界定。

假如我們有大量做好標籤的照片，就可以訓練從感知到表徵的深度學習模型 F(* )，和從表徵到意識的模型 C( * )。

一個簡單的系統架構，是3-layer stacked RNN。當然也可以嘗試用更多層的複雜架構，或者用 CNN 替換 RNN，或者用 Attention-based Transformer 來替換 RNN。

通過重構人類思維來驗證解構過程

從感知，到表徵，到意識，是人類思維的解構過程。為了驗證解構的正確，Yoshua Bengio 提議通過重構來完成驗證。

訓練好從感知到表徵的模型 F(* )，和從表徵到意識的模型 C( * ) 以後，假如電腦能夠自動合成一張人像照片，表情凝重、外表粗獷、背景蒼涼，那麼重構宣告成功。

如果重構成功，那麼解構也被證明是成功的。

重構的模型可以用 GAN 和 VAE 來嘗試。

打破語言的束縛，解放思維

模型 F(* ) 的輸出，是表徵，譬如五官、髮型、服飾、背景等等。模型C( * ) 的輸出，是意識，譬如表情凝重、外表粗獷、背景蒼涼等等。

意識的形態是張量，是一組數字。但是人類習慣用辭彙來表達意識。YoshuaBengio 提議意識與辭彙之間的關係，仍然可以用深度學習模型來模擬，

u_{t} = U( c_{t}, u_{t-1} )，其中 c_{t} 是意識，u_{t-1} 是前序辭彙，u_{t} 是修正後的辭彙。

哲學家維特根斯坦曾說，「人有著這種感覺，他心裡想說的話，總比他用言辭表述得更為清楚」。U( * ) 這個模型，把維特根斯坦的判斷，表述得既清晰又簡練。

人類的知識，往往由事實 fact 和規則 rule 組成，而且人類習慣於用簡練的辭彙，來表達事實和規則。所以，維特根斯坦認為，人類思維受制於語言結構，語言的界限決定思維的界限。

Yoshua Bengio 提議，直接用意識 c_{t} 來表達知識，而不受語言 u_{t} 的制約。

進而推論，不妨嘗試用深度學習模型，或者強化學習模式，來重構思維邏輯，而不屈從於規則和一階邏輯那樣的推理演繹方式的束縛。

作者小傳：

「大咖解讀Bengio筆記」鄧侃：用深度學習模型，解構並重構人類思維

鄧侃，大數醫達創始人。（郵箱：kan.deng@qq.com）上海交通大學本科及碩士，美國卡內基梅隆大學（CMU）計算機學院暨機器人研究所博士，專攻人工智慧及數據挖掘。

歷任美國甲骨文公司（Oracle）主任系統架構師，美國泰為手機導航公司（Telenav）北京分公司總經理，百度高級總監並主管網頁搜索和知識圖譜。

2015年，鄧侃創建北京大數醫達科技有限公司，旨在將深度強化學習技術應用於醫療健康領域。

大數醫達對幾億份三甲醫院病歷，進行結構化解析，構建海量訓練數據，並結合臨床指南，訓練醫療深度強化學習模型。用於實現面向患者的醫療諮詢服務，面向基層醫生的臨床導航服務，以及面向醫院和醫療保險的全流程精細化質量控制和成本控制服務。

11 月 8 日，鄧侃將在北京國家會議中心 AI WORLD 2017 世界人工智慧大會智能醫療論壇發表題為《多模態智能疾病診斷系統的四大技術難點》。世界人工智慧大會的5 折早鳥票還有 5 天截止，搶票請點擊「閱讀原文」或直接去往活動行頁面 http://www.huodongxing.com/event/2405852054900?td=4231978320026

歡迎登錄 AI WORLD 2017 世界人工智慧大會官網了解大會詳情。

官網地址：http://www.aiworld2016.com/cn/2017.html

在此，讓我們透露一下鄧侃老師的精彩演講內容：

演講主題：多模態智能疾病診斷系統的四大技術難點

北京大數醫達科技有限公司，實現了多模態智能疾病診斷系統，該系統把 CNN、RNN、Attention、GAN、RL、MCTR、Knowledge Graph 等多種前沿技術融為一體，構建醫學智能診斷新體系。本演講重點介紹該系統以下 4 個方面的技術難點。

1. 把多模態數據，都轉換成以醫療知識圖譜為軸心的語義向量，在同一個參照系下進行相互比較和交叉操作。

2. 在知識圖譜為軸心的語義向量空間中，融合多模態數據，並使用生成對抗模型提供可行又可靠的質量評估方案。

3. 用卷積神經網路技術，從病情描述中提煉病情特徵，用聚焦機制，從醫學知識圖譜中補充相應病理邏輯，優化疾病的診斷與驗證。

4. 用深度強化學習和蒙特卡洛搜索樹技術，給醫生推薦最佳後續化驗和檢查項目，補充病情描述，用最小的代價，找到診斷金指標，提高診斷精度。

【掃一掃或點擊閱讀原文搶購五折「早鳥票」】

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！