猶他大學計算機系終身教授承恆達:人工智慧中不確定性的研究
雷鋒網按:2018 全球人工智慧與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,得到了深圳市寶安區政府的大力指導,是國內人工智慧和機器人學術界、工業界及投資界三大領域的頂級交流盛會,旨在打造國內人工智慧領域最具實力的跨界交流合作平台。
在大會第一天的「AI 前沿」專場,美國猶他州立大學計算機系終身教授、電子工程系兼職教授、計算機視覺與模式識別實驗室主任承恆達帶來了題為「Studying Uncertainty in Artificial Intelligence」的主題演講。
承恆達教授於 1985 年獲得普渡大學電子工程專業博士學位,師從國際著名專家、智能控制學科奠基人、模式識別學科創始人傅京孫(K.S. Fu)教授,他的主要研究方向包括模糊邏輯、計算機視覺、模式識別、圖象處理,近年來專註於模式識別基礎理論和乳腺癌早期診斷技術的研究。
承教授在演講中講解了人工智慧中的不確定性,用通俗易懂的例子闡述了這一研究對人工智慧領域一系列關鍵問題的推動意義。
他表示,人們在經典邏輯的基礎上發展出微積分、代數、經濟學、生物學等一系列學科,但是經典邏輯存在許多悖論,所以需要提出新的邏輯。「經典邏輯的值是 0 和 1,但模糊邏輯不一樣,它的值在 0 和 1 之間,能解決一些經典邏輯不能解決的問題。模糊邏輯在科學和工業上也已經得到了許多的應用。」
隨後,他進一步討論了模糊邏輯不能解決的問題,比如兩名審稿人評審同一篇學術論文,論文接收的隸屬度都是 0.8,可是前者是專家,後者是新人,這兩個 0.8 對文章的接收是有不同影響的,但在模糊邏輯下這兩者沒有區別。把模糊邏輯作為一個子集,在其基礎上,發展出新的中智邏輯,就可以進一步解決這些問題。在中智邏輯的基礎上,他們對 Neutro Connectedness 進行研究,在這一過程中提出一系列效果極好的演算法。他們目前正在與醫院和體檢中心合作,進行乳腺癌的早期診斷,此外,也在進行多功能道路裂紋檢測的相關研究。
以下為承恆達教授的演講全文,雷鋒網做了不改變原意的編輯整理。
很多人問我為什麼要研究不確定性,原因很簡單。不確定性遍存於宇宙中,不同的領域有不同的不確定性,研究不確定性能夠很好地解決有關問題,從而得到好的結果。
如何處理不確定性?現在有多種不同的方法,比如說對於隨機性可以用概率(probability)來解決,此外還產生了其他的不確定性,因此產生了其它的各種邏輯,如模糊邏輯(fuzzy logic)、粗糙集(rough set)、可能性理論(possibility)等。
建立在經典邏輯基礎之上,人們發展出微積分、代數、經濟學、生物學等等,可是哥德爾證明了科學是不完備的,經典邏輯存在許多悖論,所以需要提出新的邏輯。
經典邏輯的值是 0 或 1,不是黑就是白。模糊邏輯就不一樣,它的值在 0 和 1 之間。比如說你在冰雪道上開車,不可能將剎車踩死或者乾脆不踩剎車,所以絕不是按 0,1 這種邏輯來做。當然,模糊邏輯的提出已經得到了許多的應用,比如科學上、工業上,像手機聚焦就是利用模糊邏輯。
模糊邏輯隸屬度在 0 和 1 之間,概率也是在 0 和 1 之間。很多人說,那這樣的話,概率和模糊邏輯有什麼差別?前者是建立在隨機性的基礎上,後者是建立在精確性的基礎上。
舉個例子來說明模糊邏輯和概率的不同。假定你在沙漠里必須得喝水才能存活下去,但水被污染了。假定致命水平是 0.4,你需要從兩個盒子里選出一瓶水來喝,那你應該從下圖中的哪個盒子里選擇呢?每盒各有十瓶水,假定第一盒有兩瓶被污染了,概率是 0.2,第二盒十瓶水均被污染了,隸屬度是 0.2。這時候你應該從第二盒中拿水喝。
如果第一盒有四瓶水被污染,概率是 0.4,而第二盒水被污染的隸屬度是 0.4,在這個基礎上你從哪個盒子里選呢?從第一個盒子里選還有機會活下來。
所以模糊邏輯和概率是不一樣的。如果用模糊邏輯作為一個子集,又可以發展出新的中智邏輯(Neutrosophic logic)。這個新的邏輯包含 I、T、F 三個集合,它們可在 0 和 1 之間取值。
如果從邏輯上看,經典邏輯是 0,1 兩個孤立的點,模糊邏輯是一條線,中智邏輯可以考慮成一個球體,能解決一些模糊邏輯解決不了的問題。比如說兩名審稿人評審同一篇學術論文,論文接收的隸屬度都是 0.8,可是前者是專家,後者是新人,這兩個 0.8 對文章的接收是有不同影響的。
可是在模糊邏輯下這兩個是沒有區別的。如果我們有不確定變數 I(indeterminate),就可以區分這兩者。
計算機視覺中存在很多不確定性:
比如由三維到二維變化的過程中存在信息丟失;另外有些定義本身就是模糊的,比如邊緣(edge),對比度(image contrast)等;有時候沒有一個客觀標準來衡量問題,常常採用一些主觀方法,比如投票等;用一些辭彙來描述差異,比如說熱,很熱,特別熱,一點點熱等,這些可以用模糊邏輯解決得很好。
同時在醫學影像中,醫生可能會進一步引入主觀性和模糊性。
1994 年 Fuzzy Connectedness(模糊連接度)被提出,大家知道它在空間理論上有很多應用,在這個理論提出之後,最近我們又提出 Neutro Connectedness(中智連接度),建立在新的中智邏輯基礎上。我們基於 SVM 提出了新的 NSVM。大家都知道 K-Means 是經典邏輯很有力的工具,後來在此基礎上有研究人員提出 Fuzzy C-Means ,我們又提出 L-Means 工具。
這是我們在發展 Neutro Connectedness 的過程中提出來的一些方法,包括一些運算和運算符,同時我們定義了兩點之中的 Neutro Connectedness,公式細節就不多講了。
我們還從點到點,從點到集合定義了 Connectedness。Connectedness 可以用在圖像處理或者一些其他應用上。我們進一步提出 Neutro-connectness Cut,下圖是演算法的詳細過程。
我們也做了實驗,下面是實驗的數據集以及評估標準等。
下圖最上面是原始圖像和目標圖,如果原始圖像離目標圖像比較遠,可以看到,用以前演算法的結果比較差,但我們這個演算法能得到比較精確的結果。
下圖是另外一個例子,我們的演算法用非常少的種子點就可以解決分割問題,當然,種子點越多,結果會越精確。
我們還用圖像處理的一些方法來診斷乳腺癌。乳腺癌發病率比較高,在美國,八個婦女中就有一個會得乳腺癌,而且發病率還在增加,但是死亡率卻在下降,這是因為美國政府投入了大量的研究經費,來研究乳腺癌的早期診斷。
在中國乳腺癌的發病率和死亡率都在增加,所以早期診斷就成為一個很重要的因素。我們開始研究是用 X 光,但因為 X 光具有放射性,後來我們就轉到用超聲,超聲本身沒有放射性,很方便,而且價格低廉,適合普查。除了 X 光,CT 也有一定的放射性,而且 CT 和 MRI 更貴一些,也不適合普查。
但超聲圖象雜訊很大(因為固有雜訊),另外質量比較差,同時現在超聲科的醫生數量大大少於需求。非常有必要建立一個計算機輔助診斷系統,能夠檢測乳腺癌,幫助醫生。我們實際上對這一系統進行了 20 多年的研究。
利用演算法可以精確地分辨腫瘤,目前這個系統可以得到比較高的精度,另外也能夠幫助醫生改進診斷率,提高診斷精度。
因為現在超聲科醫生很少,可以利用這一系統訓練醫學院的學生,將學生檢測的結果和系統檢測的結果進行比較就可以促進學生學習。而且系統能夠提供很好的服務,這對於低資源地區和國家極有意義。如果有了這個系統,相當於超聲機自帶一個經驗豐富的醫生。在這裡我們也用了一些方法來解決不確定性。最近我們正在把系統放在醫院和體檢中心,和他們做一些合作。
另外,我們做了多功能的道路裂紋檢測車,可以全自動檢測路面的裂紋。現在,一些單位或機關會先採集圖像,再回去手工檢測,我們的系統完全可以自動檢測。相應的系統還可以用於機場裂紋檢測、隧道等場景。
在檢測的時候,一定要排除太陽光的影響,要有補光系統,路面噪音也很大,我們也用了一些方法來解決不確定性問題,這時就可以檢測出裂紋,然後可以對裂紋進行分類,最後需要進行修補的時候,就可以根據圖像來計算需要多少材料,到什麼地方去修補等。
雖然中智邏輯用了模糊邏輯做子集,但我認為它也是一個過渡邏輯。
※科技時代的萬國博覽會,零一科技想挖掘人們「第二天性」
※英特爾正在測試僅為50nm的最小自旋量子位晶元
TAG:雷鋒網 |