當前位置:
首頁 > 最新 > 和AI也能玩「你畫我猜」?「靈魂畫手」背後的技術了解一下!

和AI也能玩「你畫我猜」?「靈魂畫手」背後的技術了解一下!

葯明康德AI/報道

本文來源:葯明康德AI

在體驗這款遊戲的過程中,我們很驚奇地發現,有的時候就算我們只畫出了一個輪廓甚至其中一筆,AI也可以順利地猜出正確答案。這背後的原理究竟是什麼呢?

▲AI是怎麼猜對這幅未完成的「靈魂畫作」就是麵包車的呢?(圖片來源:小程序截圖)

「靈魂畫手」背後的工作原理

事實上,「猜畫小歌」使用了一種名為遞歸神經網路(RNN)的技術,建立在一個包含5000 萬個手繪素描的數據群的基礎之上。遞歸神經網路主要刻畫一個序列當前的輸出與之前信息的關係,也就是說,RNN會記憶之前的信息,並且利用之前的信息影響後面的輸出。

除了RNN技術之外,計算機視覺技術也是「猜畫小歌」如此厲害的原因之一。計算機視覺是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。也就是說,這項技術能讓計算機直接理解輸入的視覺信息,並由此「看到」這個世界

▲欣賞一下AI完成的塗鴉作品(圖片來源:arXiv.org)

谷歌AI研究人員在去年發表的一篇論文中就介紹了一項訓練AI學會塗鴉的研究:在訓練AI識別人們的塗鴉時,科研人員們受人類繪畫過程的啟發,降低維度,通過用大量的手繪塗鴉來組成數據集訓並輸入到RNN中,再輔以計算機視覺技術,從而讓AI在識別這些圖像之後,能夠理解人們在繪製塗鴉時是在何時起筆、走筆方向、何時停筆。經過訓練的RNN在接收一張人手繪的塗鴉後,可以生成一張同主題的新塗鴉。

▲即使是一張牙刷的圖片,神經網路也可以把其改造成貓的形態(圖片來源:arXiv.org)

值得注意的是,在這裡AI並不是機械地完成了重複人的塗鴉作品這一操作,而是真正對圖像的本質進行了分析和理解。能夠很好地說明這一點的例子就是,當輸入神經網路的貓圖像為非典型圖像(例如少一根鬍子、沒有嘴巴,或者多一隻眼睛等),甚至輸入的圖像根本不是貓的時候,AI也可以根據貓的特徵,對圖像進行修正。

▲AI可以對未完成的塗鴉作品的下一筆進行預測,從而呈現不同的圖像(圖片來源:arXiv.org)

同時,RNN還可以完成很多神奇的操作,例如將不同的模型塗鴉進行類比,或者對下一筆要畫什麼進行預測,從而在在同一個元素的基礎上,產生各式各樣的作品。

醫療領域的應用

RNN和計算機視覺這麼神奇的技術,是否可以應用於醫療領域呢?這個答案是肯定的。目前,研究人員已經將這些技術應用到人們的生活中,同時也進行了很多創新研究,實現了醫療領域的很多突破。

在神經網路應用方面,近日加州理工學院的生物工程助理教授錢璐璐團隊用DNA製造出了一種人工神經網路,可以完成正確識別手寫數字的過程。該神經網路需要識別的是「分子筆跡」,而不是手寫數字的幾何形狀。DNA神經網路可以將一個分子筆跡分為9個類別,每類代表從1到9的九個手寫數字之一。當一個未知數字出現時,該神經網路在進行一系列識別過程後會輸出兩個熒光信號,來代表其識別出來的結果。這項研究標誌著人工智慧在編入合成生物分子電路方面,邁出了重要的一步。

DNA人工神經網路識別數字6和7過程的示意圖(圖片來源:《Nature》)

另外,谷歌的研究人員近日也成功訓練出了一個遞歸神經網路,可以自動映射大腦的神經元結構並構造神經元和突觸的3D模型,從而將大腦的神經元網路結構自動重現。研究人員使用邊緣探測演算法來確定神經元的邊界,同時使用遞歸卷積神經網路,來將圖像中和神經元相關的像素集中到一起並不斷對該區域進行填充,神經網路會預測哪些像素與初始像素屬於同一個物體。研究人員表示,該研究和之前的深度學習技術相比,準確度「提升了一個數量級」。

GIF

▲演算法對斑胸草雀大腦中的單一神經元進行追蹤的過程示意圖(圖片來源:Google AI Research Blog)

而計算機視覺技術在醫療方面的應用就更加廣泛了。從識別人類視網膜圖像中體現的心血管疾病風險因素,到以比人類醫生更高的準確率來診斷癌症,計算機視覺技術加持下的AI在醫療領域顯示出的潛力越來越大。

谷歌大腦研究小組利用深度學習,在人體產生的變化和疾病之間建立聯繫。研究人員通過對284335名患者的視網膜圖像進行深度學習的演算法研究,能以驚人的高準確度預測病人的心血管疾病風險因素,而這些因素在此之前並不能通過視網膜圖像被識別出來。風險因素包括:年齡、性別、吸煙狀況、收縮壓、不良心血管事件等。例如,深度學習技術通過視網膜圖像區分吸煙者與不吸煙者,準確率達到了71%。此外,雖然醫生通常可以區分嚴重高血壓患者和正常患者的視網膜圖像,但AI演算法可以進一步預測在11 mmHg以內的患者平均收縮壓。這些研究結果可以幫助科學家做出更有針對性的假設,從而推動未來的廣泛研究。

▲左圖:正常的視網膜圖像;右圖:視網膜的黑白圖像,其中AI演算法在推測影響心血管因素時使用的像素被標記為綠色(圖片來源:《Nature Biomedical Engineering》)

AI在檢測黑色素瘤方面的表現,也已經超過了經驗豐富的皮膚科醫生。在一項研究中,研究人員使用了超過10萬張皮膚癌圖像及診斷結果對AI進行訓練,提高其區分皮膚癌和良性皮膚痣的能力。在完成訓練後,研究人員使用了300張新圖像,來對CNN識別癌症的能力進行評估,並同時邀請人類專家完成同樣圖像的診斷。研究結果顯示,在第一階段,皮膚科醫生能夠準確檢測到平均86.6%的黑色素瘤,同時也可以準確識別出平均71.3%的非惡性病變。然而,當AI識別良性痣的準確率達到同樣的71.3%時,它檢測出黑色素瘤的準確度竟高達95%!這一成績已經超越了人類皮膚科醫生的表現。

▲CNN檢測結果(紅色曲線)與皮膚科專家檢測結果平均值(大型墨綠色圓點)對比。可以看出,當特異度(X軸)數值相同時,CNN檢測結果的敏感度(Y軸)數值明顯高於皮膚科專家檢測結果(圖片來源:《Annals of Oncology》)

看到這裡,你是不是對AI版你畫我猜背後的RNN和計算機視覺技術,以及它們在醫療領域的應用有了更進一步的認識了呢?我們也希望,這些技術在未來能夠更加廣泛地應用於醫療健康領域,從而為我們的生活帶來更多的便利。

參考資料:

[1] A Neural Representation of Sketch Drawings

[3] AI 是怎麼讓機器學會塗鴉的?

[4] A beginner』s guide to AI: Neural networks

[5] 華人學者新突破!錢璐璐團隊開發DNA人工神經網路,能夠識別手寫數字

[6] 重磅!谷歌新AI演算法可重現大腦結構,自動追蹤繪製神經元(動圖)

[7] 重磅進展!谷歌AI從視網膜圖像識別心血管疾病

[8] 重磅研究首次表明:AI檢測皮膚癌,表現已優於人類專家!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 葯明康德AI 的精彩文章:

還在做數學題測智商?AI在幾秒鐘內就能判斷你有多聰明!
華人學者開發新演算法,可準確預測精神疾病治療結果!

TAG:葯明康德AI |