當前位置:
首頁 > 新聞 > 「突破」深度學習計算消耗降低95%,KDD2017哈希法研究加速神經網路進化

「突破」深度學習計算消耗降低95%,KDD2017哈希法研究加速神經網路進化

「突破」深度學習計算消耗降低95%,KDD2017哈希法研究加速神經網路進化

新智元報道

「突破」深度學習計算消耗降低95%,KDD2017哈希法研究加速神經網路進化

美國萊斯大學(Rice University )的計算機科學家通過使用被廣泛使用的快速數據查找技術,以大幅度減少深度學習所必需的計算量,進而大大地節約了能源和時間。

萊斯大學計算機科學家已經採用了廣泛使用的快速數據查找技術,以減少計算量,從而減少了深度學習所需的能量和時間,這是一種計算強大的機器學習形式。

「這能運用到任何一種深度學習架構中,並且,其技巧是亞線性擴展的,也就是說,運用的神經網路越大,能節省的計算資源就會越多」,萊斯大學計算機科學系助理教授、該研究的第一作者 Anshumali Shrivastava 介紹說。

研究將會出現在2017年的 KDD 會議上,會議將於8月在Nova Scotia的Halifax 舉辦。這一研究解決了谷歌、Facebook 和 微軟等這些爭先恐後地希望搭建、訓練和部署大規模的深度神經網路的科技巨頭最緊迫的需求之一。它們希望用深度學習來滿足越來越多的產品需求,如自動駕駛汽車,語言翻譯和智能回複電子郵件等。

Shrivastava和 Rice 大學的研究生 Ryan Spring 證明,「哈希」(Hashing)技術是一種真實的數據索引方法,可以大大減少深度學習的計算消耗。「哈希」 涉及使用智能散列函數將數據轉換為可管理的小數,稱為哈希。哈希被存儲在表格中,其運行方式就好像紙質書中的索引。

「我們的方法混合了兩種技術:一個局部敏感哈希 clever 變數,以及一個稀疏的反向傳播。這樣就能在不大量地降低準確率的情況下,減少必要的計算消耗。Spring 說,「比如,在小規模的測試中,我們發現在標準方法下,能在準確率損失控制在1%的情況下,將計算能耗減少95%。」

深度學習網路的基礎建造模塊是一個人造神經元。雖然1950年代,生物神經元的首先被發現,但是,人造神經元只是一個數學函數和等式,建立在大量的數據之上,可以轉化為輸出。

在機器學習中,所有的神經元都從一張白紙的「空」狀態開始,在訓練過程中變得特異化(specialized)。在訓練期間,網路被「給予」大量數據,每個神經元都成為識別數據中特定模式的專家。在最低層,神經元執行最簡單的任務。例如,在照片識別應用中,低級神經元可能識別來自暗處的光線或物體的邊緣。這些神經元的輸出被傳遞到網路下一層的神經元中,這些神經元又會以其特有的方式搜索它們會識別的特徵。

只有幾層的神經網路就可以學習識別人臉、各種犬類、停車標誌和校車。

Shrivastava 說:「向網路的每層增加更多的神經元可以增強其表現力(expressive power),而且我們想要網路有多大這一點沒有上限。」

據報道,谷歌正在嘗試訓練一個擁有 1370 億個神經元的網路。相比之下,訓練和部署這樣的網路需要的計算力是有限的。

Shrivastava 說,目前使用的大多數機器學習演算法都是 30 到 50 年前開發的,在設計的時候沒有考慮到計算的複雜性。但是,有了大數據之後,對於計算周期、能源和內存等資源來說,就存在著基本的限制,而「我們的實驗室側重於解決這些限制。」

Spring 表示,在大規模深度網路中,hashing 帶來的計算和節能將會更大。

Spring 說,由於他們利用大數據中固有的稀疏性,因此能量的節省會隨著網路規模的增加而增加。「假設一個深度網路有 10 億個神經元,對於任何一個給定輸入——例如一張狗的圖片——只有少部分神經元會被激活。

在數據科學的術語中,這就叫做稀疏性(sparsity),而正因為有了稀疏性,他們的方法節省的能量會隨著網路規模的擴大而增加。

「所以,1000 個神經元的網路我們能節能 95%,根據數學推導,10 億個神經元的網路我們就能節能 99%。」

原文:https://phys.org/news/2017-06-scientists-slash-deep.html#jCp

「突破」深度學習計算消耗降低95%,KDD2017哈希法研究加速神經網路進化

Ryan Spring (左) 和 Anshumali Shrivastava.

通過隨機哈希實現可擴展、可持續的深度學習

這篇論文《通過隨機哈希實現可擴展、可持續的深度學習》(Scalable and Sustainable Deep Learning via Randomized Hashing),已經作為 Oral 被 KDD 2017 接收。

雖然論文的同行評議版本要到 KDD 召開時才能得知,通過網上的資料,我們可以看到去年底 Spring 在 arXiv 上傳的論文預印版(地址:https://arxiv.org/pdf/1602.08194.pdf)。

下面是論文的摘要。

「突破」深度學習計算消耗降低95%,KDD2017哈希法研究加速神經網路進化

為了從複雜的數據集中學習,當前深度學習框架越來越大。這些框架需要進行巨大的矩陣乘法運算來訓練數百萬個參數。與此相反,另一個呈增長的趨勢是將深度學習帶入低功耗、嵌入式設備。為了訓練和測試深度網路而進行的相關矩陣運算,從計算和能量消耗的角度看是非常昂貴的。我們提出了一種基於 Hashing 的新技術,大幅減少了訓練和測試神經網路所需的計算量。我們的方法結合了最近提出的兩大概念,即自適應 dropout 和最大內部搜索(MIPS)隨機 Hashing,有效選擇網路中具有最高激活的節點。

這一新深度學習演算法通過在(數量明顯更少的)稀疏節點上運行,減少前向和後向傳播步驟的總體計算成本。因此,我們的演算法在保持原始模型平均精度 1% 的同時,僅使用總乘法的 5%。

論文提出的基於 Hashing 的反向傳播演算法,一個獨特屬性是 update 總是稀疏的。而由於稀疏梯度 update,我們的演算法非常適合異構和並行訓練。通過在幾個真實數據集上進行嚴格的實驗評估,我們證明了提出的演算法具有可擴展性和可持續性(能量效率高)。

神經網路進行隨機哈希的視覺展示

「突破」深度學習計算消耗降低95%,KDD2017哈希法研究加速神經網路進化

圖1:從圖中可見,神經網路 Low-Rank 假設需要的參數數量自然會更少

「突破」深度學習計算消耗降低95%,KDD2017哈希法研究加速神經網路進化

圖2:對神經網路進行隨機哈希的視覺展示。① 建一個哈希表,方法是對每個隱藏層(一次迭代)的權重做哈希。② 使用該層的隨機哈希函數對該層的輸入做哈希。③ 查詢這一層的哈希表,獲取激活數據集 AS。④ 僅在激活神經元上做前向和後向傳播。⑤ 更新 AS 權重和哈希表。

56 核的英特爾 Xeon ES-2697 處理器上的性能比較

「突破」深度學習計算消耗降低95%,KDD2017哈希法研究加速神經網路進化

圖7:一個標準網路使用我們的方法(隨機哈希)和使用異構隨機梯度下降,在 56 核的英特爾 Xeon ES-2697 處理器上的性能比較。我們依次在 MNIST、NORB、Convex 和 Rectangles 數據集上進行了測試。所有網路的初始值都是一樣的。

「突破」深度學習計算消耗降低95%,KDD2017哈希法研究加速神經網路進化

圖8:新方法(LSH-5%)使用異構隨機梯度下降每步(per epoch)獲得的掛鐘時間。我們用一個有 3 層隱藏層的網路,依次在 MNIST、NORB、Convex 和 Rectangles 數據集上進行了測試。Convex 和 Rectangles 數據集上增量較少,是因為在整個過程中可用的訓練樣本不夠多。實驗中只使用了 5% 的標準網路計算量。

更多內容,請見論文預印版(地址:https://arxiv.org/pdf/1602.08194.pdf)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

「吳恩達推薦」中美 AI 之爭是偽命題,互聯網女皇報告高亮中國優勢(下載)
「GAN X NLP」自然語言對抗生成:加拿大研究員使用GAN生成中國古詩詞
為什麼人會隨著長大變「聰明」:兒童認知能力的大腦神經網路基礎
「六一特稿」為什麼人會隨著長大變「聰明」:兒童認知能力的大腦神經網路基礎

TAG:新智元 |

您可能感興趣

2019年H1:光環新網營收34.56億元,IDC和雲計算業務加速推進
英特爾優化4路112核高密度計算,下下代14nm晶元提升16位性能
阿里2018營收2502億元,雲計算業務增幅超100%
邊緣計算推進AI與5G發展,2022年市場規模成長率超30%
2018年1-11月上海市微型計算機設備產量同比下降42.1%
共享計算成迅雷主力業務 2017年Q4收入增長超500%
IDC:2018雲計算環境中部署IT基礎設施開支將達523億美元
谷歌2019學術影響力新榜:CVPR躍升總榜前10,工程與計算機第2
AI摩爾定律繼續超速?2028年,1美元能買200GFLOPS計算力!
iOS11.3修復計算器BUG,1+2+3終於等於6了
光環新網2017年營收達40億元 雲計算服務收入占 70%
小米6X將成最便宜驍龍660手機:僅1499元,AI加持計算卡路里
英特爾推出FPGA加速卡D5005:自帶32GB DDR4內存,助力高性能計算
考眼力!56秒內找到顯示758707的計算器就能創造新紀錄
10%+10%=0.11?各廠商手機計算器全線陣亡
2017年中國計算機科學領域被引用最多的153位學者!
2017年度計算機科學各領域熱點辭彙
雲計算業務持續增長,微軟19年Q3營收超預期達306億美元
錄像存儲和時間計算方法 H.264&H.265
英特爾最新Xeon D-2100系列晶元,高能低耗瞄準邊緣計算