GTC17:百度用「稀疏訓練」使RNN體積降低90%
正在舉辦的GTC17上,百度矽谷AI實驗室的研究員Saran Narang發布了百度對於RNN(循環神經網路)的最新研究,他們稱可將其體積減少90%,而方法是採用了「稀疏訓練」(Sparse Training)。
循環神經網路(RNN)被廣泛用於解決各種問題,隨著數據量和可用計算量 的增加,模型規模也越來越大。最近,最先進的網路中大量的參數使其難以部署,特別是在手機和嵌入式設備上。我們所面臨的挑戰是模型的大小和評估它所花費的時間。為了有效部署這些RNN,我們提出了一種通過在網路的初始訓練期間修剪權重來減少網路參數的技術。訓練結束時,網路參數稀疏(sparse),準確度仍然接近原來的密集(dense)神經網路。該網路規模縮小8倍,訓練模型所需的時間保持不變。此外,我們可以修剪較大的密集網路,以達到比基準性能更好的效果,同時仍然顯著減少參數的總數。修剪RNN減少了模型的體積,並且還可以幫助使用稀疏矩陣乘法 (sparse matrix multiply)實現顯著的推理時間加速。基準測試顯示,使用我們的技術,模型體積可以減少90%,加速大約2-7倍。
論文如下(請點擊下載)
https://arxiv.org/abs/1704.05119?from=singlemessage&isappinstalled=0
※Facebook最新機器翻譯研究成果—CNN比RNN更有效
※購物機器人加持新零售,商場的新春天來了
※AI在中國製造業的應用如何評價?這本叢書將補空白!
※AI已經觸摸到零售和廣告業,這五大領域不容錯過
※同濟大學人工智慧研究院揭牌
TAG:機器人圈 |
※華擎發布4X4 Box-R1000超緊湊PC:採用銳龍平台 體積僅0.87升
※適馬新頭56mm F1.4 DC DN體積驚人
※體積僅11L 惠普戰推66 Pro G1台式機
※《荒野大鏢客:救贖2》PS4 pro版本體積高達105G
※僅售189,可以安裝兩個280冷排,支持RTX2080ti,小體積,大容量
※把U盤做成了SSD!體積爆減數倍 速度飈400MB/s
※體積僅11L 惠普戰66 Pro G1台式機圖賞
※8999元 索泰麥克NEK1-N7遊戲主機體積不足全塔1/3
※開發者打造 Win 95 應用程序:安裝包體積約為 129MB
※會場限定超級大體積1/48比例Mega Size RX-78-2高達透明版開坑!
※蘋果發布Swift 5:減小iOS 12.2應用體積
※高效實用體積小高影儀 方正 Q320C售690元
※ECS推出AMD平台迷你PC:支持35W銳龍處理器,體積僅1L
※1+1<2?兩架F-16戰機的體積也抵不過一架C-17
※英偉達發布「全球最大GPU」:體積縮小60倍、能效提升18倍
※盾牌座uy體積是太陽的45億倍,r136a1變紅超巨星該多大
※列印體積達9×3×1.5m!金屬3D列印公司Titomic推出世界最大金屬3D印表機
※英特爾10nm處理器實拍圖 相比14nm體積縮小13%
※騰龍FE 28-75mm鏡頭實物曝光 體積不小
※松下Lumix S1R全幅微單 vs Lumix G9 和 GH5s體積對比