當前位置:
首頁 > 知識 > 面向開發者的2018年AI趨勢分析

面向開發者的2018年AI趨勢分析

摘要: 本文從開發者的角度分析2018年AI的趨勢:拿來即用的AI領域、演算法與技術。例如GANs、ONNX、Zoo、AutoML、語音識別、時間序列分析、NLP、高智能機器人等。

在2017年有些人工智慧的技術已經變得非常成熟,並已做好了大規模應用的準備。這就是本文將要討論的問題---介紹當前的工作中能夠使用的技術,或者能基於哪些技術來構建自己的創業公司。例如,您可以看到時間序列分析,因為在時間信號處理中,深度學習正在迅速取代以前的技術。但是在這你看不到強化學習,即使它更酷,但依我拙見,它現在還不能用於工業應用。但,它是一個非常具有研究價值的領域。

我將在三篇系列文章中,分別從人工智慧研究員、應用機器學習開發人員和普通人三個不同的觀點出發,分享我對未來一年在人工智慧領域將會發生什麼的觀點。


生成對抗網路(GANs)

之前我對幾年前創建的生成對抗網路保持非常懷疑的態度,即使它這幾年進步巨大,尤其在讀完數學文章後更加懷疑GAN是否真的了解分布。但是今年這種情況發生了一些變化,首先是新的有趣的架構(如CycleGAN)和數字改進(Wasserstein GAN)讓我在實踐中嘗試使用了GANs,而且它們工作的差不多都很好,在接下來的兩個應用程序中,我確信我們可以並且必須使用它們來生成。

首先,我非常喜歡英偉達(NVIDIA)關於生成逼真的全高清圖像的研究報告,但是我真正喜歡的是並留下深刻印象的是生成假的色情影片。

面向開發者的2018年AI趨勢分析

其次,它正在被廣泛應用到遊戲行業,如生成景觀,英雄人物,甚至用GANs創建整個世界。而且我們必須意識到這種全新的假貨水平,從生成假的影片開始,最後將在網上生成能夠以假亂真的人(也許很快就會實現了)。


所有神經網路的獨特格式

現代發展的一個問題是,許多不同的框架在做同樣的事情,如今,每一家從事機器學習的大公司都擁有自己的框架和其他開源解決方案。

在單獨的AI應用中,我們希望使用不同的框架,例如計算機視覺的Cafle2, NLP的PyTorch和一些推薦系統的Tensorkow/Keras。合併它們需要大量的開發時間,它分散了數據科學家和軟體開發人員從事更重要任務的注意力。

解決方案必須是一種獨特的神經網路格式,可以很容易的從任何框架中獲得,然後開發人員能夠輕鬆地部署,科學家可以輕鬆地使用,在這裡我們遇到了ONNX標準:

面向開發者的2018年AI趨勢分析

實際上它只是簡單的非循環計算圖表格式,但在實踐中它給了我們機會部署真正複雜的人工智慧的解決方案,我個人認為非常有吸引力的是:人們可以在沒有強大的部署工具並且不依靠TensorFlow生態系統的前提下,在PyTorch這樣的框架中開發神經網路。


Zoos大爆發

之前我使用Cafle Zoo的模型進行遷移學習或特性提取,最近發現它就像大型計算機視覺管道的一部分一樣。這意味著實際上沒有必要訓練自己的網路,例如,對於ImageNet對象的識別或局部識別,這些基本的東西可以下載並插入到您的系統中。除了Cafle Zoo之外,還有其他一些框架的Zoo,但讓我驚奇的是,你可以在計算機視覺、NLP和加速計信號處理的iPhone上插入模型:

面向開發者的2018年AI趨勢分析

我認為這些Zoos會越來越多,並且會關注像ONNX這樣的生態系統,它們會更加集中(同時也會使用ML區塊鏈應用程序進行分散)

AutoML更換管道

設計一個神經網路框架是一個非常痛苦的任務——雖然有時通過疊加卷積層能獲得相當好的結果,但是大多數時候需要非常小心的使用直覺和超參數搜索方法設計寬度、深度和超參數,如隨機搜索或者貝葉斯優化。特別是當你不在計算機視覺研究時,這意味著沒法在ImageNet上完成一些DenseNet模型的訓練,但是可以使用一些3D數據分類或多變數時間序列應用。

雖然有很多不同的方法嘗試從一個神經網路中創建另一個神經網路架構。但對我來說最好用最乾淨的是最近的Google研究開發結果:

面向開發者的2018年AI趨勢分析

他們能夠用它來生成比人類設計的網路更好更快的計算機視覺模型!我相信很快會有很多關於這個話題的論文和開源代碼。


形式化的智能堆棧

為了了解這一概念,我大量閱讀了俄羅斯系統分析師和AI愛好者的Anatoly Levenchuk的博客。在下圖中你可以看到一個能夠稱為「AI堆棧」的例子:

面向開發者的2018年AI趨勢分析

http://www.tvmlang.org/2017/10/06/nnvm-compiler-announcement.html

「AI堆棧」更深層次,在每一個層面都有自己的發展和研究,而不只是由機器學習演算法和你最喜歡的框架構成。

我認為人工智慧開發行業已經足夠成熟,它需要有更多不同的專家。在團隊中只有一名數據科學家是遠遠不夠的——你需要不同的人來進行硬體優化、神經網路研究、人工智慧編譯器、解決方案優化、生產實現。以上人員必須是不同的團隊領導,軟體架構師(必須分別為每個問題設計上面的堆棧)和管理者。我曾經提到過這個概念,它提供了一些願景,在未來人工智慧領域的技術專家能夠成長成什麼樣子(對於那些想成為人工智慧或技術領域的軟體架構師的人來說,你需要知道該研究什麼)。


基於語音的應用

AI可以用>95%的精確度解決的問題列表其實很短,我認為還有一個領域可以通過努力達到這個標準,那就是語音識別和生成。實際上,從一年前DeepMind的WaveNet發展到最近谷歌開發的Tacotron2,該技術已經進步飛快:

面向開發者的2018年AI趨勢分析

很快,這項技術將會在開放源碼中被發布,每個人都能夠識別聲音並以非常高的準確度生成它。等待我們的是什麼?更好的個人助理,自動圖書朗讀器和談判抄寫員,當然,還有配音。


更加聰明的機器人

我們今天看到的99%的機器人根本不是人工智慧,它們只是硬編碼或者最好的情況下機器人有一些基於句子分類神經網路的長短期記憶網路(LSTM)和詞向量(word2vec)。但是現在最先進的神經語言程序學(NLP)略高於這個水平了。讓我們看看Salesforce做了哪些有趣的研究:

面向開發者的2018年AI趨勢分析

他們將NLP介面構建到資料庫中,克服了現代編碼-解碼器的自回歸模型,不僅只對文字或句子,還對字元進行訓練嵌入。

我相信,通過這些開發,我們可以增強我們的機器人,至少在更智能的信息檢索和命名實體識別方面,或許也可能,在一些封閉的領域實現完全深度學習驅動的機器人。


時間序列分析現狀

在公共機器學習實驗室里,排在Salesforce之後的第二名是嚴重被低估的Uber AI Labs。不久前,他們發布了一個博客展示了他們對時間序列預測的方法。下圖所示,這是一個非常好的將統計特徵和深度學習表現結合的例子:

面向開發者的2018年AI趨勢分析

例如使用34-layer 1D ResNet模型診斷心律失常。它最酷的部分是性能:不僅比常見的統計模型更好,甚至診斷準確率優於專業心臟病專家!我最近在深度學習的時間序列分析中做了大量的工作,我可以親自確保神經網路工作的非常好,你可以很容易地得到比「黃金標準」高5-10倍的性能。


內嵌函數之外的優化

我們如何訓練神經網路?說實話,我們大多數人只是使用「Adam()」和標準的學習率。 一些聰明的人選擇最合適的優化器,並調整和安排學習速度。 我們總是低估優化的主題,因為我們只需按下「訓練」按鈕,就只等到我們的網路收斂。 但是在計算能力,內存和開源解決方案方面,我們都擁有幾乎平等的機會,而優勝者是那些能夠用最短時間獲得最佳性能的——這一切都來源於優化。

面向開發者的2018年AI趨勢分析


一般炒作放緩

面向開發者的2018年AI趨勢分析

cdn.aiindex.org/2017-report.pdf

這幅圖能告訴我們什麼,尤其是在閱讀了這篇文章之後?要開發新的、有價值的東西並從中獲得大量的資金並不容易,要考慮到已經有多少開源工具和演算法被發布了。我認為,2018年對初創公司來說不是最好的一年,因為有太多的競爭對手和太多的「聰明人」,他們可以利用今天的開源網路並將其部署為移動應用,並稱之為初創公司。

今年我們必須專註於基本的事情,而不是快速賺錢——即使我們打算用谷歌的Ratacon來為一些有聲讀物的初創公司提供語音識別服務,它也不可能是一個簡單的web服務,而是與合作夥伴開啟業務,通過商業模式來獲得一些投資。


總結

我簡單地總結一下,有幾種技術現在可以用於實際產品:時間序列分析,GANs,語音識別,NLP的一些進展。我們不應該再設計用於分類或回歸的基本框架,因為AutoML就能做這些。我希望通過一些優化改進,AutoML能夠比以前更快。再加上ONNX和Model Zoo,只需兩行代碼就能為我們的app加入基本的模型。我認為製作基於AI的應用程序已經變得非常容易,至少在目前最先進的水平上如此,這對整個行業來說都是好事!

本文由阿里云云棲社區組織翻譯。

文章原標題《30 Amazing Machine Learning Projects for the Past Year (v.2018)》

作者:Mybridge

譯者:奧特曼,審校:袁虎。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雲棲社區 的精彩文章:

每個數據科學家都應該學習4個必備技能

TAG:雲棲社區 |