都知道「深度學習」,但你知道什麼是「廉價學習」嗎?
原標題:大數據,小目標:聰明實現人工智慧的方法
原作者:Tom Fisher
編譯:趙元佑
出品:北京大數據研究院
當前,越來越多的公司開始在在大數據解決方案上進行大規模的投資,而很多公司的決策者卻不清楚如何實現明智的戰略投資,因為大數據涉及的演算法、領域相當的廣泛,很難有一種單一的方案能夠把它們和競爭對手區分開,並且確保在更大的投入之前實現最佳回報。在過去,許多企業的大數據計劃都毫無計劃可言,這些失敗的案例也只是許多公司內部的秘密。但實際上,企業大數據計劃的失敗率都特別的高。
根據Gartner公司的報告,只有大約15%的企業的大數據項目通過了初期的試驗階段進入了實際運行。作為科技企業的領軍者,我們擔心的是,AI領域如此受關注的情況下,壓力是在於應用大數據技術還是在於冒著風險落後於那些採用了新技術卻沒有在設立相關項目的初期建立起清晰的商業目標,也沒有理解人工智慧和機器學習的區別,更不知道如何來應用新技術的決策者們。
決策者們很容易被人工智慧技術以及那些相關的炒作所吸引,包括像深度學習這樣的技術突破,讓他們感覺很高大上卻又不知所云。但是在我看來,那些希望取得巨大影響的決策者應從一個更加實用的技術手段入手:老式的機器學習,或者稱之為「廉價學習」,正如我的同事Ted Dunning和Ellen Friedman在他們的《實用機器學習》一書中所解釋的那樣。要區分「廉價學習」和深度學習很簡單。前者是關於利用基本的機器學習技術在直接的數據集中,以產生大量的小增量改進。另一方面,後者是機器學習的一個特定子集,其本質是一種複雜且高度密集的機器學習方法的集合,這些方法在高度複雜的數據集的基礎上形成業務決策。
對於涉及分析原始數據的任務來說,深度學習最為適合,如圖像和語音記錄。但是,當面臨簡單的結構化數據類型的工作時,我們發現了「廉價學習」能起到更多的作用。當決策者認識到流經企業的大部分數據都屬於第二類時,就很清楚哪個工具將對企業最有意義。
下面是我提出的一些建議,希望能夠幫助你的公司的大數據計劃取得成功:
捕獲更多、更好的數據
人工智慧是由數據來驅動的。隨便選取任何一種方法,你都會發現數據處在其中核心的位置。為什麼?因為機器需要大量完整的數據集以準確地識別與人、事件或其他特徵的行為的顯著模式,這也是人工智慧所解決的。
擁有更多的數據,尤其是一組相互關聯但領域各異的數據,對企業來說是一個特別的優勢。這就是為什麼像谷歌、亞馬遜、Facebook、阿里巴巴和百度這樣的企業在人工智慧上如此強大的原因。這些公司有著巨大的數據集,它們在各種不同的模式下都被捕獲了幾十年。這些數據多年來已經和它們的演算法相互融合,使得它們變得越來越精細、準確和有針對性。
對大多數企業來說,最大的挑戰是在數據收集的時候並不總是很清楚企業需要什麼。這使得很難知道在當下需要收集什麼樣的數據,以及所獲取的數據將來是否是有價值的。這種思路其實已經比較落後了,它假定只有有限的數據可以被捕捉和存儲。但是新技術的出現已經不再是這種情況了,可獲取的數據量遠遠突破了這種思維。此外,在元模式層面上連接這些數據的能力可以為以前不可用的數據源提供全新的視角。此外,近些年來,大數據產業更是看到了創新的機遇,因為數據的存儲正在變得越來越智能和便宜。
建立清晰的商業目標
成功的機器學習並不僅僅是選擇正確的工具或演算法,並給它提供海量的數據,更加重要的是數據所代表的背景,所蘊含的內容。僅僅將機器學習運用到大型數據集中只會產生很少的價值,因為企業缺乏明確的目標來指導機器學習的工作。
在我看來,像機器學習這樣的人工智慧技術將為企業提供一個神奇的子彈,把所有的東西變成一個更聰明、更高效的版本,這當然是有點一廂情願的想法。如今,這些工具在有限的框架中發揮著最佳的作用;從長遠來看,機器學習所能帶來的並不只是這樣魔幻的東西,它可以是今天的人工智慧領域的現實。總的來說,目標越具體,工具越有效,企業成功的可能性就越高。對企業來說,採用簡單但功能強大的技術不僅具有相對較短的開發時間,且易於部署和維護,「廉價學習」能為企業帶來巨大的商業價值。
保持現實的頭腦
真正實現商業價值的途徑是有一個精心制定的戰略。一旦有了具有目標和明確目標的業務路線圖,AI技術的應用將更有意義。並且當AI的目標和與總體業務戰略保持一致時,企業將獲益匪淺。對於決策者而言,沒有與使用與企業的業務目標和策略不一致的先進技術相比更糟糕的感覺了。要知道,企業決定使用何種先進技術代表著一個企業的核心戰略,也代表了企業高層對未來走勢的眼光和來自決策層最高的期待。一旦在這上面失敗,不僅影響企業內部的信心,也會影響投資人的看法。
每個企業都希望在有數據支持的情況下來落實改進業務的項目。而決策者必須為企業的任務使用相應最合適的技術。誠然(根據我們的實踐經驗),深度學習將會很有用,也可能是正確的戰略技術選擇。但是對於企業中大多數的應用來說,「廉價學習」將會提供一個更實用、更有效的解決方案。這是企業的決策者們需要承認的。