詳解AI領域「金髮女郎效應」：如何讓應用型AI做到剛剛好？

新聞 08-20

【獵雲網（微信號：ilieyun）】8月17日報道（編譯：Halcyon）

編者註：強人工智慧（Strong AI）又稱通用人工智慧（Artificial general intelligence）或完全人工智慧（Full AI），指的是可以勝任人類所有工作的人工智慧;弱人工智慧（Weak AI）也稱限制領域人工智慧（Narrow AI）或應用型人工智慧（Applied AI），指的是專註於且只能解決特定領域問題的人工智慧。

雖然埃隆·馬斯克(Elon Musk)和馬克·扎克伯格一直在爭論AGI（通用人工智慧，又稱強人工智慧）的危險，但初創公司只是將人工智慧應用於解決特定領域問題，例如提升銷售團隊的績效以及提高生產線的運營效率，這些創企逐漸成長為估值數十億美元的企業。然而，嚴格的定義問題只是找到有價值的人工智慧商業應用的第一步。

為找到構建人工智慧業務的合適機會，初創公司必須在不同的維度上運用「金髮姑娘原則」，以找到「合適」開始的甜蜜點（sweet spot）——在不同維度之間注意平衡，切記不可過分專註一個維度。根據我們從與數千家AI創企合作中學到的知識，以下是一些有抱負的創始人結合自己的人工智慧策略尋找甜蜜點的一些方法。

「恰到好處」的預測時間範圍

與市面上其他智能軟體不同，人工智慧會響應其運行的環境；演算法接收數據並返回一個結果或預測。根據應用程序的不同，可以對近期的情況進行預測，例如明天的天氣，也可預測出未來許多年的結果，比如患者是否會在20年內患上癌症。演算法預測的範圍對其有效性以及是否提供構建防禦性的機會而言至關重要。

針對一個較長的時間段進行預測的演算法很難做出評估和改進。例如，演算法可以使用承包商之前項目的時間表預測某個建築項目將比計劃落後6個月並超預算20%。在新項目完成之前，演算法設計者和最終用戶很難對此預測做出評論，只能判斷預測內容在方向上是否正確——即項目是否延遲完成或成本是否更高。

即使最終的項目編號最終非常接近預測的數字，也很難完成反饋循環並積極地加強演算法。許多因素會影響到複雜的程序，如建築項目，因此很難利用A/B測試預測來梳理未知混雜因素的輸入變數。系統越複雜，演算法完成加固循環所需的時間越長，精確訓練演算法也就越困難。

雖然很多企業客戶對使用AI解決方案持開放態度，但為了完成銷售，初創公司必須能夠驗證演算法的性能。驗證演算法最有說服力的方法就是藉助客戶的實時數據，但這種方法在試點期間可能很難實現。如果創企可獲權訪問客戶的數據，預測時限應該盡量短一點，以便在試驗期間驗證演算法。

對於大多數AI創企而言，較慢的計算速度嚴重限制了應用型人工智慧的範圍。

歷史數據（若可用）可以作為訓練演算法的權宜之計，並通過回溯測試暫時驗證它。訓練對歷史數據進行長時間範圍預測的演算法是有風險的，因為過程和環境更有可能改變你對歷史記錄的了解，從而使得歷史數據集對當前條件的描述性減弱。

其他情況下，雖然描述結果的歷史數據可用於訓練演算法，但可能無法捕獲在考慮範圍之內的輸入變數。舉個建築行業實例，你發現使用藍色安全帽的建築工地更有可能按時完成項目，但由於帽子的顏色在之前並沒有對管理項目帶來任何幫助，該信息未記錄到存檔文件中。所以必須從頭開始捕獲這些數據，這將再度推遲企業的上市時間。

AI創企應該建立多種演算法，以較短的範圍進行更小、更簡單的預測，而不是在長時間範圍內進行單一的「hero」預測。將運行環境分解為更簡單的子系統或在過程中限制數據的數量，使其更容易控制混雜因素。Autodesk的BIM 360項目IQ團隊將這種小型預測方法應用於建築行業，消除了施工過程中的眾多低效問題，並有助於消除潛在的設計與施工風險。其演算法模型可預測安全性，並對供應商和分包商的質量/可靠性進行評估，所有數據都可以項目進行周期中進行測量。

較短的時間範圍便於演算法工程師監控其性能變化並採取措施快速改進，而僅限於對歷史數據進行回溯測試。時間範圍越短，演算法的反饋迴路越短。每個周期做出的反饋逐漸累加，可增強演算法的性能，較短的反饋周期更有利於構建防禦性。

「恰到好處」的可操作窗口

大多數演算法對動態系統進行建模並返回一個預測結果供人類採納。由於系統更改頻繁，演算法的輸出很難在長時間內保持有效性：很可能在用戶採取行動之前，預測結果的有效性就大幅度「下降了」。為保證預測結果對最終用戶的有效性，必須設計演算法以適機器與人類速度的限制。

在典型的人工智慧工作流程中，人類將數據輸入演算法中，演算法運行、計算輸入數據，並輸出預測結果或建議行動步驟；人類解釋該信息以決定行動方案，然後採取行動。演算法計算結果所花費的時間以及人類對輸出內容進行操作所花費的時間是此工作流程中最大的兩個瓶頸。

對於大多數AI創企而言，較慢的計算速度嚴重限制了應用型人工智慧的應用範圍。演算法的預測取決於輸入數據，輸入數據代表記錄過程的瞬時數據。如果數據描述的環境變化快於演算法計算輸入數據的時間，則在演算法完成其計算並返回預測時，預測結果僅適用於過去的某個時刻，並且將不可操作。例如，音樂程序Shazam後台的演算法在首次「聽到」歌曲到識別這首歌，期間可能需要花費好幾個小時，且需藉助Windows 95系統的計算能力。

雲計算的興起以及專為人工智慧計算而優化的硬體開發極大地拓寬了應用型人工智慧可行且可負擔的領域。雖然宏觀技術的進步極大地推進了應用型人工智慧，但演算法並不完全受制於當前的計算限制；通過訓練加強也可以改善演算法的響應時間。演算法遇到的相同示例越多，就能越快地跳過計算過程得出預測結果。由於計算的加強與改善，如今Shazam僅用不到15秒的時間便可識別一首歌。

自動化決策和操作還可以幫助用戶利用因過快失效而等不及人類做出回應的預測。Opsani就是這樣一家企業，它運用人工智慧來做出數量龐大、快速變化的決策，以便人類有效採用。與人類DevOps（DevOps，即Development和Operations，是一組過程、方法與系統的統稱，用於促進開發應用程序/軟體工程、技術運營和質量保障部門之間的溝通、協作與整合）不同，人類DevOps只是根據演算法的建議快速地優化性能，Opsani則是應用人工智慧來識別和自動改進應用程序和雲設施的操作，以便用戶享受到更好的性能。

然而，並非所有人工智慧應用都可以完全自動化，如果感知風險對於最終用戶來說太高而無法接受，或者法規要求必須有人類來批准該決策等情況下，人工智慧應用便無法完全自動化。

「恰到好處」的性能最低限度

就像軟體創企會選擇在開發了最小可行產品（MVP）以便從初始客戶中收集可採取措施的反饋時進入市場，AI初創公司應該在達到早期用戶所需的最低演算法性能（MAP）時正式進入時市場，在市場的大環境下，演算法可以接受更多樣化和新鮮數據集的培訓，也可避免過度訓練變成數據集。

大多數應用程序並不需要達到100%準確，也會有一定價值。例如，欺詐檢測演算法可能只會在發生故障後的24小時內立即捕獲5%的欺詐案例，但詐騙調查人員經過一個月的分析也僅能捕獲15%的案例。在這種情況下，MAP為0，因為欺詐檢測演算法可以用作第一過濾器，以減少調查人員必須經手的案例數量。該創企可立即進入市場，以確保訪問用於培訓其演算法的大量欺詐數據。長此以往，演算法的準確性必將能提高並減輕調查人員的負擔，使其能專註於更複雜的案例。

為0或較低的MAP應用程序構建演算法的初創公司將能快速進入市場，但若是演算法達到高水平性能之前出現這些副本，則可能需要不斷調查跟風抄襲的企業。

將演算法從研究實驗室轉向市場並沒有通用的方法。

專攻較低MAP問題的初創公司也應注意那些可通過非常小的訓練集以近100%準確度解決的問題，其中建模的問題相對簡單，跟蹤的維度少，結果可能出現的變動也比較少。

基於AI的合同處理是演算法性能迅速提升的應用一個很好的例子。合同類型數以千計，但大多數的關鍵板塊都是類似的：涉及的各方、交換價值的項目、時間框架等。抵押貸款申請或租賃協議等特定文件類型是高度標準化的，以符合監管。在多個初創公司中，我們發現自動處理這些文檔的演算法在其他示例未幫助改進之前，只需要幾百個示例就可訓練到可接受的準確度，從而使後來者更容易將現有企業和早期演算法性能進行匹配。

針對勞動力低廉且能夠輕鬆達到高精度的應用領域而設計的人工智慧需要在找到早期用戶之前達到更高的MAP。例如，需要精細運動技能的任務尚未被機器人接替，人類的表現需要了非常高的MAP來克服。拾取物體時，為機器人手提供動力的人工智慧必須以高精度測量物體的硬度和重量，否則機器人手會損壞被處理的物體。而對人類而言，無需任何訓練，也能非常準確地測量這些尺寸。攻擊高MAP問題的創企必須投入更多時間和資金來獲取足夠的數據，才能達到MAP並正式進入市場。

克服困難

在研究實驗室中，限制領域人工智慧（Narrow AI）可以在廣泛的應用中取得了重大進展。此外，圍繞Narrow AI的應用程序建立業務需要新的演算法集。此過程很大程度上取決於所有維度的特定用例，演算法的性能只是一個起點。將演算法從研究實驗室轉移到市場並沒有通用的方案，還得具體問題具體分析，但希望這些想法能夠為你提供一個擁有的藍圖。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 獵雲網 的精彩文章:

※50美元就能坐私人飛機滿天飛？一文帶你嘗鮮Blackbird的一鍵拼「機」服務
※瞄準嬰幼兒輔食市場，米小芽完成近千萬元Pre-A輪融資

TAG:獵雲網 |