2018年全球AI突破性技術TOP10

最新 07-24

本文來源艾瑞網

人工智慧是個高科技、寬領域、多維度、跨學科的集大成者，從立足大數據、圍繞互聯網的純計算機應用，逐步衍生到人們日常生產生活的方方面面，在細微之處改善和改變著我們。目前，不少新技術、新模式已經逐步投入到現實運用，但是多數領域仍然處在推廣、試驗、研究階段，如何把握推廣人工智慧技術的重大機遇，讓更廣大的老百姓像普及手機一樣，用上人工智慧，這是我們這一代人必須面對的時代發展「必答題」。

2018年人工智慧技術已在多方面實現突破進展，國內外的科技公司都在不斷嘗試將人工智慧應用於更多領域，不論科技巨頭還是初創企業，都在致力於不斷創新，推動技術進步，接下來我們就來看看十項中外人工智慧領域富有突破性的技術。

基於神經網路的機器翻譯

入選理由：翻譯是「自然語言處理」的最重要分支，也是比較難的一支。早年間，機器翻譯還被視作「低級翻譯」被嘲諷，如今神經網路的機器翻譯準確性大大提高，堪比專業人工翻譯。我們熟知的谷歌翻譯、微軟語音翻譯以及搜狗語音識別等都是基於此項技術。

技術突破：機器翻譯是科研人員攻堅了數十年的研究領域，其技術核心是一個擁有海量結點的深度神經網路，可以自動的從語料庫中學習翻譯知識。

人類大腦處理語言的過程毫無疑問是最為複雜的認知過程之一，曾經很多人都認為機器翻譯根本不可能達到人類翻譯的水平。神經網路中的多層感知就試圖模擬人類大腦神經多層傳遞處理的過程，但通常不超過三層。2006年，科學家提出了神經網路的深度學習演算法，使至少具有7層的神經網路訓練成為可能。由於能夠比較好地模擬人腦神經元多層深度傳遞的過程，它在解決一些複雜問題的時候有著非常明顯的突破性表現。

今年3月，微軟宣布其研發的機器翻譯系統首次在通用新聞的漢譯英上達到了人類專業水平，實現了自然語言處理的又一里程碑突破，將機器翻譯超越人類業餘譯者的時間，提前了整整7年。

重大意義：基於神經網路的機器翻譯，直接改善了之前逐詞直譯的效果，升級為以整個句子為單位進行翻譯。

點評：機器翻譯在手，縱橫四海不是問題。

基於多感測器跨界融合的機器人自主導航

入選理由：機器人的終極目標是為人類提供智能化的服務，其中自主導航是近年來人類一直想要攻克的技術壁壘，臻迪(PowerVision)通過聲吶、視覺等多感測器融合，使其水下機器人能實現自主導航及智能識別，在智能機器人領域內取得了突破性進展。

技術突破：隨著機器人的應用場景及作業任務越來越複雜，單一感測器難以滿足應用需求。而多感測器的信息融合對硬體資源依賴程度比較高，臻迪（PowerVision）基於自身在機器人行業深耕細作多年所積累的各類感測器、慣性導航、運動控制、相機、視覺檢測/識別、SLAM等核心技術，以及深度學習的深入研究，通過嵌入式端一體化集成平台的系統架構及優化設計，突破了移動平台硬體資源的限制，使水下機器人更加準確、智能、全面地感知目標，並具備對水下目標進行鎖定、檢測、識別、跟隨的能力。

重大意義：通過導航控制、聲吶、視覺技術與深度學習的結合實現了機器人在全局環境中的定位及自主導航，以及智能化應用，為人類探索更為廣闊的水下應用提供了強有力的技術保障。

點評：這也許是未來人工智慧落地的最佳方式

DuerOS對話式人工智慧系統

入選理由：DuerOS3.0能夠為用戶帶來了劃時代的自然對話交互，包括情感語音播報、聲紋識別等能力在內的自然語言交互技術的全面升級。

技術突破：DuerOS是百度度秘事業部研發的對話式AI操作系統,擁有10大類目的250多項技能。DuerOS包括了從語音識別到語音播報再到屏幕顯示的一個完整交互流程，以及背後支撐交互的自然語言理解、對話狀態控制、自然語言生成、搜索等等核心技術，這些技術支撐著應用層和能力層的實現。

2018年7月4日，最新的DuerOS 3.0正式發布，使賦能的產品能夠實現語音多輪糾錯，進行複雜的遞進意圖識別與帶邏輯的條件意圖識別，從而更加準確判斷用戶意圖，最終實現功能升維——利用擴展特徵理解用戶行為。基於此，DuerOS3.0提供了包括有屏設備解決方案、藍牙設備解決方案和行業解決方案等在內超過20個跨場景、跨設備的解決方案。

重大意義：DuerOS率先開啟AI時代商業化，將為生態合作夥伴從產品、內容與推廣三大方面提供完整的應用方案支持，加速AI設備落地。

點評：小度小度，請問下一個技術我寫什麼？

移動AR技術

入選理由：未來AR與AI需要相互加持，可以將AR比喻成AI的眼睛。

技術突破：集成了眾多計算機科技和圖形圖像學技術，包括實時渲染技術、空間定位追蹤、圖像識別、人機交互、顯示技術、雲端存儲、數據傳輸、內容開發工具等領域。

AR技術不僅展現了真實世界的信息，而且將虛擬的信息同時顯示出來，兩種信息相互補充、疊加。在視覺化的增強現實中，用戶利用頭戴顯示器，把真實世界與電腦圖形多重合成在一起，便可以看到真實的世界圍繞著它。增強現實技術包含了多媒體、三維建模、實時視頻顯示及控制、多感測器融合、實時跟蹤及註冊、場景融合等新技術與新手段，為人類感知信息提供了新的方式。

未來移動AR技術將向創意性AR應用、基於位置的AR體驗、多人AR體驗發展。

重大意義：隨著蘋果 ARKit、谷歌 ARCore 的發布，移動AR在兩大移動平台上均意義重大。這也意味著，全球 5 億台支持 AR 功能的移動設備正在吸引所有的公司入局，這些公司正在將數據與 API 相結合，為用戶創造新的 AR 體驗。

點評：感覺自己離進入真正的二次元世界不遠了。

生物特徵識別技術

入選理由：行為識別技術應用於安防，為安全又上了一道鎖。

技術突破：店鋪安裝攝像頭已經是一件非常普遍的行為，但普通的攝像頭只能紀錄店鋪內人們的行為，如果發現盜竊需要通過觀看監控記錄人工排查，耗時費力。

而近日，日本電信巨頭宣布已研發出一款名為「AI Guardman」的新型人工智慧安全攝像頭，這款攝像頭可以通過對人類動作意圖的理解，在盜竊行為發生前就能準確預測，從而幫助商店識別偷竊行為，發現潛在的商店扒手。

這套人工智慧系統採用開源技術，能夠實時對視頻流進行掃描，並預測人們的姿勢。當遇到監控中出現可以行為時，系統會嘗試將姿勢數據與預定義的「可疑」行為匹配，一旦發現就會通過相關手機App來通知店主。據相關媒體報道，這款產品使得商店減少了約四成的盜竊行為。

重大意義：通過行為識別技術，能夠第一時間發現犯罪分子，預測犯罪行為，有效保護店鋪安全。

點評：去日本的商店買東西一定要果斷，被誤會成小偷就不好啦。

機器人流程自動化

入選理由：機器人流程自動化能夠幫助甚至代替人類負擔大量簡單且單一、重複而繁重的工作，並且效率更高、零失誤。

技術突破：機器人流程自動化（RPA）是通過使用高性能認知技術實現業務的自動化和工作的效率。人類只需在操作界面上編寫需要人工完成的工作流程，即可處理各種業務，如瀏覽器，雲，以及各種軟體。

Gartner數據顯示，在過去的一年中，全球範圍中大型商業巨頭裡有300家陸陸續續開展了RPA工程，將原先手工化的流程進行自動化改革。隨著科技的進步RPA將融入更多人工智慧技術，即智能流程自動化（Intelligent Process Automation）。相當於在基於規則的自動化基礎（RPA）之上增加基於深度學習和認知技術的推理、判斷、決策能力。

重大意義：機器人流程自動化能夠大幅提升企業的工作效率，減少人員投入，幫助企業降低成本，讓人類釋放生產力，騰出雙手去做價值更高的事情。

點評：小白領被嚇的瑟瑟發抖，請老闆別炒我。

像素級聲源定位系統PixelPlayer

入選理由：從視覺和聽覺信號角度實現聲源分離，開闢研究新途徑。

技術突破：在進行音樂編輯時，一般是利用均衡器將音樂中的低音部分調出來，而麻省理工學院計算機科學和人工智慧實驗室的研究人員發現了更好的解決方案。他們所研發的新系統PixelPlayer。

PixelPlayer能夠通過結合聲音和圖像信息，機器學習系統能以無監督的方式從圖像或聲音中識別目標、定點陣圖像中的目標，以及分離目標產生的聲音。當我們給定一個輸入視頻，PixelPlayer可以聯合地將配音分離為目標組件以及在圖像幀上定位目標組件。PixelPlayer 允許在視頻的每個像素上定位聲源。

簡單點說就是PixelPlayer能識別出視頻中哪個物體發出哪些聲音，並將聲音分離出來。

重大意義：PixelPlayer能夠過濾伴奏、識別音源，不僅能幫助人類處理音樂，還能夠幫助機器人更好地理解其他物體所產生的環境聲音。

點評：如果老師用了這個系統，就能立刻找出課堂交頭接耳的同學。

兼顧高精度學習和低精度推理的深度學習晶元

入選理由：這個晶元可以涵蓋了目前已知的最佳訓練和最好推理，能夠保持所有處理器組件能夠得到數據和工作。

技術突破：該深度學習晶元是IBM正在研究的項目之一。IBM將這個晶元的目標利用率定在90%。這將是一個質的突破，為了實現這一突破，IBM的研發團隊做了兩項創新。

首先，利用率低通常是因為存在於晶元周圍的數據流瓶頸。為了突破這些信息障礙，該項目的團隊開發了一個「定製」的數據流系統。該數據流系統是一種網路方案，可以加速數據從一個處理引擎到下一個處理引擎的傳輸過程。它還針對要處理的是學習任務還是推理任務以及不同的精度進行了優化。

第二項創新是團隊使用專門設計的「便箋本」形式的片上存儲器，而不是CPU或GPU上的傳統高速緩衝存儲器。構建它的目標是為了保持數據流經晶元的處理引擎，並確保數據在恰當的時間處於正確的位置。為了獲得90％的利用率，IBM必須使設計出的便箋本具有巨大的讀/寫帶寬。

重大意義：該晶元可以執行當前所有的三種主要深度學習AI：卷積神經網路（CNN）、多層感知器（MLP）和長-短期記憶（LSTM）。這些技術共同主導了語言、視覺和自然語言處理。

點評：目前深度學習技術陷入瓶頸，IBM的深度學習晶元也許能夠扭轉這一局勢。

智能代理訓練平台

入選理由：智能代理技術使計算機應用趨向人性化、個性化。它能夠以主動服務的方式完成的一組操作的機動計算實體,不需要人的即時干預。

技術突破：智能代理技術具有解決問題所需的豐富知識、策略和相關數據，能夠進行相關的推理和智能計算，智能代理還可以在用戶沒有給出十分明確的需求時推測出用戶的意圖、興趣或愛好，並按最佳方式代為其完成任務，並能自動拒絕一些不合理或可能給用戶帶來危害的要求；智能代理還從經驗中不斷自我學習，能夠根據環境調整自身的行為，從而提高處理問題的能力。

智能代理技術可以應用於商業、智能搜索代理、數字圖書館、電子商務和遠程教育的研究等，現在它也被應用於遊戲領域。

Unity是全球領先的遊戲開發公司之一，去年其推出了機器學習平台ML-Agents，讓AI開發人員和研究人員在Unity模擬和遊戲環境中，使用演化策略、深度強化學習和其他訓練方法來訓練智能代理。這種模擬訓練的方法在工業機器人、無人機、無人駕駛車輛和遊戲角色設計中均有著廣泛應用。

重大意義：Unity以使機器學習研究人員獲得最強大的訓練場景為使命，為快速增長的AI愛好者群體探索深度學習提供了一個研究平台。

點評：NPC越來越聰明，對於遊戲手殘黨來說可能不是個好事。

入耳式人工智慧

入選理由：耳機從外變成了智能穿戴設備，可以無限延續使用時間和場景。

技術突破：蘋果在今年即將推出的AirPods 2中加入了Siri喚起、內置晶元等等，可以收集行走步數、心率數據和體溫等等，還可以通過內置陀螺儀捕捉用戶頭部移動狀況甚至定位位置，當然也可以通過麥克風接受命令，再通過揚聲器進行反饋。

谷歌的實時翻譯無線耳機PixelBuds常被拿來與AirPods相比，PixelBuds對Google Assistant的喚起十分迅速，只要把手指放在耳機的觸控板上，幾乎同一時刻就可以和Google Assistant進行對話。

AirPods與PixelBuds讓我們重新定義了耳機對人類的作用，相比手腕上的智能手錶，耳機顯然可以更方便的進行語音交互，在接收信息時更無需佔用寶貴的視覺空間。還將智能音箱式的遠場交互變成更自然也更快捷的近場交互。

重大意義：智能耳機讓智能助理更接近隨身隨行，蘋果、谷歌的涉足，必將帶起一波耳中AI的風潮。

點評：現在我們手機不離手，以後可能要耳機不離耳了。

我們看到這些科技公司或者科研團隊，學習翻譯、研究捕魚、開發遊戲、做著音樂……看似「不務正業」，而這恰恰證明了，人工智慧不單單是一種技術或一個產品。

從IBM、蘋果，到谷歌，百度，所有的人工智慧巨頭都在嘗試軟體、硬體、應用場景的聯通。聰明的科技公司都不再單一的專註於自己的傳統業務，而是著眼於未來，不斷創新技術，跨界融合打造一個整合的生態系統。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 聚牛科技 的精彩文章:

※上上下下的享受伸縮鏡頭全面屏旗艦vivo NEX是這個樣子
※索尼首部雙攝手機拍照能力媲美單反 ISO達到了51200

TAG:聚牛科技 |