這家自動駕駛數據標註公司共標記了2億英里的行駛數據，他們希望行業內能數據共享

最新 08-16

總部位於舊金山的Scale公司是向自動駕駛車輛製造商提供感測器融合標註API(Sensor Fusion Annotation API)的供應商，近日他們拿到了千萬美元的B輪投資，Lyft、通用汽車（General Motors）、Zoox、Voyage、nuTonomy和 Embark 都是他們的客戶，Scale的系統目前一共已經標記了200,000,000英里的自動駕駛車輛的行駛數據，而他們希望將數據開源。

隨著機器視覺、人臉識別、語言處理與大數據分析等技術的日臻成熟，出行生態不斷智能化。計算機視覺為自動駕駛汽車點亮了眼睛，通過視覺感知，無人車可以標註並識別出車輛、車道線以及行人動物等。當一台計算機學習而不標記的訓練數據，它被稱為無監督學習。計算機通過無人監督的學習得到正確的答案，但它需要很長時間需要訓練大量的數據才能達到識別的效果。而當計算機用標記的訓練數據學習時，被稱為監督學習，比如標記數據是貓的圖像，同時會將單詞「cat」作為元數據附加到其圖像上，這種方法極大地加速了學習過程。

創建標記的訓練數據的過程已經成為一個重要且成本高昂的業務，國內外也有很多創業公司在做相關的服務，但這些標記數據集來自哪裡？

今天的大多數標註數據都是人類注釋的，成千上萬的圖像都是由人工標記的，這是一個非常緩慢而低效的過程。它需要人坐在計算機屏幕前操作注釋器，點擊圖像，逐個標記它們。並且，隨著圖像數量的增加，這個過程會變得更加昂貴且容易出錯。

總部位於舊金山的Scale公司正是向自動駕駛車輛製造商提供感測器融合標註API(Sensor Fusion Annotation API)的供應商，以加速數據標記處理。該公司由麻省理工學院（MIT）的21歲計算機科學家Alexandr Wang於2016年創立。

Scale的最初目標是擴展標記訓練數據的過程。解決這個問題共分為兩個部分：一個是編組成千上萬人工標記數據的任務；第二個是創建一套複雜的工具，使這些貼標機的效率和準確度提高了10倍。Alexandr和他的團隊在創辦兩年來，組建了一支由工程師和技術人員組成的世界級技術團隊，正在改變這一領域。當地時間8月7日，Scale宣布其融得了由Index Ventures、Accel和Y Combinator領投的1800萬美金。

Scale結合使用了人工數據標記員和機器學習演算法，對來自Lyft、通用汽車（General Motors）、Zoox、Voyage、nuTonomy和 Embark 等客戶的原始、未標記的數據進行分類，然後以可擴展數據集的方式返還。該公司的員工負責審查來自汽車的圖像、雷達、激光雷達數據（以及其他感測器數據），確保自動駕駛車輛能夠正確識別道路上的行人、騎自行車車手以及其他物體，並且根據需要進行修正。Scale的系統目前一共已經標記了200,000,000英里的自動駕駛車輛的行駛數據，並且最近將其工作擴展道路機器人、無人機、虛擬助手以及嚴重依賴AI的「其他解決方案」。

Scale API如何訓練自主車輛

這家初創公司開發了自動化系統，可以從自動駕駛汽車看到的內容中獲取數據並對其進行檢查來標記必要的實物。創建標籤的過程有助於自動駕駛汽車內的軟體學會識別特定場景，以便更好地為未來做好準備。

Scale 針對圖像推出一系列注釋類型，其發布的感測器融合標註API（Sensor Fusion Annotation API），能夠支持所有主流感測器的高級3D感知，包括激光雷達（30米內稠密3D場景理解）、相機（70米內圖像目標識別）和Radar（150米內稀疏場景理解），以幫助汽車製造商和自動駕駛汽車公司加速感知演算法的開發。

在Scale中，提供圖像注釋服務之一是Cuboid Annotation，它使用包圍汽車，卡車，行人，交通錐等物體的長方體投影來注釋二維圖像。通過一些附加信息，可以將這些二維框注釋轉換為完整的三維框，包括高度，寬度，深度，旋轉和相對定位信息。

目前其社區推出的標籤類型主要有：

像素方式語義分割

多邊形注釋

點注釋

行注釋

像素方式語義分割

像素方式語義分割

另外，Scale API還提供用於OCR和圖像轉錄、分類、比較和數據收集的API。

GIF

RADAR在150米範圍內探測場景的屏幕截圖

藉助感測器融合標註API，用戶可以上傳未標記的相機、激光雷達和Radar數據，生成可用於訓練3D感知模型的標註數據。激光雷達和Radar標註是指，採用長方體包圍特定對象的3D點雲，並得到這些框的位置和大小。該API支持所有用於3D感知的主流感測器，為自動駕駛技術提供數據支持。

GIF

除了注釋二維圖像，Scale公司也同通過手工注釋立方體。通過手動立方體調整，縮放器只需繪製一個2D框，表示長方體的一側和長方體的另一側：

這通常不是一個「真正的」長方體，因為它在數學上是不精確的。「真正的」長方體的正面可能不是一個完美的90度矩形，特別是如果它沒有正面朝向相機。通過調整，給定上面的長方體注釋，以及一些附加信息（即相機參數和方向），會自動生成更準確的注釋：

正面不再是完美的矩形，而是梯形，左邊緣略小，更好地反映了汽車相機的相對方向。右側的頂部/底部邊緣現在會聚合到地平線上的一個點。從3D空間中的這八個點可以很容易地推斷出所得長方體的位置，尺寸和方向。通過這些屬性，人們可以訓練模型，從單個圖像中預測類似長方體的物體的3d坐標。通過這種方式，可以創建一個系統，僅需要使用Scale API生成的攝像機圖像和注釋來識別世界上汽車的位置。

Scale倡導數據共享

顯然，標記是Scale API的重要業務組成部分。正如Wired指出的那樣，錯誤地將行人標記為車輛可能會使自動駕駛汽車的軟體混淆到不斷出錯的程度，甚至可能導致事故。Scale已經將標籤作為開發自動駕駛汽車的必要和不可或缺的一部分。不幸的是，標籤不會彼此共享。Scale的客戶群包括Cruise，Nuro，Lyft，Zoox，Nutonomy，Starsky Robotics和Embark都將數據發送到Scale這裡。但是，這些數據並沒有相互分享，這是一種資源的浪費。自動駕駛汽車需要使用更多真實的標記數據集測試來保證不穩定的情況。所以，Scale希望數據能夠共享，構建更廣泛的數據集。

21歲的創始人兼首席執行官Alexandr Wang 認為「現在，每家公司都在自己的道路上並且保密自己的數據，實際上，這些邊緣情況可能需要在整個行業中共享或標準化。」

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 智車科技 的精彩文章:

※慧拓智能參展IEEE IV2018，「平行駕駛」引眾多國內外科技工作者紛紛駐足
※車道線檢測演算法

TAG:智車科技 |

這家自動駕駛數據標註公司共標記了2億英里的行駛數據，他們希望行業內能數據共享

多邊形注釋

線注釋

手動立方體注釋