當前位置:
首頁 > 科技 > 當AI數據服務走進中場戰事

當AI數據服務走進中場戰事

毫無疑問,數據量的飆升是AI產業爆發的原因之一。很快我們可以發現,將數據採集、整理、清洗、標註再輸送給AI企業用作模型訓練,已經成為了一條運行流暢的產業鏈。

很長一段時間以來,數據服務都處於一種粗放原始的狀態之中,甚至出現了一種「數據農場」的說法:數據服務從業者們從各種公開數據集或移動互聯網產品中獲取數據,以幾乎零門檻的形式聘請大量廉價勞動力進行簡單的清洗標註工作,例如勾選出一張照片中哪裡是天空哪裡是大地。最後再將這些粗糙處理過的數據一股腦地投入神經網路的黑箱之中。

但現如今,我們已經看到這一現狀正在發生變化,AI企業對於數據的應用需求逐漸開始分化,以往一味粗放的處理模式已經不能滿足他們的需求,也因此攪動了AI數據服務市場,潮水從奔騰到平靜,讓泥沙沉澱,清流上涌。雲測旗下的AI數據服務品牌「雲測數據」的出現,就是一個典型案例。

這一次,我們採訪了雲測數據的總經理賈宇航,聽他來談談,他眼中的數據服務中場戰事。

風起雲湧的數據服務戰場

如果說數據是AI的養料,那麼養料的營養含量,自然也決定了AI的強壯程度。演算法模型的精準與否、對不同環境的適應性究竟如何等等能力,幾乎都來自於原始數據的累積。

最先發生變化的,是AI產業。清華大學發布的《2018年中國人工智慧發展報告》顯示,去年中國人工智慧產業市場規模達到237億元,同比增長67%。據預計2019年一年中,中國人工智慧行業的增長率高達75%。

產業規模的爆髮式增長,意味著競爭將進一步嚴峻。面對這種競爭,AI企業對於數據的需求必然發生變化。

比如,企業正在渴望更精細和定製化的數據。

現實場景的環境永遠比實驗室中的構想更加複雜,想要提供更落地、更具差異化優勢的模型,僅僅依靠基於移動互聯網數據,或者基於眾包用戶數據採集的數據顯然是不足夠的。只有通過定製化數據採集不斷打入細節、打入人無我有的場景,才能不斷提升技術價值,在洪流中立足。

又比如,企業正在渴望獲取更加專業和垂直的數據。

隨著AI技術深入到各個細分領域,很多數據標註工作要交由專業人士去做。像是對於醫療影像數據的標註,又比如在工業生產線上對於各種材料的認識。這些都不再像以往那樣,召集一群普通人就能完成,相反需要的是行業內專業工作人員進行相關處理。如何滿足這些要求,是數據服務企業和AI企業都在思考的問題。

以及企業日益提高的數據安全要求。

除了提出數據隱私等常規數據安全要求以外,有些企業為了突破已有模型的局限,開始配套研製自己的硬體,走向多模態融合的方式;或是像上文所說的,專門採集一些定製化的專業數據。這時這些數據就會成為企業構建自身核心壁壘的發展方向。如此以來,數據安全問題就成了重中之重。

另一方面,對於AI數據服務企業來說也是如此。

AI數據服務企業意識到,越來越多的AI企業對數據準確性、安全性和標註效率提出了更多要求,並且AI企業開始傾向於與大公司合作,對數據服務企業進行盡職調查、設立供應商列表等等。這一切都意味著,數據服務企業必須加強技術能力、促進管理正規化才能應對全新的需求。

中場戰事的號角已經吹響,這場戰爭決定著AI數據服務企業的生死存亡,也是它們力爭上遊的重要機會。

雲測數據的應戰邏輯

雲測數據正是在中場戰事中漸入佳境的數據企業代表。

移動互聯網時代開始,雲測從手機APP測試作為切入點進入企業服務領域,為移動互聯應用在現實場景中的使用保駕護航;人工智慧時代,雲測旗下AI數據服務品牌-「雲測數據」,正在幫助各大企業獲取貼近真實場景的精確數據,助力AI在現實場景中的場景化落地。

對於AI企業來說,自建數據處理團隊雖能滿足需求,但資金成本和技術門檻都相對較高。而數據行業中常見的眾包模式,例如亞馬遜眾包平台「Amazon Mechanical Turk」,它可以在平台上完成海量的數據,但面對定製化場景的數據,卻是有心無力。

而雲測數據,正是瞄準了定製化數據市場,打磨了一套屬於自己的應戰邏輯:

第一, 通過產業鏈延伸滿足企業豐富的業務需求。

雲測數據發現,當AI企業對於演算法落地性要求越來越高時,就更需要貼近真實場景的數據來滿足需求。賈宇航提到,對於現階段的安防或者金融所需要的人臉識別安全等級,互聯網中積累的數據和眾包採集的數據不足以支撐其需求,多維且精細化的數據,如各種光照條件下各個角度的人臉數據,才是其良藥。面對這類情況,就需要數據企業延伸產業鏈,承擔起定製化數據採集工作。除了安防領域和金融領域,雲測數據還會涉及諸如輔助駕駛場景中的駕駛員表情、新零售場景中的人物服裝穿搭、智慧生活中的音箱喚醒詞、智能工業中的質檢巡檢等等場景,覆蓋了現階段絕大部分的落地場景。

第二, 注重人員培養,提升標註精準程度。

意識到定製化數據對於AI企業的重要性後,雲測數據開始注重對於從業人員素質的培養和提高,不僅自建數據基地,對標註員進行標註技巧的教學培訓,也在各個涉足行業進行專業知識積累,以確保標註人員對所從事標註任務的理解。如涉及交規和行車經驗的自動駕駛數據標註,雲測數據就找來了由駕齡豐富的標註管理人員進行對員工提供定期講解,而其他行業,也逐漸開始需要「老司機「的介入,去提升數據精度。

第三, 死守安全底線。

最後最重要的,還有安全。首先雲測數據的核心價值觀是讓企業擁有數據,構建企業的核心競爭壁壘,為此數據的安全性是一項核心指標。為了保證人們的數據隱私安全,雲測數據不僅在硬體和操作系統上採取了加密措施,封死USB介面、採用內網瀏覽器端操作標註數據、保證所有參與工作的員工只能操作數據,不能獲取數據,且每次標註任務交付數據結果後,都會銷毀數據。不僅保護數據隱私,也保證了AI企業的利益。

中場戰事改變了什麼:AI數據服務產業的下一幕

賈宇航告訴我們,雲測數據的發展目標,就是在更多細分領域中,做到領域知識積累更深厚,數據更精準,數據更安全。擁有了這三項應戰能力,雲測數據就可以在數據服務賽道中精準的抓住變革中的機會。解決AI企業想要依靠獨有專業數據提升技術能力,又無力建立數據團隊的問題。

我們同樣關心的,是中場戰事之後,數據服務產業會出現怎樣的走向?

在接受採訪時,賈宇航向我們提到了一個有趣的事實:目前他們服務的甲方,除了一些科技巨頭以外,還有不少傳統企業。

這一事實側面反映出,參與AI的企業越來越多,類型也越來越豐富。其中會有對技術一無所知的小型傳統企業,會有紮根於農業、化工等等某一極其細分行業的企業,同時也會有依賴豐富的數據累積對AI技術精益求精的科技巨頭。他們對於數據類型的需求也會越來越細化、專業和垂直。在這種趨勢之下,數據與演算法之間的產業分工會逐漸走向明晰。或許數據企業需要「把手伸得更長」,才能更好的為他們提供服務。

相信在中場戰事這一轉折點之後,數據服務行業會從單純的拼勞動力,演變成拼技術、拼專業、拼垂直。

對於數據服務產業來說,這也是一個不斷洗牌的過程。產業發展行程過半,真正的競爭才剛剛來臨。數據服務產業作為AI的「源頭」,在歷經優勝劣汰之後,也給予AI發展更強大的動力。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 億歐網 的精彩文章:

顧家家居2019上半年營收50.10億元,加速渠道開拓
颱風已致浙江400餘萬人受災;Twitter被爆竊用用戶數據

TAG:億歐網 |