當前位置:
首頁 > 新聞 > 數據要素寫進中央文件,採集標準化如何保障?

數據要素寫進中央文件,採集標準化如何保障?

科技日報記者 崔爽

4月9日發布的《中共中央國務院關於構建更加完善的要素市場化配置體制機制的意見》(以下簡稱《意見》)中,首次將數據與土地、勞動力、資本、技術等傳統要素並列為要素之一。《意見》具體指出,發揮行業協會商會作用,推動人工智慧、可穿戴設備、車聯網、物聯網等領域數據採集標準化。

「數據採集的標準化是數據存儲、交易、加工及數據服務等一系列數據治理的前提,而且這件事只能由政府來主導。」中科院自動化研究所研究員、視語科技創始人王金橋表示,「數據的治理涉及政府機關、運營企業、人工智慧公司、用戶等方方面面,要想規範交易使用,充分利用沉睡的數據資源,必須先從數據採集的源頭來做標準化和規範化。」

據他介紹,採集標準化的最大價值是解決數據採集重複建設的問題。交通、保險、醫療、天氣、教育等等,各行各業都在生產數據,數據採集存在非常多重複建設的問題。比如各地有不同的採集標準,每個地方的關注點、區域特色、數據分布都不一樣,對數據的訴求不一樣,採集的數據也不一樣,這直接導致數據的不完備、噪音大,影響數據效能的釋放。

「因此,政府驅動是非常重要的。」王金橋說。比如現在出門避開擁堵靠導航軟體,但導航軟體依靠使用它的用戶的定位信息,事實上相當於採樣,結果並不可靠。去年底,交通運輸部印發通知,決定開展全國高速公路視頻聯網監測工作,充分利用新一代雲計算和人工智慧技術,建設科學先進、高效統一的視頻雲聯網監測體系。這一檢測體系將全面提升高速公路信息化、智能化水平,提高出行服務保障能力。按照通知要求,今年12月底,將完成全國高速公路視頻接入工作,建設部級視頻雲平台並全國聯網運行。「高速公路視頻上雲後,全國高速公路的標準化數據都會集成到雲平台,交通也能像天氣預報一樣提供準確的信息服務,是充分發揮交通數據生產力的有效手段。」王金橋說。

由於數據治理還在探索道路,數據採集的標準化工作也還處於起步階段。各行各業數字化程度千差萬別,很多行業還沒有實現數字化,高速視頻上雲就相當於剛剛連入互聯網,距離真正的數據處理和服務還有很遠。在國家的統一要求下,不同行業也需要適配各自業務和場景的採集標準。

「更重要的是,伴隨技術的進步,數據採集標準也會隨之變化,標準化工作需要一個長期的不斷完善的過程。」王金橋說,以人臉數據的採集為例,直播、售票、徵信等不同場景對人臉數據的要求不同,各個場景需要根據應用劃分採集標準,如人證同一性認證、人員身份網路遠程驗證、人臉門禁、人臉布控等。比如按照國家制定的標準證件照的數據採集標準——中臉部寬207±14像素,頭頂發跡距照片上邊沿7-21像素,眼睛所在位置距照片下邊沿的距離不小於207像素,按這個標準採集的證件照圖像目前已經廣泛用於機場、火車站等地的身份認證。

另外,數據採集的邊界也需要界定:什麼數據能採集什麼不能;如何對隱私數據進行規避;如何正確採集數據(比如在採集人的行為數據時必須把臉部模糊);如何平衡數據的有效和去隱私。

「數據的重要性已經充分展現出來,但數據治理的問題特別複雜。數據是可以被操縱和改變的,數據傳輸特別碎片化,數據交易的利益誘惑極大……數據採集是為數據共享和交易服務的,數據的標準化要為採集劃定邊界。」王金橋說。

來源:科技日報

編輯:李俊霞

審核:管晶晶

終審:冷文生

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!


請您繼續閱讀更多來自 科技日報 的精彩文章:

國家衛健委:4月1日起每日公布無癥狀感染者情況
確診了!北京某女多國旅行,隔離期兩次出現癥狀未報告