當前位置:
首頁 > 最新 > 邱 實:認知網路數據及其合規性之探討

邱 實:認知網路數據及其合規性之探討

在以互聯網為標誌的信息化時代,傳統數據在形式和內容的表達以及交流和傳遞的方式都發生了質與量的變化。網路數據對社會形態產生重大影響,對社會發展形成巨大動力。

對網路數據,不論是從法律和司法,或是技術和應用的角度,都必須要有明確、清晰的定義,以及對合規性有廣泛的共識。否則,對網路數據的研究難以避免缺少「共同語言」、缺失「治理 邊界」、缺欠「對話基礎」。

什麼是網路數據?

簡單地說,網路數據是以規範化數值或字符集合的方式,提供事實、概念或指令的表示形式,並通過網路傳輸、交換、存儲和共享,適合於人工或自動方法處理的通信和解釋。

網路數據的承載包括:元數據、內容、信息和情報。

圖1 網路數據承載的一般分類

因此,感知和認知網路數據,既可以從不同角度、不同場景、不同方法、不同目的,而且所獲取的知識也不是唯一的。但是,網路數據的合規性具有緊迫和重要的現實意義,參考國外的法律法規和術語定義,探討如下。

一、前言

2012年2月,美國智庫布魯金斯學會(Brookings)在題為《網路安全與美中關係》的報告中,就術語和議題框架的重要性指出:「任何一個登上國際議程的新議題,即使費時費力,都必須發展出一套公認的辭彙和概念。無論是貿易談判還是核武器,這些問題的基本術語往往看起來簡單,但要達成共識卻非常困難。」該報告認為,「術語相異」對美中雙方就行為規範或合作性實施機制達成共識產生巨大挑戰。

2014年6月9日,美國國防部發布《專業術語和定義》,開篇引用了希臘哲學家、教育家蘇格拉底的一句話:「智慧始於對術語的定義」。美國參謀長聯席會議、美國國防部、美國國土 安全部、北約組織等近年來不斷地修正和持續地更新網路以及信息戰的字典和專用術語,發人深省。

二、網路數據驅動了「網路法律」

5月25日生效的歐盟《通用數據保護條例》GDPR,取代了1995年的數據保護指令,是迄今最為嚴格的個人數據保護法規。

GDPR重新定義和規定了網路數據中的「個人數據」為:「識別或可識別自然人有關的任何信息」。在GDPR法釋(Recital)中的第26條進一步澄清「可識別」為:可以通過「一切合理和可能使用的手段」識別個人。這就是說,雖然可能不是由持有數據的企業主動地識別個人,但是如果數據可用於通過與其他數據源進行匯總來識別某個人,則該數據(或元數據)仍被視為個人數據。

GDPR還規定了個人身份識別不僅僅是個人姓名,還包括身份標識(ID),瀏覽器緩存(Cookie)、電子郵件(Email)地址、互聯網協議(IP)地址、元數據(Metadata)等內容,以及對於數據泄露的報告和通報。

因此,可以認為,是網路數據驅動了GDPR「網路法律」,以保護網路數據中的個人數據及個人隱私和個人權利。

3月23日,美國《澄清境外數據合法使用法》(CLOUD)生效,授權美國執法部門可以調取互聯網所涉在世界各地存儲和管理的網路數據。CLOUD不僅修正了美國法典(U.S. Code)的第18章,而且與之前的相關法律法規互為依託、延伸。例如:

聯邦貿易委員會法(FTCA),消費者保護法,禁止不公平或欺騙行為,並應用於離線和在線隱私和數據安全政策。

金融服務現代化法(FSMA),規定金融信息的收集, 使用和披露。

健康保險流通與責任法(HIPAA),規定醫療信息的收集, 使用和披露。

公平信用報告法(FCRA),適用於使用消費者報告的機構(如貸款機構)和提供消費者報告信息的機構(如信用卡公司)。

電話用戶保護法(TCPA),規範收集和使用電子郵件地址和電話號碼。

電子通信隱私法(ECPA)和預防電腦欺詐和濫用法(CFAA),分別規範攔截電子通信和篡改計算機內容。

可見,由網路數據驅動的「網路法律」,所規範和適用的場景和範圍不盡相同,但又存在法條的相互關聯和參照的交叉法則(Two-Pronged Test)。因而,「網路法律」是跨領域的立法和司法程序,且需要不斷地補充、修正和完善,包括術語的定義和解釋。

三、網路數據之「術語」及其合規性

英文與中文都有多義辭彙,其含義往往不僅需要結合上下文解釋,而且還需要有專業的知識和實踐的經驗。尤其是,隨著互聯網的快速發展,某些關鍵的英文單詞和辭彙被重新標準化定義,修正或賦予專業的表達。

美國參謀長聯席會議副主席詹姆斯·卡特賴特(James Cartwright)在發布網路空間戰專用術語詞典的備忘錄中強調:網路領域的某些單詞已不能夠詳細表述任務集的細微差別,專業詞典是作為在所有與網路相關的文檔、指令、作戰理念和出版物中規範術語的起點。相關術語定義和解釋的摘錄如下:

1)數據(Data),以規範化數值或字符集合的方式,提供 事實、概念或指令的表示形式(適合人工或自動手段進行通信、解釋或處理)。來源:美國國土安全部專業術語詞典。

2)元數據(Metadata),對具體數據段的描述及其所有關聯屬性的信息。(備註: 元數據表示資源的來源、特徵、時間、地點、原因和方式。最為一般的解釋是描述數據的數據。) 來源:美國國土安全部專業術語詞典。

3)信息(Information),是可利用形式的數據,通常以有意圖的方式進行處理,組織,結構化或呈現(人類賦予數據以使用的已知慣例的含義表示)。來源:美國國土安全部專業術語詞典。

4)情報(Intelligence),分析和綜合具有戰術,行動或戰略 價值的信息。來源:美國國土安全部專業術語詞典。

5)數據元素(Data Element),(1)建立在標準結構上的基本信息單元,具有特定含義和不同單位或數值的。(2)在電子記錄中,涉及具體的信息項目的字元或位元組的組合,例如姓名,地址或年齡。來源:美國國防部專業術語詞典。

6)信息環境(Information Environment),對信息收集、處理、傳播或行動的個人、組織和系統的集合。來源:美國國防部專業術語詞典。

7)『網信』空間(Cyberspace),全球範圍的信息環境(數字化信息通過計算機網路傳遞的概念環境), 由相互依存的信息技術基礎設施網路和存儲數據組成, 包括互聯網、電信網路、計算機系統以及嵌入式處理器和控制器,通過網路系統和相關的物理基礎設施來存儲,修改和交換數據。來源:美國國防部專業術語詞典。

8)網路(Network),執行某一功能的信息交換或相互交互。來源:美國國土安全部專業術語詞典。

9)互聯網(Internet),可公開訪問網站(Web)內容的網路。來源:美國國土安全部專業術語詞典。

10)『網際』或『網信』(Cyber),與計算機文化特點相關的信息技術和虛擬現實。(來源:北約網路協同防務合作中心(CCDCOE)-牛津字典。)

參考專業術語定義以及網路和互聯網的關係和現狀,必須 定位和區分網路(Network)、互聯網(Internet)、『網際』(Cyber):

圖2 國際標準:『網際』安全與其他安全領域的關聯關係(來源:Guidelines for Cybersecurity,ISO/IEC27032,2012)

其中,網路(Network)一般指的是電信網路(或計算機網路、物理網路),而『網際』(Cyber)既與網路(Network)有交集,且覆蓋的範圍更為寬泛。因此,Network和Cyber同譯為「網路」 不僅造成概念混淆、混亂,而且缺失合規性(或成為「術語陷阱」)。

建議考慮:Cyber結合上下文譯為「網際」或「網信」,以應對 「網路邊界」的挑戰,包括合規邊界、管轄邊界、治理邊界:

1)彌補傳統網路(Network)、互聯網(Internet)、應用(App)之間存在的空白(缺失),定位和顯現法律的合規邊界;

2)Cyerspace,或譯為「網信空間」,是由全球化的物理網路、 網路數據、網路行為的三個維度所組成(來源:美國參謀長聯席會議的軍事教義「信息戰」,JP3-13,2012-11),而這個信息環境不可避免地存在主權的管轄邊界。

3)網路數據的核心問題是數據保護,而基於網路數據的立法司法的多邊對等執行直接涉及政策的治理邊界。

四、網路數據之「數據」及其合規性

在網路環境中,數據與信息必須有效地差分(分類)和區分(聚類),「跨界內容刪除」(Cross-Border Content Takedown)是目前國際社會正在熱議的主題之一。

在網路應用中,數據不再僅僅局限於「記錄」的過程和動作,而數據的多源和多元的湧現使得數據有了「生命力」(例如,臉書Facebook的數據泄露醜聞),「跨界訪問用戶數據」(Cross-Border Access to User Data)是目前國際社會正在研討的另一主題。

圖3 全球互聯網及管轄政策網路的研討主題(2016-2019)

事實上,網路數據對於傳統意義的「客觀性」和「工具性」,已經或正在發生顛覆性的變化。

1)從法律的角度,GDPR規定:

在存儲或處理個人數據之前, 需要得到個人的有效認可。個人認可包括所收集的數據和將用於的目的,也包括營銷和其他形式的通信交流。

任何處理歐盟內個人數據的公司應對數據負責, 數據的管理者與數據的處理者同責,而無論公司位於何處。

因而,GDPR強制(迫使)在數據屬主(用戶)、數據管理者和數據處理者之間形成了一種「非零和」的合作博弈。

2)網路數據的「客觀性」之轉基因

GDPR對規定「所有IP 地址應作為個人數據處理」的解釋是:在動態IP 地址的情況下,個人每次連接到網路時IP地址都會發生了變化,但是網路服務提供商(ISP) 有一個暫時的動態IP 地址記錄(日誌), 並知道IP 地址已被分配給誰。

雖然原始產生的網路數據是客觀的,但是不可避免人為影響的介入,導致衍生或派生出新的網路數據(如習慣、喜好);由於濫用、失竊、泄露就可能形成變異的網路數據(如模仿、克隆),使原有網路數據的真實性出現了「轉基因」。例如,在機器學習領域中的一類模型:生成對抗網路,其目的和效果不僅超越了網路數據的客觀性,而且還可能超越人們對現實的已知能力。

任何網路數據集合都是稀疏的,或「客觀」網路數據存在局限性。

3)對網路數據的「工具性」之商榷

網路數據,不管是產生、應用和被利用,或是可以相互獨立存在的集合體,都是由信息技術賦予其動態的「生命力」,並挖掘出其價值。曾幾何時,網路數據被詬病為「信息孤島」、「數字垃圾」,而並不具備任何「工具性」特徵。一旦網路數據的「客觀性」不復存在,其功能和作用就需要被重新審視。因此,為了認知網路數據、了解網路數據,需要理念、方法和技術能力的不斷提升,包括:普適性的理論基礎和階段性的經驗推斷。例如:

香農(Shannon)定理給出,信道信息傳送速率的上限(比特每秒)和信道信噪比及帶寬的關係。香農定理可以解釋現代各種無線制式由於帶寬不同,所支持的單載波最大吞吐量的不同。

摩爾(Moore)定律提出,當價格不變時,集成電路上可容納的元器件的數目,約每隔18-24個月便會增加一倍,性能也將提升一倍。

但是,摩爾定律不同於香農定理的嚴格證明,摩爾定律應該被認為是觀測或推測,而不是一個自然或物理定理。

網路數據的「工具性」基於理論基礎、先驗和認知,以及合規。

五、歸納總結

網路數據驅動了「網路法律」,網路法律指的是跨邊界、跨領域、跨學科、跨(業務)應用所形成多邊的法律網路(Networking),以及適用於更為廣泛的交叉法則(Two-Pronged Test),而司法 不再僅僅是依照於一個法規、或若干法條的解釋。

網路數據所需的合規性(包括政策和策略以及多邊和對等),首先需要有對專業術語的理解和共識,避免或緩解由於「術語 相異」而造成的「術語陷阱」。

網路數據存在的稀疏性,成為機器學習、數據挖掘等新技術的目標和聚焦點,需要理念、方法和技術能力的不斷提升,尤其是加強對基礎理論的研究和積累。

主權和管轄是有界的;治理和管理是有界的,但法律和司法是跨界的;技術和理論是跨界的;業務和應用是跨界的,因此對網路數據合規性的相關研究和認知必須明確地定義和定位邊界。

(來源:崑崙策網【原創】

【崑崙策研究院】作為綜合性戰略研究和諮詢服務機構,遵循國家憲法和法律,秉持對國家、對社會、對客戶負責,講真話、講實話的信條,追崇研究價值的客觀性、公正性,旨在聚賢才、集民智、析實情、獻明策,為實現中華民族偉大復興的「中國夢」而奮鬥。歡迎您積极參与和投稿。

更多文章請看《崑崙策網》,網址:

推薦友情關註:

【獨立評論員郭松民】微信公眾號

共享【世界社會主義研究】微信公眾號

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 崑崙策研究院 的精彩文章:

梅新育:與貿易戰共舞
司馬南:關於中國輸贏的兩則判斷

TAG:崑崙策研究院 |