國外網路平台個人信息保護方式研究
國外網路平台個人信息
保護方式研究
【摘要】各種網路平台已經成為個人信息的重要載體,對於網路平台如何對個人信息進行保護的討論成為熱點。本文以非傳統的語料庫語言學研究方法,對國外發展較為完善的六家網路平台的隱私政策文本進行樣本分析,揭示了網路平台在個人信息保護方面的普遍做法,並提出了一些對策建議。
【關鍵詞】網路平台個人信息保護 語料庫語言學 樣本分析
Jean-Francois Millet · The Wood Sawyers
國外網路平台個人
信息保護方式研究
以互聯網為代表的數字技術正在加速與經濟社會各領域深度融合,成為促進我國消費升級、經濟社會轉型、構建國家競爭新優勢的重要推動力。隨著互聯網的發展,以及大數據產業的興起,各類網路平台利用其用戶的個人信息開展商業活動已不再罕見;一些由於個人信息泄露而導致的電信詐騙案件,隱私權、名譽權遭受侵犯的案件也呈多發態勢。但由於我國並沒有直接針對各類平台利用個人信息方面的法律,《中華人民共和國個人信息保護法》(草案)仍在立法議程中。目前,對於各類網路平台,主要是依靠行業內部的團體規定、有關法律問題的決定、部門規章以及部門工作文件來進行規制,缺少強有力的,高位階的法律規制。而且,各平台在制定各自的「個人信息保護聲明」或者「隱私政策」時,沒有統一的標準,質量參差不齊,而且該類文件制定後,由於沒有相關依據可以參照,有關部門在審查時也存在困難。
相比較而言,國外由於互聯網產業發展歷史長,技術和法律的規制也相對完善。尤其是美國,作為誕生互聯網的國家,其國內互聯網產業已經非常成熟,各類網路平台均有較好的發展,其產業規模佔全球比重極大。從1974年《隱私法案》開始,美國已經存在互聯網平台的個人信息保護方面的立法實踐,而歐盟也在1995年,通過推出《關於涉及個人數據處理的個人保護以及此類數據自由流動的指令》開始對網路平台利用個人信息進行法律層面的規制,日本2003年的《個人信息保護法》,等其他發達國家在對網路平台的規制方面有較多的先例可以借鑒。所以國外網路平台在發展中,始終有相應的法律作為保護個人信息的依據,其網站上都明示了隱私聲明鏈接,這應引起國內的重視。
所以,本文考察了國外網路平台所公布的隱私政策或者個人信息保護聲明文本,通過對此類性質文件的分析,觀察這些文本所表現出的特徵,一方面可以總結國外網路平台在處理利用以及管理用戶個人信息方面受到的規制,另一方面可以較為清晰的觀察平台自身在個人信息保護方面採取的做法。
具體來說,本文首先對各種網路平台進行分類,將研究對象定為使用程度最頻繁的三類網路平台——社交類、購物類、生活服務類。之後按照各類型對生活影響所佔的比重,選取了共6個平台作為研究樣本,將這些平台的「隱私政策」或「個人信息保護聲明」建立語料庫,運用Wordsmith?和AntConc兩個語料分析軟體對有關其法律規制方面的文本特徵抽象出來,再回歸自然文本與相關法律總結國外平台在保護個人信息方面的方式,為我國下一步立法,以及對網路平台進行規制提供借鑒。
目次
一、引言
二、研究思路及方案設計
三、研究過程及結果分析
四、結語
一、引言
(一)國內外現有研究成果
在個人信用信息隱私的立法保護上,主要存在歐盟的統一立法和美國的分散立法兩種立法模式。有的學者通過研究歐盟和美國在個人信息保護以及隱私權方面的立法進程,得出了以上結論。他們認為,歐洲在價值上,將個人信息保護或者說隱私權定義為一項基本權利,所以應得到社會的保護;由此,歐洲採納了一種全面性的、公共政策式的方法和適用於所有公立和私立部門的獨立的監管機制的方法論。美國的網路社會化程度相當高,而且網路的發展時間長,行業組織較為發達,業內企業對於行業組織的團體規定都較為認可。所以在制定法律和法規時力圖尋找一個平衡點,以協調保障用戶隱私權與促進網路信息業發展和保證網路秩序安全穩定之間的關係。
這是從立法模式角度進行的研究,而直接將規制對象定位於網路平台這一具體層面的研究則非常少。
(二)本文研究方法介紹
(1)語料庫語言學概述
本文將採用語言學語料庫分析法。該方法來源於國外,是通過對一段文本進行詞語上的分析,通過詞頻,關鍵詞、詞語搭配頻率等可量化的數據,反映文本的含義,作為進一步推論的直接證據,或可直接形成推論。
語料分析方法的特點是:
1. 經驗性的,著重於分析原始文本中現實存在的語言特點;
2. 利用龐大的文本集合,也就是「語料庫」作為分析的基礎;
3. 運用廣泛的電腦技術進行分析,包括自動的和互動的技術;
4. 依賴於定量分析和定性分析技術。
由此可以得知,語料庫語言學作為一種研究方法,其在研究語言現象和變體語言文本上具有很強優勢。人類的語言,無論是口語還是書面語言,都包含著作者的思想,而成規模的語料庫則蘊含著豐富的知識、事實、以及一些難以通過研究自然語言觀察到的細節。「文本挖掘」是在語料庫語言學下誕生的又一新學科,利用語料庫,可以在文本中挖掘出我們一是無法了解到的知識和事實。在法律中,這樣的應用也並不罕見。美國法庭上就曾發生過多起因對法律條款的解釋產生爭議而引起的糾紛。通常的做法是,律師以詞典為依據,從權威詞典中查詢法律條款中有關詞語的「平義」(plan meaning),陪審團依此裁定被告人是否有罪。但是字典或者法院解釋往往只給出該詞的規範釋義,很難契合各種不同的場合,所以尋找「平義」難以實現。語料庫則通過大文本的集合,克服不同語境帶來的干擾,實現了在給定語料庫情境下對一詞的語義分析,以此補充了法律條款中的「平義」。
本文的研究對象亦是如此。平台類型眾多,對個人信息和隱私的定義,以及其在收集利用,和分享透露信息上都有差別,即使是同一個詞,在不同語境下含義也不會完全相同。但是如果通過直接閱讀文本,則很難捕捉到這些細微但重要的差別。
(2)本文研究中主要觀察指標介紹:
1.文本全貌:通過語料庫分析軟體,得出各平台隱私政策文件或個人信息保護聲明的文本典型性如何。包括文本中有多少可被識別的辭彙、文本辭彙總量、非重複詞語數量等等。這一項指標主要是為接下來解釋詞語的特徵現象提供鋪墊。
2.詞語頻率:顧名思義,要對出現過的詞語,尤其是實詞進行數量上的統計並排序。可以考察該文本或者總體語料庫中詞語的適用情況,並可對高頻詞出現的原因做以推斷,得出可信的結論,或者證明、證偽之前的一些研究假設。
3.詞語搭配:通過計算機軟體,得出出現在選定變數詞語附近的常見詞語搭配,可以觀察到該詞的使用語境,有助於推論其對因變數的影響。
(3)選用該方法的理由
1.規則具有語言依賴性,通過考察其文本表述可以直觀地反映規則本身。平台的隱私政策或者個人信息保護聲明文本,是平台在實際操作運行中的依據,平台所有有關個人信息以及用戶隱私方面的操作均應以此文本為據。所以,本文所採用的方法,可在將這類文本處理後,抽象為可被統計和檢索的語料庫,通過研究者精心的變數設計,檢索與研究目標有關的詞,考察相關指標即可對文本所體現的內容有一個較為客觀地把握。
2.強檢驗的方式,使得結果具有獨特性,較有說服力。由於在樣本選擇和變數設計上依然是在案例式研究的大框架下,所以所得出的結論具有相當的獨特性。而且語料庫的方法,可以在一定程度上克服研究者的主觀印象以及知識背景對文本研究造成的影響,實現從文本的角度出發,而非從個人理解的角度出發。
3.更容易追蹤自變數與因變數,較為準確地反映研究對象。此類文本在閱讀時具有很大的迷惑性:一方面是平台為了保護自己,可能會故意隱藏對其單方有利的文本真意,僅通過不容易被察覺的方式暗藏在某些語段之間,如果直接對文本進行解讀往往很難發現;另一方面,該類文本的體量冗長,本身就代表了一定的意涵傾向,尤其是詞語搭配復現情況,直接反映了文本中所要考察的變數變化情況。
(4)研究工具介紹
本次研究採用的語料分析工具是「Wordsmith ? Mike Scott」2015年第六版以及「Ant Conc」3.4.4 2014年版,這兩個軟體可以完成上述功能,而且這是目前語料分析中常用的一個計算機輔助軟體,可靠度較高。所以,我將按照下文研究設計對樣本進行研究,最後,運用定性的分析方法對於得出的結果進行解釋,以獲取本文需要探究的國外網路平台在個人信息保護方面的方式以及相應的立法借鑒。
在此,也對以上兩個軟體的開發者和維護者表示感謝!
二、研究思路及方案設計
(一)樣本選取
「網路平台」是一個集合名詞,在不同語境下有不同的含義。網路平台已經成為人們日常生活和社會經濟中不可缺少的一部分,有些平台正在逐漸改變整個社會的運行機制,如網路支付工具(財付通、支付寶等)、家用遊戲平台(索尼PS3、微軟Xbox 360 等)、搜索引擎廣告平台(Google、百度等)、電子商務平台(Amazon、Ebay、淘寶等)。抽象地來說,網路平台指的是以互聯網線上應用或者網站為主要載體,以實現某種交互性功能為目的,為信息的傳遞、共享、反饋及其他功能提供場所的虛擬實體。目前來看,網路平台可以分為幾個主要類型,如社交類、購物類、生活服務類、金融類、娛樂類等等。但在眾多平台中,本文認為有三類較為特殊的平台,與個人信息的利用和保護及其相關。
首先是網路社交平台,既包括即時通訊類的社交平台,也包括廣播式的社交平台。如今這些平台承擔著相當大的信息量,每天都有數以億計的用戶訪問並發送數據,各平台的註冊用戶數也已經達到了上億的級別。尤為重要的是,社交平台上的個人信息享有的是一種新型隱私權——網路隱私權。其次是網路購物平台,也成為目前個人信息保護的重要關注點。購物平台不但掌握個人的姓名、年齡、住址等基礎信息,更重要的是可以通過用戶的購買記錄、搜索記錄等追蹤用戶的購物偏好信息,實現更為精準的廣告投放,同時也可以進一步分析用戶的心理偏好的信息以作進一步的商業利用。更重要的是,以網路購物平台為依託的網路支付環節中,一些逐利者容易將平台上流出的信息整理後販賣給實施網路詐騙的不法分子,導致一場場悲劇的發生,所以在源頭上關注網路購物平台是如何對個人信息進行保護的尤為重要。最後,一些生活服務類平台對個人信息的收集利用同樣值得注意,比如「約車軟體」將會追蹤用戶每次的行程軌跡,並且只要用戶使用該平台,或者僅僅是保持後台運行,該類平台的軟體都可以實時定位用戶,這直接關涉到用戶的個人隱私。
所以,本文將在這三類與個人信息保護極為相關的平台中選取樣本,每類中選取兩家有代表性的平台。下面逐一做以簡要介紹。
網路社交平台:
Twitter(以下簡稱中文:推特)是一個廣播式社交網路與微博客服務,它可以讓用戶更新不超過140個字元的消息,這些消息也被稱作「推文(Tweet)」。Twitter被形容為「互聯網的簡訊服務」。網站的非註冊用戶可以閱讀公開的推文,而註冊用戶則可以通過Twitter網站、簡訊或者各種各樣的應用軟體來發布消息。2011年9月7日,Twitter對外宣布他們已經擁有1億活躍用戶,這些用戶每個月至少登陸Twitter網站一次,並且有5000萬的活躍用戶每天使用Twitter服務。
WhatsAppMessenger(以下簡稱WhatsApp),是一款用於智能手機的跨平台加密即時通信應用程序。該軟體通過互聯網進行語音通話及視頻通話,並使用標準移動網路電話號碼向其他用戶發送簡訊、文檔文件、PDF文件、圖片、視頻、音樂、聯繫人信息、用戶位置及錄音檔等。WhatsApp公司總部設在美國加利福尼亞州的山景城,2014年2月Facebook耗資約193億美元收購為旗下事業體。截至2016年2月底,WhatsApp的用戶人數超過10億人,使其成為時下最流行的即時通信軟體。
網路購物平台:
Amazon(以下簡稱中文:亞馬遜)是一家總部位於美國西雅圖的跨國電子商務企業,業務起始於線上書店,不久之後商品走向多元化。目前是全球最大的互聯網線上零售商之一,也是美國《財富》雜誌2016年評選的全球最大500家公司的排行榜中的第44名。
eBay(中文:電子灣、億貝、易貝)是管理可讓全球民眾上網買賣物品的線上拍賣及購物網站。營業額140.7億美元(2012)、總資產372.7億美元(2012)、員工人數27,770人(2012),是目前全球應用最廣的線上拍賣及購物網站之一。
生活服務平台:
Uber(以下簡稱中文:優步)是一間交通網路公司,總部位於美國加利福尼亞州舊金山,以開發移動應用程序連結乘客和司機,提供載客車輛租賃及實時共乘的分享型經濟服務。乘客可以通過發送簡訊或是使用移動應用程序來預約這些載客的車輛,利用移動應用程序時還可以追蹤車輛的位置。業務範圍遍及500多個城市,用戶數超過10億人次。
Lyft(以下簡稱中文:來福車)是一間交通網路公司,總部位於美國加利福尼亞州舊金山,以開發流動應用程序連結乘客和司機,提供載客車輛租賃及實時共乘的分享型經濟服務。乘客可以透過傳送簡訊或是使用流動應用程序來預約這些載客的車輛,利用流動應用程序時還可以追蹤車輛的位置。來福車於2012年6月啟動,目前大約在300個美國城市中營運,包括紐約、舊金山及洛杉磯,每月提供1870萬次載客。2017年4月,該公司市值為75億美元,募資總計26.1億美元。
可以看到,這6家平台有如下幾個共同點。一是這些平台在各自的領域都佔有較大的市場份額,而且用戶數和訪問量都具有相當的規模;其次在業務範圍方面,這幾家平台的業務幾乎是覆蓋全球,但都發源於美國;最後是誕生年限方面,除亞馬遜更早一些外,整體來說相近,而亞馬遜開始作為網路平台出現的時間事實上也與其他幾個平台相差不遠。從這三個主要的相同點上,本文認為通過研究這六個樣本,可以較為準確地反映當前國外網路平台對個人信息的保護情況,減少樣本中極端值的影響。而且每個樣本內容也相當具有代表性,可以代表一個行業內的普遍狀況。總而言之,將這6個網路平台作為此次研究的樣本,兼具普遍性與特殊性,與所要研究的問題高度契合。
(二)變數設計
本次研究的因變數即是本文題目——「保護方式」,而自變數是網路平台的個人信息保護手段和路徑。也就是哪些自變數對個人信息保護造成了影響,以及其作用方式。
但手段和路徑是抽象的,不容易被直觀的觀測。所以,為了實現對手段和路徑這個自變數的觀察,本文將選取一些可以反應網路平台對個人信息進行處理和利用,以及管理個人信息時所涉及的詞語,通過詞頻和詞語搭配復現的方式,直觀反映該自變數。綜上,變數設計的研究思路如下圖1所示:
圖1 本文變數設計思路
所以在選取哪些詞作為語料分析檢索的值就非常關鍵,選擇的這些詞,必須是可以準確地體現出網路平台對於個人信息利用、處理和管理所採取的行為動作的詞語。通過借鑒國內外學者的研究成果,以及對樣本的初步研究,本文將以下詞語作為此次研究的檢索詞語。
第一組:
INFORMATION、PRIVACY、DATA
個人信息與隱私權保護的關係始終是學者們討論的話題之一。在傳統的規制模式中,隱私權一般指的是不能公開的,或者不適宜公開的個人心理、情感、生活癖好等等信息。但在大數據時代,個人信息的範圍往往與以往隱私權所要保護的內容存在競合,「交出個人信息就是生存的一種必要條件」,而平台正是利用諸多個人信息為我們的生活提供了便利。所以,如何認清各種平台對「信息」、「隱私」、「數據」的界定,非常關鍵,這構成了下一步推論的基礎。
第二組:
COLLECT、USE
通過對庫中各平台隱私保護政策或者個人信息保護聲明的考察,以及對其他平台的考察。網路平台在告知用戶其將收集信息時,使用的辭彙集中於「COLLECT」、「USE」。在討論網路平台如何對個人信息保護時,往往首先要涉及到一個問題,就是平台如何收集和使用信息。收集和使用的方式是否合法,其包含的範圍是哪些,都對觀察平台的保護行為產生影響。據相關研究,網路平台在信息市場中除了提供其基本服務功能外,也扮演著信息市場的中介的角色,而中介方的市場流程第一階段就是從供給方獲取信息並存儲。
第三組:
SHARE、DISCLOSURE
對應的,平台對用戶個人信息管理中存在的信息泄露問題一直是各種研究關注的重點,所以通過考察平台的分享和披露個人信息或數據的行為,可以較為清楚的了解其在遇到此類問題時是如何對個人信息進行保護,或者其存在的問題。比如在一些網路購物平台註冊時,常出現「您提供的數據與資料將授予本運營商獨家永久使用權」此類條款,而諸多用戶並不在意,引起了個人信息泄露的風險。
三、研究過程及結果分析
(一)文本總體情況分析
本次研究涉及6個平台的隱私政策或者個人信息保護聲明文本,總計127109詞。各平台文本的具體情況如下圖(圖2)所示。從中可以看到,即使是同一類型的網路平台,其文本在長度和用詞情況上也有很大區別。最明顯的是社交平台和網路購物平台,Twitter和eBay兩平台表意詞語(tokenused for word list)在長度和不同詞語(distinct word)數量上都大幅超過其同行業對手;相反的,Uber和lyft則較為相近。表意詞語與不同詞語的比例(type/token ratio,以下簡稱TTR)上,儘管eBay在表意詞語數量上佔優,但實際上不同詞語所佔比例是所有文本中最低的。
圖2 各平台文本特徵辭彙情況統計圖
如果專門對平台的隱私政策協議的性質進行考察,可以對此現象做如下解釋。一是隱私政策協議或個人信息保護聲明往往作為用戶使用平台所要同意的諸多格式條款的一部分存在,不同平台對由於運營業務的差異性,所以其格式條款需要實現不同功能,導致了隱私條款內容的不同。以網路購物平台為例,其隱私保護政策主要包括兩方面內容,一面是對於使用平台的消費者,一部分是經營網路店鋪的經營者,這就導致了其內容的膨脹。本文研究樣本中,eBay的主營業務形態類似於淘寶,網站本身只經營小部分的商品銷售業務,更多的商品由平台上的其他用戶提供,所以其需要規定不同的隱私保護內容。而Amazon的大部分業務是其自營商品,其他商戶的比例相對較小,而且很少有個人經營的商戶存在,所以內容上會相對少一些。雖然需要考慮的隱私保護對象有差別,但二者在許多基本權利條款上共性較大,用詞不會有很大差異,導致了eBay又在文件內容增加的情況下,TTR反而降低。
其他平台的情況也大體相似,所以由此可以總結出一個結論。網路平台制定隱私保護政策是基於其業務形態的,但其內容的繁簡併不能反映其對隱私和個人信息保護的方式上的多樣性如何,不可單純地以文本長度來判斷某平台對個人信息保護程度的情況。
(二)第一組詞語
個人信息的定義及其具體外延和內涵有很多不同說法,比如,信息(Personal information),個人數據(Personal data)和隱私(Privacy)。尤其是隱私,至今還沒有一個人盡皆知的定義,也沒有一個普遍化的定義被廣為接受。
所以,對網路平台如何定義個人信息做精準解釋成為開展更深入研究的首要工作。學界對個人信息的定義也有很多理論,典型的代表是「識別說」和「關聯說」,以及動態場景(情境)理論。但對於網路平台是如何界定個人信息的,並沒有給出精確的答案,而只停留在外部社會如何界定個人信息,以及在大數據時代下如何界定。本文首先通過分析這三個詞語在各平台的文本中佔比情況,觀察各平台在「信息」、「隱私」、「數據」三者的表述上有何顯著特徵,結果如下圖(圖3)所示。
圖3各平台information、privacy、data使用情況百分比堆積柱狀圖
可以看到,在各詞語的使用頻率上,各類平台顯示出的偏好各有不同,尤其Twitter與WhatsApp雖然是同一行業內的平台,其差異卻十分明顯。Twitter作為廣播式社交平台,在隱私政策中相比更加私密性的WhatsApp,更強調對更廣義上的數據進行保護和管理,其他行業中在這點上的數據表現差異性不甚顯著。
總體情況是雖然各平台在文本標題上是「隱私政策(Privacy policy)」,但實際內容中往往更加強調對於信息的保護和管理。無論是向用戶做出保護的承諾,或者是提示用戶平台將會怎樣利用其信息及隱私內容,「隱私」這一真正敏感的詞語在文本中使用的場景遠不如「信息」的廣泛。
表 1 Privacy 詞語搭配復現情況前10位統計表
上表(表1)是「隱私」一詞的左右復現詞語情況,可以看到排名前5位的詞語幾乎都是宣示性的,並沒有很好的反映出平台是如何界定「隱私」的。但值得注意的是,在第六位和第十位上隱私一詞的左邊出現了「SWISS-US」及「EU-US」這樣的詞語,以及「Global」具體使用情況如下:
1. Our Global Operations
Tobring you the Services, we operate globally. Twitter, Inc. complies with theEU-US and Swiss-US Privacy Shield principles regarding the collection, use,sharing, and retention of personal information from the European Union andSwitzerland, as described in our EU-US Privacy Shield certification andSwiss-US Privacy Shield certification.
2. EU-US and Swiss-US Privacy Shield
Amazon.com,Inc. participates in the EU-US and Swiss-US Privacy Shield frameworks. Clickhere to learn more.
3. eBay Inc. has established global privacystandards for all eBay Inc. companies known as our Binding Corporate Rules(BCRs).
說明國際性網路平台在制定隱私保護政策時確實受到了國際條約、國際公約或者國際原則的限制,同時也反映出幾個比較典型,或者說是有效的國際原則,即歐盟、美國和瑞士三個主要國際主體所認可的隱私保護原則。
當我們用同樣的方法考察信息這一詞語時,情況就完全不同了(見表2)。首先從詞語搭配復現情況上可以看出更多具體的使用情境,以及平台是如何將「信息」進行分類的,並且一些具有實際意義的動詞也出現在了較高頻的復現搭配中。
表 2 Information 詞語搭配復現情況前20位統計表
僅通過位於中心詞左側出現頻率最高的L1列,就可以觀察到「個人信息」、「位置信息」、「聯繫信息」、「賬戶信息」、「附加信息」、「簡要信息」以及「公共信息」等不同種類的信息。這一方面說明網路平台以信息的內容,以及該信息在什麼情境下使用作為信息的分類標準,另一方面也是提示用戶其留在平台上的信息會被打上怎樣的標籤。再通過觀察與信息形成搭配的動詞,頻率較高的是「接受」、「分享」、「收集」、「提供」,而非「保護」或者近義的詞語。由此可以得出一個結論。網路平台在隱私政策中更多的是向用戶釋明該平台是如何運作的,而非將重點放在保護用戶隱私上。
(三)第二組詞語
收集和使用是網路平台個人信息保護的關鍵環節,一些常見的個人信息泄露時間往往發生於這一階段。一般來說,網站採集個人信息主要有 4 種方式,即用戶註冊填寫信息,在線調查活動中填寫個人信息,Cookies收集的用戶上網信息,其他採集方式在個人註冊網站賬戶填寫信息時也是在傳遞個人信息,如果網站沒有正當使用則導致個人信息的泄露。所以,在這一部分中本文將對「收集」和「使用」兩次的使用語境做以考察。
表 3 collect 詞語搭配復現情況前10位統計表
由上表(表3)可見,網路平台在收集行為上所出現的使用搭配,與傳統研究所涉及的內容區別不大,但在(L1,5)中出現的與中心辭彙組成的「knowingly collect」搭配,即「有意收集」這一片語,之前的研究很少涉及。在本次研究的6家平台中,有3家的文本中都出現了這一片語,具體使用情況如下:
1.Amazon.com does not sell products forpurchase by children. We sell children"s products for purchase by adults. Ifyou are under 18, you may use Amazon.com only with the involvement of a parentor guardian. We do not knowingly collect personal information from childrenunder the age of 13 without the consent of the child"s parent or guardian. Formore information, please see our Children"s Privacy Disclosure.
2.Our websites are general audiencewebsites, and our Services are not intended for children under the age of 13.We do not knowingly collect personal information from users in this age group.
3.Children Privacy. Lyft is not directedto children, and we do not knowingly collect personal information from childrenunder 13. If we find out that a child under 13 has given us personalinformation, we will take steps to delete that information. If you believe thata child under the age of 13 has given us personal information, please contactus at our Help Center.
可以看到,「有意收集」的內容是針對未成年人,尤其是為13歲以下的兒童而專門制定的保護性政策。再結合其他內容來看,網路平台在收集和使用用戶個人信息的保護方面,不僅考慮了傳統的「識別性」以及「情境」,而且也會對用戶本人的身份,甚至是內容進行進一步審查。但在本次抽樣的六家平台中,也僅有三家有此項保護條款出現,這三家中兩家是網路購物平台,另一家是網約車平台。但,如果從商業角度分析網路購物平台的此項聲明的用意,首要的應是防止無效購物合同的產生。由於13歲及以下的兒童屬於無民事行為能力人,且大多數國家的法律規定都是如此,所以一旦兒童自己註冊了平台賬號並消費了與其能力不相稱的商品,那麼後期很容易引發購物糾紛。所以在隱私政策中,直接用明示條款將兒童所提供的信息全部排除,意味著無論是兒童在平台上留下的個人信息,還是其發布的購物信息都不被收集和使用。而基於此帶來的附加效果,是保護了兒童的個人信息不被泄露。所以,儘管一方面網路平台將收集的個人信息用於了商業目的,但同時另一方面,為了保證其商業目的能夠實現,也在一定程度上保護了部分個人信息。
表 4 use 使用情境統計表截錄
但類似的,「use」詞語搭配復現情況統計表中筆者沒有發現值得解讀的信息,反而如果直接考察具體的使用情境(表4)則可以證明一點:網路平台在此類格式文件中,將「用戶允許平台使用其信息」作為用戶使用該平台提供的服務的一項條件。各平台都明示了用戶,平台將使用哪些信息,但在平台利用這些信息進行的活動上表述模糊。WhatsApp中的表述「We use all the informationwe have to help us operate, provide, improve, understand, customize, support,and market our Services.」非常典型,留給平台很多解釋的空間,尤其是「market our service」,幾乎可以為平台利用個人信息進行的任何商業行為提供解釋。
綜上,網路平台在收集和利用個人信息方面提供的保護存在以下特點。一是在收集上網路平台確實已經採取了情境式的個人信息收集模式,除此之外還會對信息的提供者身份進行考察,拒絕收集13歲及以下未成年人的信息成為普遍做法。但是這類條款多數存在於涉及商品交易及消費性質的平台中,條款的動機更側重於對商業的保護。二是在使用方面,不但再次印證了第一組詞得出的結論,即保護條款的功能更側重於向用戶釋明平台的活動,而且即使是釋明,也存在模糊的表述,為平台恣意解釋其規定留下了巨大的空間。
(四)第三組詞語
分享和披露兩個動作對於考察網路平台對個人信息保護方式上非常關鍵,不恰當地共享或披露用戶信息是侵害網路隱私權的一種常見現象。所以,本研究通過對網路平台這兩個詞的使用語境進行分析,可以較為全面地了解網路平台自身對這兩種行為的規製程度。
表 5 share 詞語搭配復現情況前10位統計表
表 6 share 詞語搭配復現情況前10位統計表
由上表(表5、表6)可以看到,平台在使用「分享」這一詞語是,與之搭配的有關被分享的內容的詞語都較為模糊,頻率高的仍是「信息」這類概括詞。除此之外,「位置」這一詞語的頻率相較於其他詞語的出現頻率也較為突出。類似的,在對「披露」這一詞語進行考察時,並沒有發現直接能解釋行為內容的詞語搭配。但在統計過程中,兩行為在不同平台的文本中出現的頻次有顯著差別,「分享」一詞最為明顯,具體情況如下圖。
圖4 share*在各文本中出現頻次/文本總詞數 統計圖
明顯的特點是,購物網站在分享或者共享行為上的有關表述不多,而其他平台則基本近似。社交平台一部分的功能在於為用戶提供分享、共享信息的服務,所以該詞的出現較為廣泛;網約車平台在使用這一詞語時情況比較多樣,一種是解釋其「拼車」服務時,二是由於業務需要而必須分享司機或者乘客的地理位置等信息。所以,其隱私政策在對分享行為的表述思路是基於為用戶提供的服務內容而定的。
四、結語
本文運用語言學語料庫的方法,對國外平台個人信息保護的方式進行了研究,得出的結論及發現的問題有以下四方面:
歡迎關注
大數據和人工智慧
法律研究院
異 化 中 的 解 放