王磊：從數據屬性視角看數據商業化中的使用規則

最新 05-18

B D A I L C

歡迎關注

隨著網路的進一步擴張，越來越多的信息以數據的形式匯聚在互聯網之中，形成大數據，此類數據具有體量大、類別大、價值密度低等特點。而基於數據分析技術的發展，使得利用如此龐雜的數據資源成為可能，因此數據的商業化趨勢不可避免。在商業實踐中企業對數據利用依據性質可以主要分為身份數據、行為數據、內容數據。數據商業化規則、個人信息保護與數據利用之間的利益平衡、信息流動與不正當競爭之間的邊界等是數據商業化的主要問題。因此，需要在把握數據屬性及商業規則的基礎上，從相關案例中總結經驗，考量多方利益進而找到合適的數據商業化利用途徑。

? 方濟眾

從數據屬性視角看數據商業化中的使用規則

文 / 新浪集團高級法律顧問王磊

當今我們已處於數據爆炸的時代，隨著互聯網技術的發展，數據之間的交互和共享變得越來越便捷。移動端和雲服務的出現，突破了人們使用計算機瀏覽網路的局限，智能手機等移動通訊設備的高頻率使用和社交網路等新溝通方式的出現，使得數據在共享過程中又不斷產生新數據。這些數據種類豐富，包含文字、圖片、視頻、音頻等各種形式的信息，數據的爆髮式發展也使得大數據產業迎來了新的機遇。《華爾街日報》將大數據時代、智能化生產和無線網路革命稱為引領未來繁榮的三大技術變革。奧巴馬政府在2012年公布了「大數據研發計劃」（Big Data Research and Development Initiative），以增強聯邦政府收集海量數據、分析萃取信息的能力，迎接新的挑戰。我國也將推進大數據發展作為國家戰略，布局下一代互聯網[1]。大數據已在網路通信、醫療衛生、農業研究、金融市場、氣象預報、交通管理、新聞報道等方面廣泛應用。以數據整合、分析與挖掘為表現形式的數據整合與數據控制能力已經遠超以往。越來越多的數據被收集，越來越多的數據產品被利用和加工，而且越來越多的針對數據的產品更為有效地改變我們日常的生活。隨之而來的是數據的定義模糊化，對於數據的定義和權益界限尚未明確。這種未明確的數據權屬也為大數據產業的發展帶來了不確定性；同時，由於數據蘊含巨大的商業價值，與之一併產生的地下產業也讓有序推進數據開發的主體無法有效保護其數據產生的商業模式帶來的利益以及其平台用戶的權益。數據糾紛之所以出現，對於各平台公司來說，是出於他們在大數據時代對於自身商業利益進行維護的必要。對數據保護，各平台公司目前除了採取技術對抗措施外，在法律層面主要依據《反不正當競爭法》提出保護訴求[2]。本文從數據利用規則角度，通過現階段已經確定的典型生效判決來分析探究數據商業化利用的基本規則。

一、數據的特性

在談論數據利用規則之前，我們需要了解數據的概念，本文討論的數據，區別於在計算機及網路上流通的在二進位的基礎上以0和1的組合而表現出來的比特形式的數據，也區分於日常生活中各種紙面統計數據及相關以賬號和密碼形式存在的數據或虛擬財產，本文中數據，指通過互聯網收集的大數據，具有體量大、類別大、價值密度低等特點的身份數據、內容數據和行為數據。對於數據的定義，可以從多個角度來進行劃分，數據其實無處不在，記錄信息內容，身邊的筆記，通訊錄，黃頁信息等都是數據，但現階段商業化的數據是通過互聯網和移動端收集的數據，可以分為身份數據、行為數據以及內容數據。

當下社會基於互聯網和移動端的發展，使得數據收集和創造變得便捷，且通過互聯網數據分析技術的突破性發展，使得分析利用數據和並依照分析結構預測成為可能[3]。數據本身是信息流動的產物，數據分析利用已在網路通信、醫療衛生、農業研究、金融市場、氣象預報、交通管理、新聞報道等方面廣泛應用。正如Facebook的副總工程師傑伊·帕瑞克所言,「如果不利用所收集的數據，那麼你所擁有的只是一堆數據,而不是大數據」[4]。

那麼，我們對於數據和大數據來看，數據是收集的樣本，而大數據是對於數據潛在價值的挖掘和分析，是種類多樣的數據集合。從系統論的角度來說明數據的這一特性，其來源可能是千千萬萬的用戶提交和收集，但對於數據分析和利用結果，通常是海量數據中極小的一個片段，但這個片段本身卻以海量的數據為基礎樣本分析，這也是「整體湧現性」[5]的一個體現。分析結果離不開海量的樣本數據，但結果價值和方式卻高於樣本數據。正因為數據本身散亂的來源，因此需要通過大數據分析技術將數據加以「提純」，而這也是數據本身「價值密度低」，但「商業價值高」的表現方面。

數據可能有很多來源且與許多種信息相關聯。但是，它們都具有以下共同特徵。

（1）無損性。無損性也是數據本身傳播過程中的重要特性。在複製和傳播信息方面，數據與知識產權的性質很像。對於數據提供方和數據使用方來說，數據流轉與傳統民法中物的流轉方式不同，它可以通過多次的複製提供，且不因為多次的提供和交易而減損自身的內容。

（2）多渠道性。數據可以被多個主體獲得或使用，有時甚至是同時獲得使用。一個主體有可以很容易獲得某些數據的渠道，不代表其他主體沒有同樣或類似的渠道。而且，對於數據來源的不同，以及存在網式、環式或鏈式的交易結構，對於上下游之間的數據開發和處理方來說，可能又成為各自下游利用方的數據分析樣本。

（3）時效性。數據的「時效性」要求很高，數據可能很快過時，因此可能在很短時間內失去價值。數據收集過程中，需要持續性的投入，以保障數據樣本更新和時效性。當然，「失去時效」的數據並非沒有價值，只是在數據發掘和數據開發的過程中，數據對分析結果的影響可能隨著時效性的降低而隨之降低。

（4）擴容性。數據利用與開發後形成的衍生數據和分析結果，同樣可以反饋回原生數據，並同時豐富原生數據的內容，使得數據本身擴容進而提供更多可分析數據樣本。數據的這一特性也體現了數據流動的基本價值，通過數據主體之間的雙向和多向流動來創造更多數據。

（5）多樣性。同樣的數據分析後，產生的內容和分析結果可以完全不同，而這種不同的數據結果導致數據的體量和內容更加豐富。同樣的數據可以發展出不同的應用場景，且每個場景之間可以互動互通，也可以各自獨立。

針對數據所存在的各方面特徵，所產生的法律效果也是不同的，以數據利用過程中對於極具商業價值的分析結果來說，要從價值的貢獻角度考慮數據各方主體的作用，進而分析其可能存在的權益劃分。在收集環節，通過協議或數據交易獲得的數據，在得到合法授權後又進行分析產生衍生數據，以及針對衍生數據指引形成的數據分析結果，將會形成不同的法律效果和法律關係。同時，本文中所討論的數據主要基於個人使用所產生的身份數據、行為數據和內容數據，因此在討論中應當對於個人屬性緊密聯繫的部分進行區分，但這同時對現階段數據的商業應用提出了課題，數據應用的「千人千面」為了提供更好的個性化服務，必然會結合與個人屬性相關的數據作為參數進行考量，但如何在不侵害個人合法權益的基礎上實現商業目的，也是數據未來發展的重要方向。

二、數據使用中的案例與思考

數據本身的權利體系目前尚存在一定爭議，《中華人民共和國民法總則（草案）》（以下簡稱草案）中曾將數據列入知識產權項下，但在《民法總則》通過稿中將數據與虛擬財產置於第127條中加以規定[6]，列於第126條「其他民事權利和利益」之後。歐盟委員會在2015年12月發布了一個提案，有關合同提供數字內容的相關問題[7]（就是之後的「數字內容提案」）。這個提案涉及消費者與數字內容提供者關係的合同問題。數字內容提案強調了「個人數據越來越被市場參與者認為，具有和貨幣相當的價值。」相應地，在消費者以個人數據或其他數據，而不是錢來作為對等物進行交易時，這個提案也可適用[8]。這個提案也規定了（個人）數據的商品化。隨後一些學者個人數據的「屬性化」以及創設一種針對個人的數據財產權（對物權）。[9]這種推論與大數據環境密切相關，因為在大數據分析的框架中，可以對個人數據進行更普遍的分析。

與數據權屬探討的爭議不同，對於數據本身代表的利益與價值已達成普遍共識。數據與商業價值本身密不可分，對於商業平台利用的數據[10]本身，依據其性質不同，可以分為三個部分，一是身份數據，二是行為數據，三是內容數據。其中數據在商業化利用過程中，由於目前沒有明確的權利加以保護，通常維權和解決糾紛的做法為適用《反不正當競爭法》第二條加以保護。大多數競爭法來源於公司具有有形資產的時代，在當時，即使公司沒有規定具體細節，他們或多或少也會提供一些有著明確的目的、價值、消費者的商品或服務。但是現在「數據」發展成為了一種新商品。大量的數據可以定義公司的價值，數據可以交易，可以用於利用新的產品或服務。同時，數據本身帶來的用戶流量，在公司運營和資本市場中體現出巨大的商業價值，各互聯網公司平台用戶的流量代表了其收集信息的能力[11]。為此，在下文將通過對實踐中發生的案例介紹來具體分析現階段對於數據的主要糾紛及表現形式。

2013年9月11日至2014年8月15日，北京微夢創科網路技術有限公司（微博服務提供商，以下簡稱「微博」）與北京淘友天下技術有限公司、北京淘友天下科技發展有限公司（脈脈服務提供商，以下簡稱「脈脈」）簽署《開發者協議》，約定脈脈在合同規定期間可以利用合同中約定的微博系統開放介面（OPENAPI），獲取微博用戶信息資料用於脈脈應用的使用。但在合作過程中發現脈脈應用非法獲取的微博用戶教育信息和職業信息等內容。微博於2016年向北京市海淀區人民法院提起訴訟，起訴脈脈在未得到用戶授權和微博授權的前提下非法搜集微博用戶信息，並將非法獲取的信息與自身應用搜集到的信息非法關聯等行為[12]，法院一審判決兩被告構成不正當競爭，共同賠償原告微博公司經濟損失二百萬元及合理費用二十萬八千九百九十八元[13]；經過北京知識產權法院二審判決[14]，駁回上訴，維持原判。

微博訴脈脈案件，作為大數據領域糾紛的首案，對如何歸納和形成數據利用規則具有現實意義。身份數據，是指通過平台提供服務，由接受服務的用戶提交的信息所收集而成，或通過收集階段進行整合分析，通常每個用戶在註冊階段，依照各註冊欄位進行的填寫內容，如昵稱、姓名、性別、電子郵箱、聯繫方式、教育背景、職業背景等內容。平台通過欄位的性質進行劃分，目前針對數據整理和後續分析，通常的做法是形成各數據介面，通過數據介面進行數據分析利用，如OPEN API數據開放介面[15]。

其中微博訴脈脈案件的啟示主要在於幾個方面：

1、終審判決中指出「信息資源日益成為重要的生產要素和社會財富」，「在信息時代，數據信息資源已經成為重要的資源，是競爭力也是生產力更是促進經濟發展的重要動力」[16]。通過法院判決，確認了信息時代的數據包含一定的商業價值，是反不正當競爭法中應當保護的商業利益。

2、在判決書中強調第三方平台使用授權平台所收集的用戶數據的「三重授權原則」，即對於API平台在收集用戶數據應當經過用戶授權，API數據合作方之間的許可權應當經過平台授權，而在API中數據調取和使用平台在使用用戶數據中應當經過用戶的再次授權。

3、明確了網路平台作為信息提供方可以在用戶同意的前提下基於自身經營活動收集並進行商業性使用的用戶數據信息主張權利，這進一步認可了數據的重要作用，數據的獲取和使用，不僅能成為企業競爭優勢的來源，更是數字經濟中的重要的基本要素。

朱某在利用家中和單位的網路上網瀏覽相關網站過程中，發現利用「百度搜索引擎」搜索相關關鍵詞後，會在特定的網站上出現與關鍵詞有關的廣告。2013年5月6日，朱某將北京百度網訊科技有限公司（以下簡稱「百度網訊公司」）訴至南京市鼓樓區人民法院。朱某起訴稱，本人長期形成上網瀏覽網頁、看電影等網路生活習慣，百度網訊公司利用網路技術，未經朱某的知情和選擇，記錄和跟蹤了朱某所搜索的關鍵詞，將朱某的興趣愛好、生活學習工作特點等顯露在相關網站上，並利用記錄的關鍵詞，對朱某瀏覽的網頁進行廣告投放，侵害了朱某的隱私權，影響了正常的工作和生活。

一審法院經審理認為[17]，朱某的網路活動蹤跡屬於個人隱私的範圍，百度網訊公司利用cookie技術收集朱某信息，並在朱某不知情和不願意的情形下進行商業利用，侵犯了朱某的隱私權。為此，判決百度網訊公司於判決生效之日起十日內向朱某賠禮道歉（如百度網訊公司未按判決進行賠禮道歉，法院將通過相關媒體公告判決書的內容，由此產生的費用由百度網訊公司承擔）；百度網訊公司於判決生效之日起十日內賠償朱某公證費損失1000元；駁回朱某的其他訴訟請求[18]。

隨後百度公司提起上訴，在二審法院審理過程中，法院認為百度網訊公司在提供個性化推薦服務中利用的是未能與個人身份信息對應識別的數據信息，該數據化信息的匿名化特徵不符合「個人信息」的可識別性要求[19]。首先，百度網訊公司個性化推薦服務的終端是瀏覽器，並未定向識別瀏覽器的網路用戶身份，在事實上提供個性化推薦服務並無必要將搜索關鍵詞記錄和朱某的個人身份信息聯繫起來；其次，百度網訊公司利用網路技術向朱某使用的瀏覽器提供個性化服務不屬於《最高人民法院關於審理利用信息網路侵害人身權益民事糾紛案件適用法律若干問題的規定》第十二條規定的侵權行為；再次，百度網訊公司提供個性化推薦服務並未侵犯網路用戶的知情權和選擇權[20]。綜上，二審法院判決撤銷一審判決，並駁回一審原告朱某全部訴訟請求。

互聯網技術一方面給用戶帶來了便捷，但同時也需要考慮其中與個人隱私之間的邊界，朱某與百度網訊公司基於互聯網個性化推薦服務引發的糾紛為平台收集數據提供了實踐的參考。行為數據，通過對用戶在網站或應用程序的用戶行為，如使用或瀏覽方式進行收集整理分析，達到通過行為進行用戶畫像（personas）[21]的目的，而用戶畫像本身是基於一系列用戶數據，如用戶社會屬性、消費習慣、個人喜好等真實數據所形成的數據模型。對於用戶畫像的利用，最常見的方式是通過對於用戶的個人喜好和消費習慣形成不同類型的精準廣告推送，達到「千人千面」的效果，而通常主要的做法是通過cookie技術進行收集，其中不得以侵犯用戶安寧權和選擇權為前提，不得侵害用戶個人的隱私為紅線。

大眾點評網（www.dianping.com）的運營公司上海漢濤信息諮詢有限公司（以下簡稱漢濤公司）訴稱北京百度網訊科技有限公司（以下簡稱「百度網訊公司」）運營的「百度地圖」及「百度知道」大量複製了大眾點評網上的用戶點評等信息，給漢濤公司造成重大損失，構成不正當競爭，一審訴至上海市浦東新區人民法院，要求認定不正當競爭行為並賠償經濟損失9000萬元及其他合理費用453,470元[22]。

上海市浦東新區人民法院一審審理過程中，對於大眾點評網與「百度地圖」和「百度知道」提供的服務是否構成競爭關係，以及使用大眾點評網的信息是否導致流量減少，進而構成實質性競爭的損害，同時對Robots協議抓取大眾點評網的信息與不正當競爭之間的關係[23]進行了認定。經一審法院審理後，認定大眾點評網與「百度地圖」和「百度知道」提供的服務構成競爭關係，且通過「百度地圖」和「百度知道」與大眾點評網爭奪網路用戶，可以認定百度網訊公司與漢濤公司存在競爭關係，且通過技術手段，從大眾點評網等網站獲取點評信息，用於充實自己的「百度地圖」和「百度知道」。百度公司此種使用方式，實質替代大眾點評網向用戶提供信息，對漢濤公司造成損害。此外，百度網訊公司的搜索引擎抓取涉案信息並不違反Robots協議，但這並不意味著百度網訊公司可以任意使用上述信息，百度網訊公司應當本著誠實信用的原則和公認的商業道德，合理控制來源於其他網站信息的使用範圍和方式[24]。基於以上理由，一審法院判決百度網訊公司構成不正當競爭，承擔賠償漢濤公司經濟損失300萬元及為制止不正當競爭行為所支付的合理費用23萬元，駁回漢濤公司其他訴訟請求。

百度網訊公司在一審宣判後提起了上訴，訴至上海知識產權法院，二審法院經審理認定大眾點評網上用戶評論信息是經營者付出大量資源所獲取的，且具有很高的經濟價值，這些信息是漢濤公司的勞動成果。百度網訊公司未經漢濤公司的許可，在其「百度地圖」和「百度知道」產品中進行大量使用，這種行為本質上屬於「未經許可使用他人勞動成果」。同時提出當某一勞動成果不屬於法定權利時，對於未經許可使用或利用他人勞動成果的行為，不能當然地認定為構成反不正當競爭法意義上的「搭便車」和「不勞而獲」，這是因為「模仿自由」，以及使用或利用不受法定權利保護的信息是基本的公共政策，也是一切技術和商業模式創新的基礎。但是，隨著信息技術產業和互聯網產業的發展，尤其是在「大數據」時代的背景下，信息所具有的價值超越以往任何時期，愈來愈多的市場主體投入巨資收集、整理和挖掘信息，如果不加節制地允許市場主體任意地使用或利用他人通過巨大投入所獲取的信息，將不利於鼓勵商業投入、產業創新和誠實經營，最終損害健康的競爭機制[25]。經二審法院審理，駁回上訴，維持一審判決。

從大眾點評網訴百度網訊公司不正當競爭案，可以看出其區別與身份數據和行為數據，更多關於長時間積累的用戶評論（UGC）[26]所形成的內容數據信息。內容數據，這裡是指基於數據中的信息內容進行數據整理，如各種視頻、聲音、圖片、文字等，與受眾產生互動，從而得到了有價值的交互數據。通過對這些交互數據的篩選、挖掘、分析，得到有價值的數據，從而對後期內容的生產和發行形成指導和信息交易。而對於內容數據的應用，其中對於數據的長時間的積累和基於商業模式上對於必要的收集所進行的投入，是競爭和產業發展過程中的必經階段，因此通過技術利用他人勞動成果的行為，是屬於不正當的競爭行為。

三、數據商業化使用的規則

通過對於數據的性質的分析和實際中的案例，應當認識到數據作為數字經濟中的新的「生產資料」，應當充分考慮其特殊性，在使用數據的過程中，進行商業化利用應當充分考慮其特性。因為數據本身權屬的複雜性，目前司法實踐中對於數據之間的糾紛採取適用《反不正當競爭法》進行規制，這也導致對於數據的利用與維權之間通常都是利用個案解決，很難形成具有指引性和規範性，但同時貿然將數據納入某個權利體系中也很難形成普遍共識。

對於數據的商業化利用而言，商業主體在數據使用中的合規性判斷有時會先於法律而形成行業共識，在判斷使用用戶數據信息是否存在濫用和存在不正當競爭，應當考慮以下幾個維度：

數據收集和使用應當遵守現有商業秩序。市場經濟的效能競爭和商業模式的信息流通均以秩序為共同前提。由於數據價值的與日俱增，市場中有越來越多的主體參與到數據的商業化利用中，而目前數據保護體系尚未完善的情況下，通過反不正當競爭法進行規制只能是個案現象，且由於數據使用具有時效性、隱蔽性，對於通過訴訟手段進行維權的主體來說存在舉證責任和證明效力的多方困難，且考量技術進步和保護利益之間應當從全局進行考量。正當的商業目的和數據使用的出發點，應當是創新和發展而非是「搭便車」和「撿便宜」，鼓勵市場形成良性競爭機制。

市場經濟鼓勵的是效能競爭，通過商業模式的升級和創新來提高社會總成本，而非通過阻礙他人競爭，扭曲競爭秩序來提升自己的競爭能力[27]。如果經營者是完全攫取他人勞動成果，提供同質化的服務，單純通過技術抓取進而降低對於數據信息的積累的投入與時間成本，這種行為對於創新和促進市場競爭沒有任何積極意義，且從長遠來看必然導致積極投入進行數據信息積累的企業利益得不到保護進而侵害整個數據產業的利益，破壞產業生態的行為必然會傷害消費者和社會的整體利益。

《民法總則》將數據與虛擬財產置於「其他民事權利和利益」之後，對數據權屬的認定尚處於模糊階段。數據權益往往與知識產權、人格權、財產權、隱私權等密切相關，多重屬性決定了其需要多層次的規制，儘管權益尚未明確，但從實踐中對於數據應用的場景已經不斷創新和突破，對此應當如何考慮應當進行結構化分析，即符合現有權利體系保護內容的與尚未明確的商業權益可以並行不悖，且應當以不侵害個人權益為前提和紅線。

在大眾點評網與百度網訊案中，用戶數據信息的獲取付出了巨大的勞動，具有可獲得法律保護的權益，而百度公司的競爭行為亦具有一定的積極效果，在此情況下應當對兩者的利益進行一定平衡。如進行數據的利用本身商業化模式創新的必要條件，應當充分的考慮數據收集積累過程中的投入，並在商業利用過程中的方式加以必要的限制，如在使用數據信息的方式、展示形式等方面進一步明確並獲得相應的授權，這裡的授權不應當局限於數據的平台授權，如涉及著作權或個人信息等內容應當一併加以考慮。

針對於數據收集，基於互聯網的公開共享特性，非法的數據收集行為往往具有隱蔽性和維權難的特點。第三方藉由網路爬蟲等工具攫取他人勞動成果，在不經授權的情況下對平台數據進行非法抓取和利用，將阻礙他人進行正當的商業行為，破壞現有商業秩序，製造數據行業惡性競爭和交易亂象。此外，基於收集、處理和分析的數據，對於數據在商業利用上的許可，應當充分考慮平台的授權。企業可以在數據商用的過程中對數據進行加工，以剝離可能與其它權屬產生衝突的成分。例如在數據商業化利用中，對數據信息進行脫敏後產生的數據權益，可以有效規避如基於個人收集的數據在商業化利用對個人用戶造成的侵害和數據濫用。

「技術中立」是數據行業或新興產業發展過程中經常在競爭關係中為自身辯解的重要理由，但並不是任何技術本身都可以作為豁免法律責任的依據，例如搜索引擎中垂直搜索和現階段數據抓取中的爬蟲技術，其技術在應用層面的合理性以及商業模式是否構成不正當競爭並不因為技術或演算法沒有人為干預而豁免其應用層面可能存在的不正當行為。更有甚者，通過「技術」手段來進行如對合法商業環節的突破和破解，更是互聯網行業需要打擊的黑灰產業鏈。

技術作為一種工具手段在價值上具有中立性，但這並未意味著可以通過技術進而突破原有的商業模式來進行違背商業道德的惡性競爭，在信息技術大發展的今天，在商業模式上的「同理心」同樣重要，即技術提供者或使用方是否在應用技術之初就存在對侵害他人合理商業模式的主觀故意，對於技術在商業模式中的作用，是創新性的突破的「助手」，還是侵權和惡意競爭的「幫凶」，在於應用技術的主體，而不能僅僅以技術中立的名義突破競爭和商業的合理界限。

四、結語

對於數據商業利用的規則目前通常以個案的形式出現，尚缺乏明確有效的法律指引，但對於數據產業本身發展的創新性和多樣性，同時考慮到法律制定的嚴謹性、程序性和權威性，因此法律規範一般情況不可能發生朝令夕改的現象。法律不可能一次性規定出所有的數據信息保護的適用規則和侵權後的懲罰措施，而且就目前社會發展進程而言，一旦發生數據信息侵權現象，由於法律的相對滯後性，需要有強大的技術支持來進行數據刪除等相關數據維護工作。強調對於個人信息數據的保護，並非禁止合理使用個人數據，在《民法總則》第111條對自然人的個人信息進行規定後，後續的民法典編纂工作中必然會對個人信息進一步明確和規定。

數據作為數字經濟時代的重要資源，其商業利益與保護的範圍並不是一成不變，它會隨著社會的發展、技術的變革甚至個人授權的變更等因素而發生相應的變化，切勿僵硬地適用保護政策，也不要因為需要保護就矯枉過正。同時對於數據的使用，在考慮商業化使用的前提，必然需要考慮商業各方主體在數據生成中的作用，如對於基礎數據的加工，對於衍生數據或數據規則的利用（徵信服務），為此各方平台提供了大量的人工和物料的投入，同時為了維護平台或數據的有效運營提供了必要的物質條件，因此在對此類數據進行處理的情況下，需要考慮個人信息及隱私與商業數據開發之間的利益平衡，同時也要考慮信息流動與不正當競爭之間的邊界。

對於數據的使用，更多的應從商業化利用的基本使用規則角度來進行討論，即數據的利用更多的應當考慮其財產屬性和商業利用價值，但應當充分考慮數據自身特性及原有權利，並進行結構化區分對待。同時，考慮到後續維權的成本和便捷性，以及由於數據「價值密度低」所導致的個人基於數據進行維權的成本和收益差距過大，從民法層面設立數據環節中商業主體的權益劃分，充分發揮數據商業利用主體的積極性，進而有效維護數據產業的有序發展。

參考文獻

（請向下滑動）

[1]2015年10月29日，中國共產黨第十八屆中央委員會第五次全體會議通過《中共中央關於制定國民經濟和社會發展第十三個五年規劃的建議》，其中首次提出「實施國家大數據戰略，推進數據資源開放共享。完善電信普遍服務機制，開展網路提速降費行動，超前布局下一代互聯網。」

[2]我國針對《反不正當競爭法》進行過多次修訂。2017年8月28日，全國人大常委會審議修訂《反不正當競爭法》二審稿，9月初公布二審稿，11月4日修訂通過，規定於2018年1月1日起正式施行生效，其中對互聯網領域不正當競爭通常適用的第二條進行了修訂，並在第十二條增設了互聯網領域專門的不正當競爭條款。

[3]本文中數據，指通過互聯網收集的大數據，具有體量大、增長速度快、類別大、價值密度低的特點。

[4]參見維克托·邁爾·舍恩伯格、肯尼思·庫克耶：《大數據時代》，盛楊燕、周濤譯．浙江人民出版社2013年，第113頁。

[5]整體湧現性，系統科學把這種整體才具有、孤立部分及其總合不具有的性質稱為整體湧現性（whole Emergence）；湧現性就是組成成分按照系統結構方式相互作用、相互補充相互制約而激發出來，是一種組分之間的相干效應，即結構效應。參見（美）馮·貝塔朗菲著.一般系統論——基礎發展和應用[M].林康義等譯，清華大學出版社，1987年第51頁，轉引自魏巍、郭和平：關於系統「整體湧現性」的研究綜述，《系統科學學報》2010第1期。

[6]《中華人民共和國民法總則》第127條規定：法律對數據、網路虛擬財產的保護有規定的，依照其規定。

[7]Commission, "Proposal for a directive of the European Parliamentand of the Council on certain aspects concerning contracts for the supply ofdigital content" COM(2015) 634 final.

[8]Commission, "Proposal for a directive of the European Parliamentand of the Council on certain aspects concerning contracts for the supply ofdigital content" COM(2015) 634 final, art 3(1).

[9]Rafa? Mańko, "Contracts for Supply of Digital Content. A LegalAnalysis of the Commission"s Proposal for a New Directive" ,(EPRS 2016) 15.

，2017年10月5日訪問。

[10]對於數據的分類，這裡討論的是商業數據中與用戶有關的數據，該類數據可以依照性質不同進行劃分。此外在數據應用領域中還有一部分是基於公共信息收集的數據如天氣情況、地理信息等形成的數據，

這裡暫不進行討論。

[11]Facebook公司2017年第三季度財報顯示，截至2017年9月30日，Facebook的平均每日活躍用戶人數為11.8億人，比去年同期增長17%；騰訊公司2017年度第三季度財報顯示，微信和WeChat的合併月活躍賬戶數達到9.8億，比去年同期增長15.8% ，日發送的消息數約達380億條，同比增長25%，月活躍公眾號350萬個，而公眾號月活躍關注用戶數為7.97億，同比分別增長14%及19%；2017年度微博公司第三季度財報，截至9月底，微博平均日活躍用戶數較上年同期凈增約3300萬，達到1.65億；月活躍用戶較上年同期凈增約7900萬，增長至3.76億。

[12]一審起訴狀訴求內容還包括模仿微博「大V」形式，侵害微博經濟利益，構成不正當競爭，並且，脈脈以公告形式惡意抹黑微博，構成商業詆毀。

[13]參見北京微夢創科網路技術有限公司訴北京淘友天下技術有限公司、北京淘友天下科技發展有限公司不正當競爭案，（2015）海民（知）初字第12602號。

[14]參見北京淘友天下技術有限公司、北京淘友天下科技發展有限公司與北京微夢創科網路技術有限公司不正當競爭上訴案，（2016）京73民終588號。

[15]所謂（Open API）是服務型網站常見的一種應用，網站的服務商將自己的網站服務封裝成一系列API（Application Programming Interface應用編程介面）開放出去，供第三方開發者使用，這種行為就叫做開放網站的API，所開放的API就被稱作OpenAPI（開放API）。參見譚晨輝、劉青炎：「OpenAPI出現、起源與現狀」，《程序員》2008年第7期。

[16]參見北京淘友天下技術有限公司、北京淘友天下科技發展有限公司與北京微夢創科網路技術有限公司不正當競爭上訴案，（2016）京73民終588號。

[17]《最高人民法院關於審理利用信息網路侵害人身權益民事糾紛案件適用法律若干問題的規定》中第十二條第一款中規定：「網路用戶或者網路服務提供者利用網路公開自然人基因信息、病歷資料、健康檢查資料、犯罪記錄、家庭住址、私人活動等個人隱私和其他個人信息，造成他人損害，被侵權人請求其承擔侵權責任的，人民法院應予支持」，參見朱某訴百度網訊侵犯隱私權案，（2013）鼓民初字第3031號判決。

[18]參見朱某訴百度網訊侵犯隱私權案，（2013）鼓民初字第3031號判決。

[19]參見百度網訊與朱某侵犯隱私權上訴案，（2014）寧民終字第5028號。

[20]同注釋18。

[21]用戶畫像：是指建立在真實數據之上的目標用戶模型或用戶標籤化信息。在交互設計/產品設計領域，通常將用戶畫像界定為針對產品/服務目標群體真實特徵的勾勒，是一種勾畫目標客戶、聯繫客戶訴求與設計方向的有效工具。參見庫珀，《交互設計之路》，電子工業出版社，2006年第10頁；郝勝宇，陳靜仁，《大數據時代用戶畫像助力企業實現精準化營銷》，中國集體經濟2016( 4)。

[22](2015)浦民三(知)初字第528號中另一被告上海傑圖軟體技術有限公司，在一審判決中認定不構成共同侵權，因此未承擔責任。原告漢濤公司在訴求中同時提出消除影響的訴求，經一審法院審理未獲支持。

[23]大眾點評網訴百度網訊公司不正當競爭案中，大眾點評網未對百度進行Robots協議限制，但法院認定其中未進行Robots協議限制抓取，並不代表同意使用信息且不構成不正當競爭。參見(2015)浦民三(知)初字第528號。

[24](2015)浦民三(知)初字第528號中涉及漢濤公司關於百度網訊公司構成虛假宣傳的主張、使用「大眾點評」等標識構成擅自使用知名服務特有名稱的內容未予支持。

[25]參見北京百度網訊科技有限公司與上海漢濤信息諮詢有限公司等不正當競爭糾紛上訴案，（2016）滬73民終242號。

[26]「User-Generated Content」（UGC）是指「用戶生成內容」，除了比較常用的「UGC」以外,還有「User-Created Content(UCC）」、「ConsumerGenerated Media」等表達方式。UGC這個術語在2005年由網路出版和新媒體出版界最先提出。現在關於還沒有一個公認的定義,其中較有影響力的界定是由世界經濟合作與發展組織（OECD）在2007年的報告中提出的。該定義描述了的三個特性①Internet上公開可用的內容②此內容具有一定程度的創新性③非專業人員或權威人士創作。參見OECD. Participative Web and User-Created Content: Web 2.0, Wikis andSocial Networking.

http://www.oecd.org/document/40/0,3343,en_2649_34223_39428648_1_1_1_1,00.html，訪問時間2017年8月20日。

[27]在2017年8月的HiQ訴領英案（Case No. 17-cv-03301-EMC）中，HiQ公司在聯邦地區法院加利福尼亞北區申請初步禁令獲得支持，其中數據的利用方式是通過數據進行後台分析，且案件本身基於反壟斷層面加以考量，而非大眾點評網與百度網訊案中的前台重現與複製，且HiQ訴領英案中並未進行實體性判斷，僅對禁令的必要性進行了分析。

本文載於《網路信息法學研究》2018年第1期

感謝作者對本公眾號的授權

本文僅作學習交流之用