當前位置:
首頁 > 科技 > 這口大鍋運維背定了!因資料庫配置不當美國2億選民數據泄漏

這口大鍋運維背定了!因資料庫配置不當美國2億選民數據泄漏

網路安全公司UpGuard的網路風險團隊現在可以證實,在已知同類中最嚴重的數據泄密事件中,一個配置不當的資料庫被一家公司泄露在互聯網上,這家公司為共和黨全國委員會(RNC)工作,當初努力選舉唐納德·特朗普為美國總統。該資料庫含有超過1.98億美國選民的敏感個人資料。這些數據存儲在共和黨數據公司Deep Root Analytics(DRA)擁有的一台可公開訪問的雲伺服器上,數據包括DRA和至少另外兩家共和黨承包商TargetPoint諮詢公司和Data Trust整理的完全沒有採取保護措施的1.1TB信息。總共泄露了可能幾乎所有美國2億註冊選民的個人信息,包括選民的姓名、出生日期、家庭住址、電話號碼和詳細的註冊信息,還包括被稱為是「典型」的選民種族和宗教的數據。

由於受影響的個人數量眾多,這起泄露事件讓以前的墨西哥(同樣由我們發現)和菲律賓的選舉數據泄密事件相形見絀,全美總人口61%以上的個人信息因此泄露。

這起數據泄密讓世人得以深入了解共和黨全國委員會為2016年總統大選投入了1億美元的數據運作的內部情況,這是繼2012年米特·羅姆尼(Mitt Romney)競選失敗之後發起的一項大範圍的工作。RNC聘請了多家公司,作為特朗普競選班子的2016年大選數據團隊的核心,其中包括Deep Root Analytics、TargetPoint和Data Trust(它們都是共和黨數據公司),共和黨依賴它們來影響潛在選民,並準確預測選民行為。RNC數據存儲庫最終獲得了約95億個數據點(這些數據點涉及每五個美國人中的三個),針對48個不同類別,使用先進演算法建模技術,根據1.98億美國潛在選民可能存在的政治偏好,對他們進行評分。

含有所有這些數據的電子表格(上一次更新是在2017年1月總統就職典禮前後)是個數據寶藏,裡面有特朗普競選班子使用的政治數據和典型偏好。這些數據在配置不當的資料庫中同樣暴露無遺,沒人知道暴露了多久。

UpGuard的發現也許是歷史上已知最嚴重的選民信息泄露事件,得到了技術證據以及相關責任公司和政治幕僚發表的公開聲明的共同證實。

發現

6月12日傍晚,UpGuard的網路風險分析師克里斯·維克里(Chris Vickery)在替網路風險團隊查找配置不當的數據源時,發現了一個敞開無阻的雲存儲庫。網路風險團隊是UpGuard的一個研究部門,專門負責尋找和保護此類漏洞,並增強公眾的安全意識。這個數據存儲庫是亞馬遜網路服務(AWS)S3存儲桶(S3 bucket),居然沒有防範隨意訪問的任何機制。正因為如此,凡是能上網的都能訪問為唐納德·特朗普成功競選總統立下汗馬功勞的共和黨數據,只要訪問六個字元長的馬遜亞子域:「dra-dw」。

只要檢查內容,就發現「dra-dw」代表「Deep Root Analytics數據倉庫」。「數據倉庫」這個概念在現代企業中很常見――實際上它就是一個龐大的數據集,這些數據是專門為複雜分析而準備的。Deep Root Analytics證實了自己擁有並運行這個dra-dw存儲桶,隨後在維克里通知聯邦當局不久後的6月14日晚,存儲桶採取了保護措施,公眾已無法訪問。

數據倉庫裡面共有1.1 TB的數據完全可以下載,這大致相當於500個小時的視頻。這些文件清楚地表明了該存儲庫在政治上的重要性,文件目錄以許多頗有權勢、頗具影響力的共和黨政治組織命名。正因為如此,泄露的Deep Root Analytics數據倉庫含有大量完全可訪問的數據。

這還不是全部數據。另外24 TB的數據存儲在該數據倉庫中,但已經過配置、防止公眾訪問。最終,該配置不當的資料庫中存儲的數據量大致相當於100億頁文本。

不太清楚的是引人入勝但無法訪問的文件有多重要,比如一個標為「for_strategy_xroads_updated_FINAL」的文件,該文件在一定程度上可能指「美國十字路口」(American Crossroads),這是由前喬治·W·布希顧問卡爾·羅夫(Karl Rove)共同創辦的超級政治行動委員會(PAC),2016年總統選舉籌資期間非常活躍。另外還發現了大量緩存的Reddit帖子(保存為文本格式):

維克里最終花了幾天(從6月12日到6月14日)才下載完1.1 TB的這些可公開訪問的文件,包括兩個名為「data_trust」和「target_point」的關鍵目錄。

行動

Deep Root Analytics是創建並維護這個泄露數據倉庫的共和黨數據公司,2013年由亞歷克斯·朗德里(Alex Lundry)與他人共同創辦,朗德里是名共和黨競選數據科學家,曾在米特·羅姆尼失利的2012年總統競選活動中擔任數據總監。該公司自稱是「共和黨政壇中最有經驗的精準定位者」,為力求覆蓋目標群體的眾多公司、遊說團體以及共和黨政治競選班子提供媒體分析服務。Deep Root聲稱能夠通過使用大數據分析工具實現「精準定位」(microtargeting),因而能夠更有效地覆蓋這些預期的群體,從而讓客戶在購買廣告時得以做出更明智的決策。

這種出身背景讓朗德里得以成為2016年前佛羅里達州州長傑布·布希(Jeb Bush)的共和黨總統競選班子的「首席分析官」。這邊廂,布希即使在拉起一支資深的數據團隊後還是未能獲得提名;那邊廂,特朗普的境況截然相反,他沒有在競選班子內部設立一支強大的數據團隊,卻獲得了提名。RNC迅速將其數據團隊的工作與特朗普競選班子的工作協調起來,共同對付大選對手:希拉里·柯林頓。

為了贏得選舉,RNC需要大量運用幾家專門從事數據分析的私人公司的資源。這些私人諮詢公司當中就有Data Trust,總部位於華盛頓的這家公司聲稱「通過收集、開發和完善選民檔案,不斷地開發共和黨及保守黨數據生態系統。」

作為「共和黨的獨家數據提供商」,Data Trust由RNC於2011年創辦,「承擔構建和管理共和黨選民檔案的成本」――這個存儲庫含有詳細的選民信息,這些信息對任何成功的選舉廣告和動員投票工作而言至關重要。據Slate報道,Data Trust作為RNC的私營附屬企業來運作――「這是一家由政黨首腦創辦,但無法正式運營的混合型私人公司。」

在Deep Root Analytics資料庫中,「data_trust」文件夾似乎正好包含這個RNC/ Data Trust合作項目的全部成果,這個全面而詳細的資料庫含有2016年潛在選民的信息。

「data_trust」裡面有兩個龐大的個人信息庫,總共代表1.98億潛在選民。每個信息庫主要包括兩個文件存儲庫,一個是2008年總統大選的256 GB文件夾,另一個是2012年總統大選的233 GB文件夾,每個文件夾又有51個文件(每個州一個文件,加上哥倫比亞特區)。每個文件的格式是逗號分隔的值(.csv)文件,列出了內部的32個字元長的字母數字「RNC ID」,用來識別資料庫中每個潛在選民的獨特身份,比如530C2598-6EF4-4A56-9A7X-2FCA466FX2E2。這些RNC ID以獨特的方式將不同的數據集連接起來,結合了眾多敏感的個人身份數據點,因而可以獲得關於每個美國選民的大量詳細信息。

維克里查看了這些電子表格後,確認這些文件含有準確、敏感的個人信息。下面列出了.csv類別:

"RNCID", "RNC_RegID", "State", "SOURCEID",

"Juriscode", "Jurisname", "CountyFIPS", "MCD",

"CNTY", "Town", "Ward", "Precinct", "Ballotbox",

"PrecinctName", "CD_Current", "CD_NextElection",

"SD_Current", "SDProper_Current",

"SD_NextElection", "SDProper_NextElection",

"LD_Current", "LDS_Current",

"LDProper_Current", "LD_NextElection",

"LDS_NextElection", "LDProper_NextElection",

"NamePrefix", "FirstName", "MiddleName",

"LastName", "NameSuffix", "Sex", "BirthYear",

"BirthMonth", "BirthDay", "OfficialParty",

"StateCalcParty", "RNCCalcParty", "StateVoterID",

"JurisdictionVoterID", "AffidavitID", "LegacyID",

"LastActiveDate", "RegistrationDate",

"VoterStatus", "PermAbs",

"SelfReportedDemographic", "ModeledEthnicity",

"ModeledReligion", "ModeledEthnicGroup",

"HHSEQ", "HTSEQ", "RegistrationAddr1",

"RegistrationAddr2", "RegHouseNum",

"RegHouseSfx", "RegStPrefix", "RegStName",

"RegStType", "RegstPost", "RegUnitType",

"RegUnitNumber", "RegCity", "RegSta", "RegZip5",

"RegZip4", "RegLatitude", "RegLongitude",

"RegGeocodeLevel", "RADR_LastCleanse",

"RADR_LastGeoCode", "RADR_LastCOA",

"ChangeOfAddress", "COADate", "COAType",

"MailingAddr1", "MailingAddr2", "MailHouseNum",

"MailHouseSfx", "MailStPrefix", "MailStName",

"MailStType", "MailStPost", "MailUnitType",

"MailUnitNumber", "MailCity", "MailSta",

"MailZip5", "MailZip4", "MailSortCodeRoute",

"MailDeliveryPt", "MailDeliveryPtChkDigit",

"MailLineOfTravel", "MailLineOfTravelOrder",

"MailDPVStatus", "MADR_LastCleanse",

"MADR_LastCOA", "AreaCode", "TelephoneNUm",

"TelSourceCode", "TelMatchLevel", "TelReliability",

"FTC_DoNotCall", "PhoneAppendDate", "VH12G",

"VH12P", "VH12PP", "VH11G", "VH11P", "VH10G",

"VH10P", "VH09G", "VH09P", "VH08G", "VH08P",

"VH08PP", "VH07G", "VH07P", "VH06G", "VH06P",

"VH05G", "VH05P", "VH04G", "VH04P", "VH04PP",

"VH03G", "VH03P", "VH02G", "VH02P",

"MT10_Party", "MT10_GenericBallot",

"MT10_Turnout", "MT10_ObamaDisapproval",

"MT10_Jobs", "MT10_Healthcare", "MT10_SoCo",

"PG01", "PG02", "PG03", "PG04", "PG05", "PG06",

"PG07", "PG08", "PG09", "PG10", "PG11", "PG12",

"PG13", "PG14", "PG15", "PG16", "PG17", "PG18",

"PG19", "PG20", "PG21", "PG22", "PG23", "PG24",

"PG25", "PG26", "PG27", "PG28", "PG29", "PG30",

"PG31", "PG32", "PG33", "PG34", "PG35", "PG36",

"PG37", "PG38", "PG39"

從潛在選民的姓和名開始,文件列出了多得多的數據,包括選民的出生日期、家庭地址及郵寄地址、電話號碼,註冊黨派、自報的種族概況、選民註冊狀態,甚至他們是否在聯邦政府的「別打電話」名單上。另外包括的數據欄位有潛在選民的「典型種族」和「典型宗教」――尤其是敏感的個人數據,這些歷來在收集數據方面頗有爭議性。

雖然不是每個人的每個欄位都填有信息,但如果答案是已知的,似乎已包括在內。資料庫中還包括2016年選舉的那個較小的資料庫,但與2008年和2012年的文件夾不同,它僅包含俄亥俄州和佛羅里達州的.csv文件――這兩個大概是爭奪選民的最重要的州。有必要重申的是,可訪問資料庫URL的任何人都能將整個「data_trust」文件夾全部下載下來。

多年來,RNC致力於建立一套世界一流的數據運作系統,它結合使用Deep Root Analytics及其他數據公司,就像奧巴馬的數據團隊當初為民主黨所做的那樣,Ad Age在大選後深入分析了RNC數據運作:

「在這種情況下,負責大部分數據建模和選民評分工作的人(尤其是一線作業、選民聯絡和電視廣告)來自RNC僱用的三家數據公司:TargetPoint Consulting、Causeway Solutions和Deep Root Analytics,後者通過一家名為Needle Drop的新子公司與RNC正式合作。」

Ad Age還報道,RNC支付給資料庫中提到的那兩家公司的總額超過了500萬美元:

據聯邦選舉委員會報告,從2015年1月至2016年11月,RNC向TargetPoint支付了420萬美元的數據服務費,在此期間向Causeway支付了約50萬美元。RNC向充當Needle Drop的Deep Root支付了983000美元。

Needle Drop的委託人TargetPoint Consulting(2005年至2015年,Deep Root Analytics的創始人亞歷克斯·朗德里出任該公司的「首席數據科學家」)在資料庫中被一個名為「target_point」的文件夾所提到。TargetPoint是一家總部位於弗吉尼亞州亞歷山德里亞的「提供全面服務的市場研究和知識管理公司」,專門代表企業客戶和政治客戶精準定位重要群體――他們聲稱「在喬治·W·布希總統將我們的服務用於其成功的2004年競選活動」後率先採用了這一手段。

TargetPoint是保守政治界一家數據運作方面備受信賴、聲譽卓著的權威機構,過去曾參與過魯迪?朱利亞尼(Rudy Giuliani)的2008年總統競選、2008年麥凱恩/佩林競選以及共和党參院全國委員會的連任工作。TargetPoint創始人亞歷山大·蓋奇(Alexander Gage)以前是民意調查和市場研究員。

雖然TargetPoint等數據公司存儲最敏感的個人信息比較好,但是對於1 .98億美國人來說,情況可能不一樣,因為他們敏感的身份信息和潛在的政治傾向都存放在一檯面向公眾的、沒有任何安全屏障的雲伺服器上。

「target_point」文件夾的內容比Data Trust存儲庫的內容還要礙眼:14個文件以Alteryx資料庫格式(.yxdb)來保存,這種文件格式是專門為大規模的數據分析設計的。大多數文件上一次更新是在2017年1月中下旬,有幾個文件被標為「Contact File」,不同的日期表明了更新時間。

這些「Contact File」電子表格裡面包含的是1.98億美國潛在選民的上述32位字元長的字母數字RNC ID,以及選民的相應姓名和地址。所有1.98億人的每個RNC ID與姓名和個人身份信息存在著明確的聯繫,這確保使用RNC ID作為標識符的所有數據都可以回溯該人的真實姓名。

剩餘文件讓人們得以窺視使用1.98億潛在選民的龐大資料庫來執行的一項系統性的大規模分析行動,結合個人資料、背景和政治行為,用蓋奇的話來說,「從而揭示政治DNA」。結果是一個範圍和規模都空前龐大的資料庫,收集了該國大多數人典型的個人和政治偏好,最終形成了一個未採取保護措施、人人可以從網上下載的政治數據寶藏。

文件日期和名稱表明,其他文件主要涉及在2017年1月20日特朗普就職典禮之前進行的選舉後數據分析。其中一些文件與RNC和TargetPoint官員就競選活動期間執行的那種針對性分析發表的公開聲明相一致。比如說,一個名為「DRA Post Elect 2016 Reluctant DJT scores 1-6-17.yxdb」的文件含有6900萬行數據,這表明了共和黨數據團隊執行的那種選舉後分析。這番分析是RNC數據團隊成果的可能性得到了公開披露信息的證實。

在一個名為「DRA Post elect 2016 All Scores 1-12-17.yxdb」的50 GB大小的文件中,每個潛在選民用46列數據0到1之間的十進位分數來評分。這46列每一列下面的每個欄位表示潛在選民支持政策、政治候選人或信念的可能性,0表示不太可能,1表示很有可能。

RNC_RegID, State, 2012ObamaVoter_DRA_12_16,

2012RomneyVoter_DRA_12_16,

2016ClintonVoter_DRA_12_16,

2016TrumpVoter_DRA_12_16,

AmericaFirstForeignPolicy_agree_DRA_12_16

AmericaFirstForeignPolicy_disagree_DRA_12_16

AutoCompaniesShipJobsOverseas_agree_DRA_12_16

AutoCompaniesShipJobsOverseas_disagree_DRA_12_16

CorpReputs_AmericanMakers_DRA_12_16,

CorpReputs_DailyLives_DRA_12_16,

CorpReputs_Egalitarians_DRA_12_16,

CorpReputs_EnviroConscious_DRA_12_16,

CorpReputs_OpportunitySeekers_DRA_12_16,

CorpReputs_STEMSupporters_DRA_12_16,

CorpReputs_SupplyChainers_DRA_12_16,

CorpReputs_Unifers_DRA_12_16,

DemLeadersStandUpToTrump_DRA_12_16,

DemLeadersWorkWithTrump_DRA_12_16,

DParty_DRA_12_16,

FinancialServicesHarmful_agree_DRA_12_16

FinancialServicesHarmful_disagree_DRA_12_16

FinServicesCompany_Dreamers_DRA_12_16

FinServicesCompany_RiskMitigators_DRA_12_16

FossilFuelsImportantForUSEnergySecurity_DRA_12_16

FossilFuelsNeedToMoveAwayFrom_DRA_12_16,

InvestInfrastructure_agree_DRA_12_16,

InvestInfrastructure_disagree_DRA_12_16,

LowerTaxes_agree_DRA_12_16,

LowerTaxes_disagree_DRA_12_16,

NonReluctantDJTVoter_DRA_12_16,

NonReluctantHRCVoter_DRA_12_16,

PharmaCompsDoGreatDamage_agree_DRA_12_16,

PharmaCompsDoGreatDamage_disagree_DRA_12_16,

ReformGovtRegulations_agree_DRA_12_16,

ReformGovtRegulations_disagree_DRA_12_16,

ReluctantDJT_Above.5_DRA_12_16,

ReluctantHRCVoter_DRA_12_16,

RepealObamacare_agree_DRA_12_16,

RepealObamacare_disagree_DRA_12_16

RParty_DRA_12_16,

StopIllegalImmigration_agree_DRA_12_16,

StopIllegalImmigration_disagree_DRA_12_16,

TrumpStandUpToDems_DRA_12_16,

TrumpWorkWithDems_DRA_12_16,

USAFinancialSituation_Optimistic_DRA_12_16,

USAFinancialSituation_Pessimistic_DRA_12_16

該電子表格出色地運用了強大的分析功能。然而,雖然每個潛在選民以32個字元的RNC內部ID來表示,但確定與典型的政策偏好有關的真實姓名卻是只需一步的過程,因為同樣在資料庫中泄露的上述「Contact File」將RNC ID與潛在選民的實際身份關聯起來。

影響

這起泄密事件發生後,美國人對最寶貴信息期望獲得的隱私性和安全性打上了大大的問號。當下,美國選舉過程的完整性受到了對政府選民資料庫的一系列網路攻擊的考驗,讓人擔心:網路風險可能會對我們最重要的民主和政府機構構成威脅。

雲頭條、未經授權謝絕轉載

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雲頭條 的精彩文章:

Stack Clash安全漏洞將Linux及其他UNIX操作系統的root訪問權拱手交給任何人!
主機託管服務商受到Linux勒索軟體攻擊後,乖乖支付100萬贖金!
你的工作何時將被機器接管?
前聯通國際總經理左風加入高升控股任常務副總經理

TAG:雲頭條 |

您可能感興趣

分鍋!火箭無緣總決賽這三口鍋他們背定了!
美國和庫爾德聯合耍套路,殺俄飛行員這口黑鍋,土耳其背定了
土耳其攤上事了!這個「黑鍋」是背定了
熊孩子作業寫不完,這個黑鍋狗子背定了!
日本說亞洲素質最差的是韓國,這次韓國背定這鍋了
這鍋貌似朗逸PLUS背定了!上汽大眾全新帕薩特還是玩不過邁騰?
日本說韓國才是亞洲素質最差的國家,這次韓國背定了這個鍋
LOL資深輔助分享心得,如果這些都做不到,這個鍋你是背定了!
火箭輸球揪出最大罪人,不是哈登保羅,更不是卡佩拉,而是他,這個鍋他背定了!
這鍋皇馬背定了!送走主帥卻迎14年功勛,西班牙隊這回真的危險了
聯盟下一個20年就這麼毀了?耐克這鍋背定了!喬治也要小心
川普這鍋背定了!蘋果正式發布iPhone 8紅色特別版卻遭果粉抵制!
西班牙換帥鬧劇是兩敗俱傷 皇馬這個鍋背定了
迪麗熱巴新劇造型驚現楊冪同款大腦門,這鍋張叔平背定了
遠可防彈,近能掄人,可做防狼神器,這口鍋我背定了!
首次主場丟5球!恆大這鍋後防背定了 網紅成第一責任人
首次主場丟5球!恆大這鍋後防背定了 網紅成第一責任人
司馬光砸缸救出的那個孩子,後來怎麼「消失」了,這個鍋元朝你背定了
主人蹬了一腳白貓,狸花貓一臉惶恐,看來這個鍋我背定了啊
一天屠殺6萬人!這個絞肉機的鍋你背定了——馬克沁重機槍