大秘密!國際警方利用社交平台上的音頻來破案
眾所周知,警方會通過網路上的文字信息來協助破案,比如之前雷鋒網就曾報道過,為了揪出色情黑產從業者,鵝廠會同警方合作,通過對一些 QQ 群名稱和簡介來進行識別。
放眼國外,無論是 Facebook 還是 Twitter,也都曾出於「反恐」的目的出台過對策,比如禁止有關「支持」恐怖組織和「讚美」恐怖主義組織領導人的言辭,或者「縱容」暴力恐怖行為的表達內容。
不過,這些更多的還是來自文字信息。你有沒有想過,可能你的音頻甚至是視頻等多媒體信息,也會成為被監控的目標?例如,機器可能會通過語音錄音與存儲在海量資料庫中的語音樣本進行匹配,來鎖定異常人群,即以聲識人。
我們都有過打客服電話的經歷,在接通人工客服後,會有一句「為保證服務質量,本次通話將會被錄音」的提示。
那在眾多的錄音素材中,如何能通過一些音頻標籤來識別出關鍵信息?一家名為「Verint」的以色列的公司,正是瞅准了音頻識別和監控的生意,從商業通話錄音識別起家,慢慢將觸角延伸到警務領域,這意味著,普通人的聲音信息未來也可能處於被監控的範圍。
雷鋒網發現,這家以色列公司也在。。。天chao(你懂的)。。。也開展業務。
最近,Verint與來自奧地利、瑞士、荷蘭、英國等非盈利研究組織,公開了他們的揚聲器識別集成項目平台(SIIP),並發表了一篇極具爭議性的論文↓↓↓
參與這篇論文的研究者來源龐雜,除了Verint,還有 SingularLogic 和 Nuance 等商業公司,並聯合了一些非盈利性的研究機構做關鍵字識別研究和倫理道德道德的研究,更為重要的是,論文中還徵集了多個執法機構的意見,包括國際刑警組織、義大利警察局、英國大都會警察局、德國聯邦刑事調查局和葡萄牙刑事警察局。
換句話說,這不單單只是一個簡單的研究或者小範圍的試驗,未來SIIP平台可能被多個國家的警務系統大規模使用。
根據論文中的介紹,SIIP(揚聲器識別集成項目)是運行在大型語音樣本資料庫上的揚聲器識別(SID)解決方案,它將採用幾種語音分析演算法,按性別、年齡、語言和口音來過濾語音樣本,通過將來自電話通話或社交媒體帖子的語音樣本,與存儲在諸執法機構共享的海量資料庫中的犯罪分子的語音錄音相匹配,來找出嫌疑人。
論文指出,未來它將由國際刑警組織在法國里昂的總部加以管理,目的是提高語音數據的準確性,並提高語音數據的可靠性和司法上的可採信性。
推特、臉書、領英等平台的聲音信息都可能作為採集來源究竟哪些平台上的音頻信息會被收錄?
答案是:任何「合法截獲」的聲音!比如果手機、固定電話的通話信息、網路語音信息,或者社交媒體中公開發布的音頻(比如招聘、宣傳信息),預期用途是將從電話通話和社交媒體收集的聲音與「黑名單」資料庫相匹配來找出異常人員。
可以說,來源非常廣泛,尤其是看到這份論文中公布的社交媒體上的名單,雷鋒網編輯不由得虎軀一震~
文中指出,目前 SIIP 可以匹配來自各大社交媒體平台的語音樣本,包括Twitter、Google+、LinkedIn、YouTube 和 Facebook,基本涵蓋了大多數人的生活圈。
其實,匹配多個平台還不是最大的難點所在,真正的難點在於構建這種系統所需安裝的諸多工具,比如過濾背景噪音,提高語音清晰度,隔離聲音,以及為警察總部和外勤的應用輕鬆共享、收集和分類數據的各種小工具。
這樣做的目的,是能夠將新的語音錄音與龐大的聲音樣本資料庫進行匹配。未來,該資料庫將由國際刑警組織來管理,來自192個國家的這些執法機構可以訪問該系統。
除了數據更為豐富,由於社交媒體平台所提供的信息更為多元,平台還會通過基於語言相關性和地理位置等搜索標準對多媒體內容進行梳理,該系統將標記和處理這些材料,並在資料庫中找到類似的片段。
也就是說,原來警察更多的是從文字信息中搜集可疑內容,但現在,不僅新增了視頻和音頻的識別,還會結合地理位置等信息做更加精準的判斷。
安全監控PK個人隱私恩仇錄為了安全的監控和保護個人隱私本就是一對矛盾體。
以美國為例,自1997年2月,聯邦調查局開發了能夠對網路通訊進行監控的軟體系統「雜食者」(Omnivore)軟體,但其很容易截獲法院令狀之外的其他通訊信息,以致對公民的隱私和通訊自由構成巨大威脅,之後,其升級版「肉食者」也因為嚴重威脅公民隱私權而一直飽受社會各界的批評,甚至停用。
然而,2001年9月發生的「9·11事件」使情況發生了巨大的轉變。「9·11事件」使美國民眾對恐怖事件的憂慮上升到一個前所未有的高度,相應地,其對政府權力的擴張表現出異乎尋常的寬容。藉助這一契機,美國政府開始大肆發展各種監聽和監控項目。
這種寬鬆的態度也讓隱私信息的保護髮生了嚴重的問題,最終爆發了眾所周知的「稜鏡門」事件。
但這也並未阻止監控軟體越來越強大的功能,近年來,從美國的聯邦調查局(FBI)、中央情報局(CIA)到國家安全局(NSA),一直在開發和更新能夠對網路通訊進行監控的軟體系統。
在今天所討論的論文中,有一組國際刑警組織所列出的數據:在對69個國家的91個警察部門作了一項調查後,我們發現,一半以上的警察部門已經在使用某種類型的自動語音識別系統。
未來,如何平衡辦案效率和保護個人隱私的問題,也將一直是擺在各類監控軟體面前的問題。
參考來源:
《Towards a breakthrough Speaker Identification approsch for Law Enforcement Afencies:SIIP》
《計算機網路犯罪對刑事訴訟的挑戰與制度應對》
雲頭條
※網路安全公司華順信安完成新一輪融資,丹華資本領投
※酷派起訴小米;美國廢除網路中立;華為推比特幣錢包丨雷鋒早報
TAG:雷鋒網 |