蘋果收購Lattice Data,挖掘黑數據的數字石油價值
選自TechCrunch
作者:Ingrid Lunden
機器之心編譯
參與:微胖
據媒體報道,蘋果最近又收購了一家人工智慧創業公司,以增強公司在人工智慧領域的競爭實力。
這次進入蘋果法眼的是 Lattice Data,一家致力於讓推論引擎擁有將非結構化數據(俗稱黑數據)結構化(可以直接加以處理和分析的數據)能力的創業公司。據消息源稱,蘋果這次給出的價碼約為 2 億美元。
據悉,這次交易是幾個禮拜前結束的,大約有 20 名工程師加入了蘋果。對這一消息,蘋果官方表示,「每一次收購小型技術公司,我們通常不討論收購目的或意圖。」
自去年起,Lattice 就低調地從 GV、Madrona 以及 InQTel 那裡籌集了 2 千萬美元。2015 年,公司成立,低調但來路不凡。Christopher Ré, Michael Cafarella, Raphael Hoffmann 和 Feng Niu 想實現 DeepDive 的商業價值,因此成立了 Lattice,這個在斯坦福大學誕生的系統旨在「從黑數據中提取價值。」
Re 是斯坦福大學教授,曾因在 DeepDive 方面的傑出工作獲得麥克阿瑟天才獎,現在是這家創業公司的首席科學家。Cafarella 一開始是 Lattice 的首席執行官,現在是公司的 CTO,他是密歇根大學教授,也是 Hadoop 的共同創造者之一。Niu 是公司的首席工程官(chief engineering officer)。Carefella 和 Hoffmann(根據他的 LinkedIn,今年 4 月份已經加入谷歌)也從事過 DeepDive 的研發。
公司現在的 CEO 是 Andy Jacques,去年加入公司,是一位經驗豐富的企業管理人員。
什麼是黑數據?
我們這個互聯的數字世界每天都以加速度生產著數據。智能手機和互聯網催生了海量數據,不僅無處不在,而且價值大幅提升。無論是跑步、看電視還是堵在車流中慢慢前行,幾乎所有的活動都會留下數字足跡——從而貢獻更多的原始數據以供分析。隨著手錶和汽車等更多設備接入互聯網,數據量只會有增無減:有的人估計,無人駕駛汽車每秒將會產生 100GB 的數據。
2013 年數據量大 4.4 澤位元組,2020 年會增長到 44 澤位元組,IBM 預測現有數據中的 90% 都是去年兩年中產生的。在一個世紀前,最稀缺和最具價值的商品是石油,那麼現在,引發巨頭們爭相搶奪的變成了數據,也就是數字時代的石油。
可是,數字石油中,70-80% 數據都非結構化數據,不能直接用來分析和處理。Lattice 利用機器學習讓非結構化數據結構化,更加可用。你可以想像一下,就是將沒有標籤的數據分類、語境化處理,不過只有合理組織化這些數據,才能挖掘出數據內在價值。
這種系統的應用價值很多樣:可被用於國際刑警犯罪調查,比如發現拐賣人口;醫療研究;有助於組織和解析古生物學研究等。還可以通過創造更多有用的數據,幫助訓練人工智慧系統。
不過,仍不清楚的是這家公司已經與哪些公司合作過,蘋果會如何使用這種技術。據媒體猜測,應該上演過一場「宮斗戲」,因為據悉 Lattice 已經「在與其他科技公司溝通過,看看如何能利用這種技術改善公司的人工助理,」其中包括亞馬遜的 Alexa 和三星的 Bixby,據悉,公司近期也在韓國待過一段時間。
※微軟論文概述神經信息檢索技術:如何將神經網路用於信息檢索?
※初學TF機器學習:如何實現線性回歸?(附練習題)
※Jürgen Schmidhuber 的人工智慧暢想曲
※機器之心大會日程:44位嘉賓+32場演講,開啟機器智能之旅
TAG:機器之心 |
※Google收購Cask Data,進一步強化大數據分析能力
※TalkingData:曝光iPhoneX真實在用量數據
※Illumina收購Edico Genome,加速基因組數據分析
※Veritas收購雲數據管理公司fluid Operations AG
※talmo-design-cables數據線品牌與包裝設計
※黑客出售黎巴嫩間諜軟體DarkCaracal,竊取全球Android手機、WindowsPC數據
※數據挖掘平台Discover解鎖Tensorflow
※Facebook拉谷歌Twitter下水:它們也收集用戶數據
※蘋果USB-C to Lightning數據線悄然降價
※MDT量數迎來首個入駐數據買家Mobile Action,Telegram社群突破3萬
※客戶數據爭奪戰打響,Salesforce 65億美元收購Mulesoft為哪般?
※Dominik Schiener談數據的價值和未來的數據處理方式
※數據挖掘之三——Logistic回歸&LMT
※Slice數據:HomePod音箱45%的購買者為iPhone X用戶
※「Python」Chapter1 變數和簡單數據類型
※TeleRAT:一種利用 Telegram 秘密竊取數據的新型 Android 木馬
※Twitter 開源數據分析工具——tinfoleak
※IDC數據:蘋果領先Fitbit,Apple Watch銷量位居全球榜首
※Salesforce數據現在可以導入到Google Analytics 360中了
※Spring Boot與Kotlin使用Spring-data-jpa簡化數據訪問層