科普:深扒——這幾年很火的「大數據」
上一期我們分析了一下人工智慧如今的發展現狀,其中提到了一個問題:人工智慧想要發展必須要依靠大數據的支撐,但是很多人對於這個「大數據」不是很了解,今天我們就一起來扒一扒這個「大數據」到底是個什麼東西。
原理
不知道大家是否還記得我們以前推的一期「聊一聊GDPR及數據隱私的問題」這裡面說到的廠商收集我們隱私的行為就是為「大數據」服務的,有興趣的朋友們可以點開看一下。
大數據並不是單單指一堆冷冰冰的數字信息,而是一整套完備的體系。是通過對數據進行收集、存儲、分析、處理從而變現的過程。它的意義不在於掌握龐大的數據信息,而是有意義地進行數據的專業化處理,換句話說就是通過「加工」實現數據的增值。由於處理的數據過於龐大,所以計算任務通常要用到我們常說的「雲計算」來完成。(雲計算:在處理收集而來的這些數據時,因為數據過於龐大,單個計算機無法負擔完成計算任務,從而通過雲技術來把計算任務分擔出去,雲計算是當下非常火的一種資源合理利用的方法)
在我們這個網路時代,網上每時每刻所產生的信息都是海量的,這麼多的信息在科技公司眼裡那可都是一本萬利的買賣!這些數據只要一經轉化其價值必然會蹭蹭往上漲,到那時他們就再也不用操心那每年都在虧空的財務報表了……
虐哭柯潔的阿爾法狗就是通過大數據的支持加上機器學習完成的,也算是人工智慧的一種應用。我們都知道一個圍棋棋盤橫豎19條線,361個交叉點,合法的局面多達10的170次方還得乘2,要想下好圍棋必須得會算,而阿爾法狗牛逼之處就在於「算」這一方面。
理論上來說我們只要把圍棋的這10的170次方還得乘2的合法局面一股腦的全記住,那麼我們在下圍棋時必然會是無往不利的。想一想,我才下了一個子,你丫就已經把如何虐我的一千種方法想好了,那我還能有的玩兒嗎?而阿爾法狗就做到了這一點。
簡單解釋一下:這10的170次方還得乘2的合法局面就是一種「數據」,而阿爾法狗通過「機器學習」的方法對於這些數據進行學習(導入)和存儲再由計算機計算出如何虐我的一千種方法。(機器學習和雲計算並不相同,下一期科普中我會為大家詳細解釋)
局限性
這就是一整套「大數據」的應用流程,好像聽起來很牛逼的樣子,其實它距離科學家們理想中的樣子它還差的遠呢!對於我們普通人而言,它也僅僅只是能夠分析處理一些圍棋、象棋這類規則十分明確的遊戲,一旦遇到十分複雜的人類感情的話它就得懵逼。因為人類的思維時沒有任何規律可循的,也就無法用邏輯去分析,機器學習也就廢了一半。所以說它既能在玩遊戲時虐哭你,同樣也能在聊天時氣哭你,阿爾法狗距離終結者還差著好幾百個施瓦辛格呢……
在人類思維這裡碰壁的科學家們自然不甘就此失敗,既然無法分析那麼我們就繼續收集數據,總有一天能把你那奇怪的想法都收集全。然後各家語音助手都忙著和人類聊天去了……久而久之這些語音助手也就變得越來越聰明,懂的也越來越多了。
起源
關於大數據大家還要知道一個點:大數據可不是專屬於我們這個時代的產物!只是隨著網路技術的日益成熟近年來才逐漸進入了大家的視野而已,其實早在原始社會「大數據」就被應用到了人們的日常生活當中。當然那時候的「大數據」還非常初級,更多的是用來簡單的記錄哪裡的獵物多,然後人們就到哪裡去打獵。
再來說個稍微高級一點的:自古以來商人這一職業對於「大數據」一直是玩的最溜的,在商業發展中對於「大數據」的分析與運用一直就沒停過,商人逐利,「大數據」在逐利這一方面可謂是無往不利,只要你的市場分析做對了,你就能賺錢。那些著名的大企業家對於這一點詮釋的尤為明顯,就像去年熱播的電視劇《那年花開月正圓》中孫儷飾演的周瀅與洋商的合作就是基於「大數據」對於時局的解讀才最終拍板決定的。
關於大數據就先說到這裡,大家有什麼需要補充的歡迎來我們的公眾號「百幕科技乾貨鋪」後台留言哦(暫時沒有開通留言功能,只能麻煩一下了)
圖片素材:互聯網
參考資料:百幕
※每日一推:一款性價比非常高的遊戲本——炫龍 毀滅者 DD2
TAG:沫恩科訊 |