當前位置:
首頁 > 最新 > 如果把數據當成一隻青蛙,看看大咖如何說?

如果把數據當成一隻青蛙,看看大咖如何說?

是什麼讓數據科學成為一個性感的行業?當把海量數據注入到新興行業中,並隨之而湧現的大量令人興奮的新技術。

例如語音識別、計算機視覺中的物體識別、機器人和自動駕駛、生物信息學、神經科學、系外行星的發現和對宇宙起源的理解、以及組建廉價且成功的棒球隊。

在這些例子中,數據科學家就是整個企業的核心。他/她必須將應用領域的知識與統計專業知識相結合,並用計算機代碼來實現他們。

歸根結底,數據的性感體現在效用上。我最近讀了塞巴斯蒂安·古鐵雷斯(Sebastian Gutierrez)的「工作中的數據科學家」(Data Scientists at Work),他採訪了16個不同行業的16位數據科學家,了解他們的思考方式,他們在如何解決問題,以及數據分析和挖掘如何提升和幫助他們所在的行業

他們都是數據挖掘的一線工作者,涵蓋公共和私人組織 - 從創業公司、成熟企業到初期研究機構、人道主義非營利組織 - 並且跨越多個行業 - 廣告、電子商務、電子郵件營銷、企業級雲計算、時尚、工業互聯網、互聯網電視和娛樂、音樂、非營利組織、神經生物、報紙和媒體、專業和社交網路、零售、銷售情報和風險投資。

值得一提的是塞巴斯蒂安提出的開放式的問題,讓每個受訪者的個性和自發的思維過程都能夠清晰準確地表達出來。受訪者們在書中分享了下面幾個主題 :數據科學對他們意味著什麼以及他們是如何思考的,如何進入這個領域的建議,數據科學家想要成功必須深刻理解的悟性

在這篇文章中,我想分享一下這些數據科學家給出的最佳答案:

「What advice would you give to someone starting out in data science?」

「你會給數據科學新手們提供什麼建議?」

1 - Chris Wiggins

「紐約時報」首席數據科學家,哥倫比亞應用數學副教授

「首先是創造力耐心。 你必須真正喜歡某件事,才會花長時間去思考這件事情,當然還要有一定程度的質疑精神。 這也就是我喜歡博士生的一點 - 對於他們來說五年的時間足夠有所發現,並讓其發現並意識到一路上所有做錯的事情。

在思想上反覆斟酌會給你帶來很大的幫助,你或許從「發現可推翻舊理論的新理論」到「實際上自己把整個完全搞砸了」,從而犯下一系列的錯誤再到逐個修復它們。從理論上講, 我認為獲得博士學位的過程是很有用的,特別是科學研究,這個過程會讓你對看起來像一個確定的東西持續保持懷疑。

我認為這很有用,否則你很容易只是因為你第一眼覺得這條路非常可行,而就會走上錯誤的道路。

雖然這個答案看似無聊,但事實上是需要你有真正的技術深度。 數據科學不是一個獨立學科,所以目前還沒有相關資歷資質可談。對機器學習達到維基百科程度的理解是非常容易的。然而實際上要做到這一點,你應當知道如何選擇正確的工具並正確的完成它,這你需要很好地理解每個工具的所有優劣。 這種經驗沒有捷徑。 你必須犯很多錯誤。你必須自已發現誤將分類問題看成一個聚類問題,或聚類問題當做假設檢驗問題。

一旦你去嘗試一些事情,確信那是正確,但最後發現自已徹底錯了。你會有很多次這種經驗 - 你不得不一直在這個狀態下打轉,更不幸的是這種經驗的積累沒有捷徑可走。

你只需要這樣做,不斷地犯錯誤。這是我喜歡在這個領域中工作了許多年的人的另一個原因。要成為一名專家需要很長時間。 這需要多年的錯誤。 這是幾個世紀以來的真理。著名的物理學家尼爾斯·玻爾(Niels Bohr)有句名言,他認為你成為一個領域的專家的方式就是要在這個領域犯下每一個錯誤。」

2 -Caitlin Smallwood

Netflix科學與演算法副總裁

「我會說在你做任何其他事情之前,先硬著頭皮來理解數據的基礎知識,儘管它不夠性感也不好玩。

換句話說,你需要努力理解如何捕獲數據,準確理解每個數據欄位是如何定義的,以及了解數據何時丟失。 如果數據丟失,這是否意味著什麼? 它只是在某些情況下丟失? 這些小小的微妙數據陷阱真的會困住你, 他們真的會。

你可以使用最複雜的演算法,但它是比垃圾還垃圾的東西。 無論你有多興奮地去嘗試建模中有趣的地方,你都不能對原始數據視而不見。 在你開始模型開發之前,應該做到一絲不苟,然後檢查你所能得到的底層數據的一切。

隨著時間的推移,我學到的另外一件事情是,在一個系統環境中,複合演算法總是比單一演算法好,因為不同的技術會利用數據模式的不同方面,特別是在複雜的大型數據集中。 所以雖然你可以仍然採取一個特定的演算法,迭代再迭代,使它更好,但據我所知多演算法的組合往往比一個演算法做得更好。」

3 - Yann LeCun

臉書AI研究總監,紐約大學數據科學/計算機科學/神經科學教授

「我總是給出同樣的建議,因為我經常被問到這個問題。 如果你是一名本科生,想學習數據科學,你可以儘可能多地參加數學和物理課程

值得注意的事,這些必須是合適的課程。可能我將要說的聽起來似是而非,但選擇工程學或物理學可能比數學,計算機科學或經濟學更合適。

當然你需要學習編程,所以你需要學習大量的計算機科學課程,了解編程的機制。 然後再做一個數據科學有關的研究生課程。 本科學習機器學習、人工智慧、或計算機視覺課程,因為你需要接觸到這些技術。 在那之後,儘可能地參於所有的數學和物理課程。 特別是像優化演算法這樣的連續應用數學課程,因為他們讓你為真正具有挑戰性的事情做好準備。

這取決於你想成為什麼,因為在數據科學或人工智慧的領域有許多不同的工作。人們應該認真思考他們想做什麼,然後研究這些課題。 現在熱門話題是深度學習,它主要是學習和理解神經網路上的經典著作,學習優化演算法,學習線性代數和類似的課題。 這有助於你了解我們每天面對的基本數學技巧和基本概念。

4 - Erin Shellman

Zymergen的數據科學經理,Nordstrom數據實驗室和AWS S3的前數據科學家

「對於那些還沒有選擇專業的學生,我會說科學、技術、工程和數學專業(STEM)是不需要動腦筋的,特別是技術、工程和數學專業。學習這些專業會為你提供測試和了解這個世界的工具。

這就是我所了解的數學、統計學和機器學習。 我對數學本身並不感興趣,我有興趣用數學來描述事物。 畢竟這些都是工具,所以即使你對數學或統計學不感興趣,投資它們仍然是非常值得的,想想如何將它應用到你真正熱愛的事情上。

對於像我這樣試圖轉型的人來說,我想說有些地方很難。 請注意,改變行業是很困難的,你將不得不努力工作。 這不是數據科學的獨特之處 - 生活亦是如此。 在這個領域舉目無親是艱難的,但你可以在咖啡時間和慷慨的人們討論這些。 我生活中的頭號規則是「跟進(follow up)」,積極的探尋正確的答案。如果你跟某人聊天,他身上有你需要和看 重的東西,請跟進!

數據科學家的文章可能會相當嚇人,因為大部分像是在讀數據科學辭彙表一樣。 事實上技術變化如此之快,以至於沒有任何人有能力把所有內容寫在一篇文章里。 當你看到這樣的文章時,它的語風可能是壓倒性的,你可能會覺得:「這不適合我。 我沒有文中談到的這些技能,我也沒有什麼可以跟進和貢獻的。」只要你隨時可以接受改變和學習新事物,你就可以避免這樣的觀念模式。

最後要說的是,公司想要的是一個能嚴格的界定問題,並設計出解決方案的人。 他們也需要善於學習的人。 我認為這些都是核心技能。」

5 - Daniel Tunkelang

Twiggle的首席搜索專員,LinkedIn的搜索質量前主管。

「對於來自數學專業或物理專業的人,我建議是學習軟體開發等相關技能 - 尤其是Hadoop和R,它們是使用最廣泛的工具。 來自軟體工程的人應該學習機器學習相關的課程 ,並且使用真實的數據進行項目的開發,你可以找到許多免費的資源。 正如大部分人所說,成為數據科學家的最好方法是做數據科學實踐。只要數據在那裡,數據科學並不難學,特別是數學、科學或工程專業的人。

閱讀「The Unreasonable Effectiveness of Data」 - Google研究人員Alon Halevy,Peter Norvig和Fernando Pereira的一篇經典文章。 這篇文章通常被歸納為「更多的數據勝過更好的演算法」。這是值得一讀的好文,它介紹了使用網路規模的數據改進語音識別和機器翻譯的最新成果。 另外聽聽莫尼卡·羅加蒂(Monica Rogati)對於更好的數據如何擊敗更多的數據所說的話。理解內化這兩個見解有助於你成為一名真正的數據科學家。」

6 - John Foreman

MailChimp產品管理副總裁兼前首席數據科學家

「我發現很難找到和聘用合適的人,這真是一件複雜的事情。因為當我們思考大學教育系統是什麼時,無論對於是本科生還是畢業生,都只關注一件事情:你的本行專業。 但是數據科學家就像新文藝復興時期的各色人物一樣,本質上數據科學就是多學科的

數據科學家比計算機程序員知道更多統計知識,並且比統計學家更懂編程,這個大笑話就是這樣產生的。

這個笑話是什麼意思? 這就是說一個數據科學家是一個對這兩門學科都只了解一點點的人。 但是我可以說,他們知道的不僅僅是這兩個學科。 他們還必須知道如何交流溝通, 他們需要知道的不僅僅是初級統計學; 他們必須知道概率論、組合數學和微積分等等。

還不能不懂數據可視化。 他們還需要知道如何使用數據,使用資料庫,甚至還需要懂點面向對象(OR)。 還有很多事情他們需要有所了解。 所以很難聘用到這樣一類人,因為他們必須觸及很多學科,他們必須能夠聰明地講述出他們的經驗。 對於任何申請人來說,它的門檻都很高。

聘請到一個人需要很長時間,這就是為什麼我認為人們一直在討論現在數據科學方面沒有足夠的人才的原因。 我認為這在一定程度上是正確的。

我認為一些正在啟動的課程將會有所幫助。 但是即使是從這些課程中走出來,在MailChimp,我們也需要看到你如何表達並和我們溝通的,你是如何使用在各個學科中學習數據科學片斷的,以及這些課程教會了你哪些。 這是要清除這麼多人的東西。 我希望更多的項目將重點放在作為工作場所數據科學家的溝通和協作方面。」

7?-?Roger Ehrenberg

IA 創投管理合伙人

「我認為最大的機遇也是最大的挑戰。 在個人身份信息隱私問題方面,醫療數據顯然是最大問題。

除此之外,還有僵硬的官僚主義、僵化的基礎設施和數據孤島,這使得需要跨多個數據集進行集成的難題愈發複雜。 這是會發生的,而且我認為我們在這裡談到的技術與使醫療保健更好、更實惠、更分散直接相關。 我認為這代表了一代人的機遇。

早期的人工智慧另一個重要的領域是風險管理 - 無論是在金融、貿易還是保險。如果說是在風險評估模型中添加新數據集,這就是一個很難的問題。特別是將這些技術應用到保險、衛生保健行業。這會涉及到大量的隱私問題,數據也被禁錮在大型官僚機構中。

那時這些冥頑不靈的公司為了使用這些新技術,正在探索如何和新興產業互利互惠。這是令我興奮的另一個原因。

使我充滿激情的第三個原因是重塑製造業,使它更高效。已經出現了為製造業開了方便之門的趨勢。在美國一個更強大的製造業可能是重建一個充滿活力的中產階級的橋樑。我認為技術可以幫助加速這一有利的趨勢。」

8 - Claudia Perlich

Dstillery首席科學家

我認為,實際上學習如何成為數據科學家就像學習滑雪一樣。 你必須要去滑。 你可以觀看足夠多的視頻,並觀察滑雪是如何滑起來的。 在一天結束的時候,你必須穿上你該死的滑雪板,然後沿著那個山丘滑下去。 你會在途中摔倒幾次,這很好。 那是你需要的學習經驗。 實際上我更傾向於嚮應聘者詢問他曾進展不順利的工作,而不是那些做過的事情。因為這能可以告訴我他們在這個過程中學到了什麼。

每當有人問我「我該做什麼?」時,我會說:「你可以參加機器學習技術的在線課程。 毫無疑問,這是有用的。 你顯然必須會編程,至少懂點。 你不必是一個Java程序員,但你必須以某種方式完成某件事情。 我基本不在乎你是如何做到的。」

最後無論是作為DataKind的志願者在NGO上花時間去幫助大家,還是去Kaggle的網站參加一些數據挖掘比賽 - 只管讓雪濕了你的手和腳。

尤其是在Kaggle上,請閱讀其他人在論壇上關於問題的討論,因為那是你學習人們在做什麼,怎樣子有用,以及哪些對他們沒有用的地方。 所以即使你沒有為此付錢,實際上涉及數據處理的任何事情都是一件好事。

記住你必須滑下那座山,沒有其他辦法了。 你不能學習旁門左道。 所以奉獻你的時間,以任何你能想到的方式把你的手弄髒,如果你有機會實習 - 那非常完美。 也許你有很多機會可以從其他地方開始。 總之說做就做吧。」

9 - Jonathan Lenaghan

首席科學家,PlaceIQ產品開發高級副總裁。

「首先,會自我批評是非常重要的:

總是質疑你的假設,對你的結果保持懷疑。這是很容易的部分。如果要在數據科學領域有所成功,在應具備的技能方面中,具備良好的軟體工程技能是至關重要的。

所以,儘管我們可能會聘請那些幾乎沒有編程經驗的人,但是我們很努力地並且很快地灌輸他們軟體工程的重要性,包括軟體工程實踐和大量的敏捷編程實踐。無論對他們還是我們都是有幫助的,因為現在這些工程實踐幾乎都和數據科學有著一對一的對應。

現在如果你看看開發工具,他們有持續集成、持續構建、自動化測試和測試工具等等 - 所有這些從開發者世界到數據操作系統(我從Red Monk偷來的一個概念)世界都是非常友好、非常容易的。 我認為這是一個非常強大的概念。

為你的數據創建測試框架非常重要。如果您更改了代碼,則可以返回並測試所有數據。 可見擁有軟體工程學思想對數據科學領域的高速發展至關重要。

比起閱讀機器學習的書籍,閱讀『Code Complete』和 『The Pragmatic Programmer』 可以讓你走得更遠。當然閱讀機器學習的書籍也是必須的。」

10 - Anna Smith

Spotify的高級數據工程師,Rent the Runway 分析工程師

「如果有人剛剛開始從事數據科學工作,最重要的是要知道問大家問題沒有什麼不好的。我也認為謙遜是非常重要的。你必須確保你沒有被束縛在你正在做的事情中。 您可以隨時進行更改並重新開始。 當我們開始後刪除代碼真的很難,但最重要的是說做就做。

即使你沒有數據科學方面的工作,你仍然可以在你的閑暇時間探索數據集,並可以向你的數據提出問題。

在我個人的時間裡,我玩過Reddit的數據。 我問自己:「我可以用我有或沒有的工具來研究Reddit,我可以做些什麼?」這很好,因為一旦你開始了,就可以看到其他人是如何處理同樣的問題的。

只要用你的內心去閱讀別人的文章,就像「我可以用我的方法使用這個技巧」。慢慢地開始,慢慢地有所進展。 我在開始的時候讀了許多文章,但是我認為這並沒有什麼幫助,除非你真正使用代碼和數據來了解它是如何工作的,以及它是如何改進的。 當人們把它寫在書里的時候,看似一切都很完美。 然而事實並非如此。

我覺得嘗試很多不同的東西也是非常重要的。 我不認為我曾經想到我會在這裡。我也不知道五年後我會在哪裡。但是也許這就是我學習的方法,在各種不同的學科間嘗試各類事情來理解哪些東西最適合我。」

11 - Andre Karpistsenko

Taxothe數據科學主管,PlanetOS聯合創始人兼研究主管

「雖然有點泛泛的建議,但我相信你應該相信自己,並且追隨你的激情。 我認為媒體的新聞和期望很容易讓你分心,並讓你選擇一個不想去的方向。 所以說到數據科學,你應該把它看作是你職業生涯的起點。

擁有數據科學相關的背景對你在任何事情上都是有益的。擁有創建軟體的能力以及使用統計數據的能力將使你能夠在你從事的任何領域做出更明智的決策。 例如,我們可以通過數據了解運動員的表現是如何提高的,比如某人成為跳遠金牌得主,因為他們做了優化並在跳躍的角度等反覆練習。 這一切都是以數據驅動的方式引領體育。

如果需要我提供更具體的技術建議,那麼這取決於接受建議的人的抱負了。 如果這個人想要創造新的方法和工具,那麼建議就會非常不同。 你需要堅持並繼續朝著你的方向前進,並且你會成功的。 但是如果你想要多才多藝,並且適應多種環境,那麼你可能需要一個集合不同方法演算法的大工具箱。

我收到最好的建議是來自一個斯坦福大學的教授。我不久前學習過他的課程,他建議要成為一個T型人才,即橫向多專業多系統,縱向的核心競爭力表示至少深入一個專業或系統,但是在核心競爭力旁邊要有一個小的第二能力,這樣在你需要或者想要的情況下,你總可以選擇另一條人生路線。

除了縱向單一領域的專業知識之外,他建議你有足夠寬闊的橫向背景,以便在諸多的不同情況下與許多不同的人一起工作。

所以在大學期間,建立一個T型能力輔以一個次要能力可能是最好的選擇。

也許最重要的事情就是在比你更牛的人身邊一起工作,向他們學習,這是我最好的建議。 在大學裡,是能看到人的多樣化能力的最好環境。 如果你能夠與最優秀的人一起工作,你會在很多事情上收穫成功的。」

12 - Amer Heineike

Primer技術副總裁AI,Quid數學前任主管

我想也許他們需要先審視自己,搞清楚他們真正關心的是什麼。 他們想做什麼? 現在數據科學是一個熱門話題,所以我覺得有很多人認為如果能夠擁有「數據科學」的標籤,那麼魔法、快樂和金錢就會滾滾而來。

所以我真的建議搞清楚你真正關心的是哪種數據科學。 這是你應該問自己的第一個問題。 然後你要想方設方搞清楚如何熟練的做到做好。 你也需要開始考慮那些真正使你感興趣的工作。

一種策略是深入到你需要知道的那部分。在我們的團隊中有自然語言處理的博士,或者物理學博士,他們使用了許多不同的分析方法。 所以你可以深入到一個領域,然後找到那些認為這類問題重要的人或有類似問題的人,以便用同樣的思維來解決。 所以這是一個途徑。

另一種途徑就是要用於嘗試。數據集隨處可見。試著想一下,在現在的工作中是否有可用的數據,可以用有趣的方式去處理。

要想方設法去嘗試一下,看看你真的想做什麼。即使在家裡你仍然可以得到開放的數據集。隨便在數據中翻一翻,看看你能找到什麼,然後隨意地擺弄它。 我認為這是一個很好的起點。 現在有很多不同的角色都以「數據科學」自居,而且還有很多角色可能你也覺得屬於「數據科學」範疇,但卻沒有添上數據科學的標籤,因為人們並不一定需要使用它。總之,想想你真正想要的是什麼

13 - Victor Hu

QBE保險公司數據科學負責人,Next Sound Sound公司前首席數據科學家

首先是你一定要會講故事。 在一天結束的時候,你所做的就是深入挖掘一個系統、組織或行業的最核心和最重要的信息。 然而要想讓大家知道和了解它的用途,你就必須要講好一個故事。

能夠寫清楚你在做什麼和說清楚你的工作內容是非常關鍵的。另外值得一提的是,你應該少擔心你正在使用的演算法。 更多的數據或更好的數據勝過一個更好的演算法,所以如果你能創建一種方法來分析和獲得大量優質、乾淨且有價值的數據 - 那就太好了!」

14 - Kira Radinsky

eBay首席科學家兼數據科學主管,Sales-Pre-CTO和聯合創始人

尋找一個讓你為之興奮的問題。 對我來說,每當我開始了解新事物時,要是沒有帶著問題只是一味地學習,就真的很無聊。先儘可能快速地閱讀相關材料,在工作的過程中開始了解其中的內容和你的問題,很快你就能發現問題之所在。這將引導去探索其他學習資源,無論是書籍、論文還是某人。 所以把時間花在問題和人的身上,你會感到輕鬆自在的。

深入了解基礎知識。 了解一些基本的數據結構和計算機科學。 了解與你使用工具的相關基礎知識,理解他們背後的數學原理,而不僅僅是知道如何使用它們。理解模型輸入和輸出以及內部究竟發生了什麼,否則你將不知道什麼時候該應用它。 另外這取決於你正在處理的問題。

為了處理許多不同的問題,有很多不同的工具可以使用。你必須知道每個工具能做什麼,而且你必須十分了解問題,才能應用更合適的工具和技術去解決。」

15 - Eric Jonas

UC Berkeley EECS博士後,Salesforce首席預測科學家

他們應該來回反覆地去理解概率理論。我現在了解到所有我學過的東西,最後都會再回到概率論。這當然很好,因為概率論為我提供了一個令人驚奇的、深刻且豐富的數學基礎,我可以把其他的知識都通過概率論來理解。

E. T. Jaynes的書Probability Theory: The Logic of Science,相當於是我們的聖經。 我有很多購買它的理由。我喜歡概率生成方法的原因是你有兩個正交軸 - 建模軸和推理軸。 這基本上轉化為如何表達我的問題,以及如何計算給出數據的概率假設? 從貝葉斯的角度來看,我喜歡的是你可以獨立設計每個軸。 當然他們不是完全獨立的,但他們可以儘可能的接近獨立,你總是可以這樣處理他們。

當我研究深度學習或者基於最小絕對值收斂演算法(LASSO)的某類型的線性回歸系統時(如今都是機器學習的重要組成部分),它們各自沿著其中一個軸進行建模。 這樣直接就崩潰掉了。

作為一名使用基於最小絕對值收斂演算法的技術工程師,我很難想像到:「如果我稍微改變這個參數,這究竟會意味著什麼呢?」

線性回歸模型是一個非常清晰的線性加性高斯模型。如果我想讓事情看起來有所不同會如何呢?突然間,所有這些正則化最小二乘的東西都土崩瓦解了。那些推理的手段甚至根本不允許你想做的事情。

16 - Jake Porwar

DataKind的創始人和執行董事

我認為一個強大的統計學背景是先決條件,因為你需要知道你在做什麼,並且了解你構建的模型核心。另外我的統計學項目也教了很多關於道德的東西,這是我們在DataKind上經常探討的話題。

你總是想讓你的工作能夠落地應用的實處。你可以給任何人一個演算法。你可以給某人一個能夠攔截盤查數據的模型,警察可能在伺機逮捕你,但是究竟是為什麼以及最後到底會怎樣呢?這就像發明任何一項新技術一樣。你必須考慮風險和收益,權衡利憋,因為你要對你所創造的東西負責。

不管你來自哪裡都是沒有關係的,只要你理解清楚了你用來得出結論的工具,這就是你能做的最好的事情。 我們現在都是科學家,探討的不僅只是產品設計。

我們都為我們所生活的世界給出理解和結論。這就是統計學 - 不斷收集數據來證明一個假設或構造一個行之有效的模型。盲目地信任一個模型的結果是很危險的,因為那就是你對這個世界的解釋,正如和這個現實世界本身就存在缺陷一樣,你的理解也會印證結果是如何的充滿著瑕疵。

總而言之,學習些統計學也要多加思考。

Data Scientists at Work(https://www.goodreads.com/book/show/22945255-data-scientists-at-work)展示了世界上一些頂尖的數據科學家是如何在這令人眼花繚亂的行業和公司中工作的 - 每個人都將自己的領域知識、統計學和計算機科學相結合來創造巨大的價值和影響力。

數據正在以指數形式增長。現在比以往任何時候都更需要那些能夠理解數據和從中提取數據特徵的人。 如果您渴望成為下一代數據科學家,那麼這些睿智的從業者所獲得的關於數據和模型的辛苦的教訓和樂趣將非常有用。

作者簡介

James Le

現居與美國西雅圖地區,數據科學方向活躍的博客撰寫人,同時在Denison Enterprises LLC擔任軟體開發和產品經理。

譯者簡介

proffl

愛數圈對外交流團隊成員,現就職於農商行,享受編程的樂趣,渴望掌握新技術,興趣不多,關注細節。

校對

Yuan

愛數圈對外交流團隊海外負責人,擅長城市數據挖掘,曾就職國內外知名高校和研究機構。

土豆

北京某校物理博士生, 愛好登山徒步, 熱愛分享傳播. 始於讀書, 忠於寫作, 長久於專研, 做與深度學習相關的科研課題.

My motto: Knowledge increases by sharing but not by saving!

歡迎加入數據君親自打造有情懷、高效學習數據分析的


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 數據挖掘與大數據分析 的精彩文章:

用數據分析了周杰倫這首200萬評論的歌曲,有每個人的青春

TAG:數據挖掘與大數據分析 |