我是如何看出復聯4的關鍵人物居然是鋼鐵俠的?
知道都在Final
可是還是拉仇恨用釘子精神看了
《復仇者聯盟3》,並得出了一下結論:
並根據搜索引擎數據得到了以下結論:
1. 復聯3結束後,鋼鐵俠關鍵搜索次數提升380倍
這個數據遠高於奇異博士以及這集逗逼的浩克
2. 復聯四將圍繞唯一勝利結局的可能性鋼鐵俠展開
因為這是他看到的1400萬次
與滅霸交手的唯一勝利可能性
3. 然而鋼鐵俠終將嗝屁
因為小羅伯唐尼超過50歲就不演了...
今日福利
100+數據搜集網站匯總
300+/ 20G/ 5000分鐘:MySQL、SAS、SPSS、Python、R數據分析必備高清視頻
120個 Excel實用技能操作詳解+ 12100分鐘 Excel VBA建模視頻教程
價值5000元160+行業研究報告,八大行業細分
復仇者聯盟3電影票10張,評論區留言點贊前5位入選
01
為什麼大數據如此關鍵?
其實數據存在於我們的每一個網路動作中,找數據、清理數據、分析數據、寫報告。大數據是未來5-10年的行業發展趨勢,也因為只有這樣的數據報告以及分析才是更加公允而且有價值的!
所謂「Garbage In, Garbage Out」找的數據是垃圾,分析的再認真也不過是二手垃圾;不管是應屆生,或是剛入行新手,還是從業三五年的投行精英,數據、盡調、行研,這三樣都是最為重要的技能。
數據作為基礎中的基礎,是很多實習生的必備技能,因為它很可能就決定了你是通宵加班,還是效率飛快讓領導們對你刮目相看……
行業研究:
出具一份行業研究報告,遵從宏觀到微觀深邏輯線路,從主幹到支脈,後一層都依託前一層深入,越來越細,越來越具有實際指導意義,這一切少不了對數據的整理分析,而數據搜集作為數據工作的第一步,直接影響後續分析結果,影響給到投資者的買賣建議。
盡職調查:
盡職調查其中一項就是要搞清楚「做的怎麼樣」,即經營數據和財務數據收集,尤其是財務報表反映的財務狀況、經營成果、現金流量及縱向、橫向比較。通過搜集有關信息和數據,並對之按照該方面合法合規性的要求進行分析、判斷和評估,以解決信息真實性和信息不對稱之問題,為客戶儘可能的避免和降低風險,給客戶決策提供參考依據。
然而真實世界的數據是混亂的,是因為建設這個數據世界的人類,是不完美的,所以找數據,有時候是一件非常痛苦的事情,經常遇到:
找到了數據,卻無法溯源,數據不能使用;
數據說法不一,而沒有一個官方的來源,無法抉擇;
有些數據就是找不到,不知道如何闡述某個問題;
有些數據明明就有,卻來自於某些諮詢公司,標價動不動就是上千刀……
02
搜集數據的正確姿勢
在搜集數據之前,我們必須搞明白搜集的目的是什麼?想要搜集什麼樣的數據?常用的搜索引擎、資料庫、論壇、官網及其他進行分類。
常見數據收集來源:
1.搜索引擎:
Google:最好用的搜索引擎,缺點是要翻牆
百度:國內使用最廣泛的搜索引擎,缺點是廣告太多
2.資料庫:
國內:
Wind金融資料庫:可以說是國內上市公司和新三板公司數據最好的,賬號註冊後可以免費使用三個月
東方財富choice資料庫:很好上手,而且數據會自己歸類,方便下載
同花順
巨潮資料庫
國外:
彭博Bloomberg :多、准、全、貴
CEIC、OECD
路透社
3.論壇:
人大經濟論壇:經濟數據十分全
經濟學家
華爾街社區
4.官網:
政府官網:國家統計局、工業和信息化部、發改委、國家知識產權局、中國人民銀行等
券商和諮詢公司:上交所、深交所、紐交所、貝恩公司、IBM、德勤中國等
5.其他:
新聞資訊類網站、行業協會網站等
03
花式Excel規整數據
要想把數據做好,不僅僅是要找到數據,還要把數據清洗好和分析好。這時候就離不開這三大法寶:
1.Excel
Excel是迄今為止最簡單最便捷得處理數據的方式,下至四則運算,上至各類統計分析、矩陣運算及線性規劃都可以搞定,所以一定要熟練掌握。
但是Excel深不可測,基本沒有天花板,千萬不要以為會了VLookup及一些快捷鍵就可以耀武揚威了。至少需要把矩陣乘法、向量乘法、Offset/ Cells/ Row/ Range等函數用到極致,這樣大多數Financial Model會做得非常靈活,而且各種數據查詢及匹配工作會達到部分SQL的處理水平。
2.VBA
VBA會讓Office的能力提升一個檔次,除了完成函數不能完成的一些任務,最有價值的是能夠在Office的各套軟體之間實現信息同步。之上提到的許多軟體都是基於VBA完成的,最重要的沒有版權問題。
3.爬蟲
所謂爬蟲,其實就是一套自動讀取網頁和解析網頁的程序而已。用python或者Go等程序語言寫出爬蟲程序來自動抓取網路數據,利用正則表達式等技術手段將臟數據清洗並結構化放入到資料庫或者Excel,然後作分析以及長期監控。
網路上的數據越來越多,越來越能代表生活中的真實現象。通過爬蟲加正則這種自動化的工具,能夠耗很少的人工就可以將數據和信息採集並結構化,後續通過更多的分析工具完成許多有商業價值的分析並獲取所謂的insight。
04
數據找不到?照樣做分析
有些數據的確是找不到的,這時候就需要自己預測了。最常用的方法就是利用計量經濟學的方法建立經濟模型,根據已知的因素進行線性回歸分析,進一步去預測某些數據。
之前見過一個人,在投行工作期間研究高速公路上市公司,需要未來幾年計劃鋪設的公里數,有些政府網站會提供相關數據,但是有些政府網站並沒有提供,網上也沒有任何相關數據。最終他根據幾個已知的數據,比如歷史鋪設的公里數、GDP增長率等等自己建立了一個經濟模型進行預測,結果據說還挺準確的。
比較常用的統計軟體就是Eviews、SPSS。
「你怎麼看復聯3以及這些可惡的大數據?」
最快留言的3位小夥伴
我們將免費送出
由麥肯錫公司從業10年的資深導師講解
數據搜集方法解析課程
今日福利
【收集】
即可獲得福利領取方式
數據搜集網站匯總
數據教程視頻
300+ / 20G / 5000分鐘 數據分析必備高清視頻
MySQL視頻教程Package,SAS視頻教程Package
SPSS視頻教程Package,Python視頻教程Package
R視頻教程Package
完全掌握Excel VBA高效辦公超級手冊
12100分鐘Excel VBA建模視頻教程+練習素材
1000+視頻從基礎到進階黃金技巧教程+練習使用素材
(從學到練全攻略!)
120+Excel實用技能操作詳解
(經典案例演示+視頻講解+練手素材)
價值5000元最新160份行業研究報告
來自麥肯錫/德勤/普華永道/阿里研究院/
領英/艾瑞/尼爾森/埃森哲/騰訊研究院
等權威機構
涵蓋金融地產/智能科技/電商物流/汽車出行
/女性母嬰/醫療教育/娛樂遊戲/家電旅遊
八大行業板塊
——END——
素材來源:何明科(知乎)、林駿翔(知乎)、網路等
本期責任小編:sheerlin
※滴滴出行2018暑期實習崗位開通,107個崗位空缺待補
※如何迅速區分買賣方量化,規劃量化求職路線?
TAG:UniCareer |