當前位置:
首頁 > 最新 > 數據預測簡介

數據預測簡介

未來的不確定,一直吸引著人類追尋能夠對它進行預測的方法。幾千年以前,人們便通過對自然現象的觀察來占卜吉凶。無論預測還是占卜,都是建立在目前的基礎上對於未來的推想。這兩個詞的區別,僅在於一個適用於無神論者,另一個更符合有神論者的口味。

話說,只要能看得懂文字的人,一定對牛頓不陌生。可是,不要以為牛頓總結出了那麼牛逼的科學定律和公式那麼他就是一個無神論者,恰恰相反,據說,當初那個詭異的蘋果掉下來恰好砸到在樹下乘涼的牛頓頭上時,小哥哥可認為一定是上帝在提醒他什麼。一番折騰以後,他才知道由上帝創造的地球上,東西只會往下掉,而不會自己往相反方向掉落。用無神論者的話說,牛頓發現的哪裡是什麼神旨,他發現的是引力。但無論怎麼說,牛頓定律的發現,至今都在影響著我們,甚至在今後很長很長的時間內(除非被推翻)都將適用。從這個角度來說,牛頓定律不正是科學家用來「占卜」的一個工具么?

在此,我更願意適用預測一詞。確切的來說,我們即將討論的是在購物中心經營管理領域將會用到的數據預測技術。

要實現數據預測,一般需要經過以下基本步驟:

問題的定義。通常這是最難,也是最為重要的一步。將要預測什麼,這項工作是否重要,是否有歷史數據,是否有合適的技術或者預測工具,公司如何使用預測的結果或者說預測的結果能夠對公司經營有什麼作用,這些都是事先要考慮的問題。

信息的搜集。這裡說的信息,主要包含兩個含義。一個是數據的搜集,例如我們既可以通過手工台賬來獲取和搜集購物中心經營數據,也可以藉助更加智能化的數據採集系統。另一個含義則搜集購物中心經營領域的專業知識,假如你和我一樣是零售商業地產行業的從業者,那麼在專業領域的經驗或知識則是我們領先於常規碼農或數據分析員的強項。

探索性分析。通常需要通過繪製合適的圖表來看歷史數據呈現什麼樣的規律,通過肉眼的觀察就可輕易的發現一組歷史數據可能呈現出一些趨勢、周期性,或者發現經常有一些異常的數據需要深入的研究和解釋,亦或是多組數據直接存在一些關聯。

模型的挑選。或者稱之建模,對於從事零售商業地產的管理人員來說,這或許是最富有技術含量和挑戰性的一步。通常,為了分析歷史數據的規律,我們需要建立多個模型,然後通過一定的方法來判定每個模型的可解釋性,以及用該模型估計歷史數據的匹配精確程度,並通過模型這間的比較挑選出合適的分析模型。

預測及優化。有了合適的分析模型,我們則可以用該模型對未來的數據進行預測。當然,這個模型不是一成不變的。隨著時間的推移,未來的真實數據會逐漸的被採集到,我們應當用這些新的數據來再次訓練模型,從而改善分析模型並保持分析模型和現實的匹配。

數據預測技術發展至今,已經有一些比較成熟的方法,或者說模型。大致可以分為三種:

第一類:因果模型,或者說解釋性模型(Explanatory Model),通過分析原因來推導結果。比如,購物中心的銷售額會受到客流量、出租率、是否是節假日、是否有商場活動等等因素的影響,那麼我們則可以建立這樣一個模型:

一旦知道某個時間的客流、出租率、是否是節假日、是否有商場活動,那麼我們就可以通過上述的公式對銷售額進行預測。

二類:時間序列模型(Time Series Model),數據隨著時間變化的話,則組成一個時間序列。基於「歷史是會重演」的假設,我們可以用歷史數據來預測未來的數據。同樣用銷售額舉例的話,模型如下:

上述公式中的下標代表時間點,那麼可以理解為用目前以及以前的銷售額數據可以推導得出將來的銷售額。倘若是年銷售,那麼可以通過過往年份的銷售額預測未來一年的銷售,倘若是月銷售,那麼可以通過過往月份的銷售額預測未來一個月的銷售,以此類推。

三類:混合模型(Mixed Model)。將以上兩類模型混合,既考慮到引起銷售額的原因,又將隨著時間演變的歷史規律進行重複並應用到對未來的預測中。模型如下:

對於零售商業地產領域從業人員而言,第一個模型是最直觀的,因為可以通過我們自身的領域專業知識去進行解釋為什麼一個項目的銷售額會變化。實際上,最常用的則是時間序列模型。

一方面,對於解釋性模型,即便都是零售商業地產從業人員,不同公司、不同項目的從業人員對於產生項目銷售額的引發因素有不同的看法和解釋:對於」Location, Location, Location」的港資企業或者持有相同觀點的其他企業,銷售額完全由項目地理位置決定,那麼開發一個項目的時候,通過對於地理位置的量化判斷,就可以預知將來大概的銷售規模;對於奧特萊斯或者因特宜家購物中心這類項目,他們的地理位置並不算很好(相對於核心位置而言),反而相對便利的交通和複合消費者習慣的品牌組合或者商品則對項目銷售額產生很大的影響,那麼這類項目建模的時候則不會重點考慮項目地理位置的因素。由此可見,用解釋性模型來預測,由於不可能考慮到全部的影響因素,所以不同的公司或不同的分析人員會根據不同的情況產生各式各樣的模型。這個模型取決於你對行業的理解、你對某個要素的關注度,甚至是你在建模時的心情。

時間序列模型,則是把數據單純的看作數據(但是加上了時間維度),通過對於歷史數據的研究發現規律,並將這個規律應用到未來的一段時間從而做出預測。雖然,只把數據當成是時間的函數,貌似忽略了導致數據變化的因果關係,但是,其實通過對歷史數據的時間規律上的研究,已經隱含了對過去的時間內的誘發因素的研究。因為,一旦總結出了時間上的歷史規律,也就掌握了各種誘發因素綜合導致的結果,這會比單獨研究某個或者某些誘發因素更加的全面。所以,時間序列模型在數據預測時被大量應用,大多數情況下也是預測效果最好的模型。

另一方面,仍然拿商場的銷售額預測來舉例,即便我們得到了預測銷售額的解釋性模型,為了預測未來的銷售額,首先需要做的是預測未來的客流量、開業率等等未知誘發因素,顯然這讓我們的預測工作陷入了一個死循環。對銷售額預測工作被轉化和分解成了對客流量和開業率的預測,那麼如何預測客流量和開業率呢?顯然,這樣的模型不僅工作量極大,也是難以避免在預測過程中假如過多的主觀因素的。從這個角度說,時間序列由於只考慮一個客觀的時間維度,因此用來進行預測也是效果相對較好的。

細心的朋友可能會發現,在上述三個模型中都加入了誤差項(Error或者Residual)。需要強調的是,誤差並不是錯誤,而是包含了無法用模型解釋的信息。因此,一旦建立分析模型,對於誤差的研究,將會幫助我們判斷模型是否有效。反之,任何沒有誤差項的分析模型都是無效的模型。

在此,本文採用購物中心銷售額預測來進行舉例,是因為這對一個項目或一個公司是極為重要的。一定規模的銷售額對於公司而言可以提升市場話語權,對於項目而言可以產生源源不斷租金收入,而租金收入則是項目主營收入最重要的來源。因此,對於銷售額歷史數據的研究和未來的預測,不僅能夠使項目的預算編製更加科學合理,也能夠提前預判走勢並制定相應的經營管理措施。

今年由全國工商聯主管的全聯房地產商會商業地產研究會在上海舉辦的中國商業地產發展論壇上,中糧大悅城地產總經理周鵬先生在主題分享中曾透露過,大悅城數據研究團隊已經可以通過歷史數據預測未來幾個月的銷售額數據,但並未透露過多的細節。可能由於見識有限,這是筆者第一次聽說有同行企業(僅指開發商或商管公司,IT技術供應商排除在外)在進行相關的預測研究或工作。可以猜測的是,其他同行公司鮮有研究,至少暫時並未有實際應用成果。購物中心雖然是舶來品,通過近20年的攻城略地和爆髮式增長,目前的業務模式和物理形態在國內已經發展的相對成熟,甚至在一些城市或者地段,出現了產品過剩、競爭白熱化的現象。因此,更多的公司和項目越來越重視潛心經營來提升競爭力,而不僅僅是再一味看中規模擴張。做為經營數據分析的一個小小的分支領域,預測技術能夠為項目經營提供更具參考性的目標,並指導具體的管理業務操作。筆者由於興趣所在而冒然進入該領域,邊學邊總結,畢竟能力有限,後續將結合實際案例不定期逐步展開。敬請關注。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 RetailData 的精彩文章:

TAG:RetailData |