支持Python!Facebook開源預測工具Prophet
雷鋒網消息:前天,Facebook 宣布開源一款基於 Python 和 R 語言的數據預測工具——「Prophet」,即「先知」。取名倒是非常直白。
Facebook 表示,Prophet 相比現有預測工具更加人性化,並且難得地提供 Python 支持。另外,它生成的預測結果足以和專業數據分析師媲美。
Facebook 把預測任務的流程用下圖展示出來:
從圖中可以看出,預測共分四個流程:建模,預測評估,表面問題和人工檢查。
在建模階段,當前可用的 Python 工具包寥寥無幾。最廣為人知的 「 forecast」 ,谷歌開發的 CausalImpact, 以及推特的 AnomalyDetection,均是基於 R 語言。很顯然,Facebook 想要改變這一點。
從 Facebook 官方聲明來看,推出 Prophet,是希望用它來替代 forecast,成為最受歡迎的預測工具。雷鋒網了解到,相對於後者,Facebook 表示 Prophet 有兩大優點:
開發合理、準確的預測模型更加直接。
Prophet 包含許多預測技術,比如 ARIMA 和 exponential smoothing。每一項工具都有它的長處、短處和調節參數。Facebook 表示,選擇不恰當的模型或參數會造成讓人難以滿意的結果;而即便是有經驗的數據分析師在選擇模型、參數上也經常遇到困難。言下之意是,Prophet 將著重改善這方面的體驗,讓模型、參數的選擇更直觀。
用 Prophet 做出的預測,能夠以對普通人更加直觀的方式進行定製。
Prophet 有針對周期性的平滑參數(smoothing parameters for seasonality),允許開發者調整與歷史周期的匹配程度。它還有針對趨勢的平滑參數,能夠調整對歷史趨勢變化的緊跟程度。對於增長曲線(growth curves),開發者能人工設置上限,即 capacities,把關於「該預測如何增長(或下降)」的先驗信息注入進去。最後,開發者還能設置不規則日期,來對超級碗、感恩節、黑色星期五之類的特殊日子進行建模。
組成部分
在它的核心,Prophet 是一個可加回歸模型(additive regression model),它有四個組成部分:
一個分段的線性或邏輯增長曲線趨勢。Prophet 通過提取數據中的轉變點,自動檢測趨勢變化。
一個按年的周期組件,使用傅里葉級數(Fourier series)建模而成。
一個按周的周期組件,使用虛擬變數(dummy variables)。
用戶設置的重要節日表。
適用範圍
雷鋒網獲知,Prophet 針對的是商業預測任務,適用於具備以下特徵的場景:
針對每小時、每天或每星期的觀察頻次,有至少數月(理想情況的一年)的歷史記錄。
多重顯著的「人類層級」周期性:星期X以及年份。
日期間隔不規則的重要節日(比如超級碗),需要事先得知。
觀察缺失或是異常值在合理範圍內。
歷史趨勢變化,比如產品發布或者改寫記錄(logging changes)。
符合非線性增長曲線的趨勢,有天然上、下限或者飽和點。
想要進一步了解 Prophet 的讀者,請參考以下鏈接:
Facebook 博客:https://research.fb.com/prophet-forecasting-at-scale/
使用指南:https://facebookincubator.github.io/prophet/docs/quick_start.html
文件:http://facebookincubator.github.io/prophet/
viafacebook
※指紋識別與移動支付安全
※《區塊鏈2.0》譚磊:區塊鏈的核心在於數據
※和 「雲滴血」 事件相比,谷歌破解 SHA-1 都不算新聞
※Valve 二代基站曝光,高通 MWC 將推驍龍 835 VR 一體機方案
※Alexa 已經瘋狂擴張到 10000 項技能,但斷言它是語音交互的未來還太早
TAG:雷鋒網 |
※開源 .net license tool, EasyLicense !
※Oracle 開源 Serverless Functions 平台 Fn
※谷歌通過TensorFlow Object Detection API開源其物體識別系統
※TensorFLow可應用於Android Things的物聯網;GitHub發布開源指南
※Facebook開源捕捉代碼缺陷的自家工具:OneWorld、Jupiter、AL
※從Facebook AI Research開源fastText談文本分類:詞向量模性、深度表徵等
※「深度學習測顏值」基於TensorFlow的開源項目FaceRank
※XSS OR 開源,Hack with JavaScript
※Facebook開源Zstandard新型壓縮演算法代替Zlib 簡單使用
※WPS Office for Linux項目中止 計劃開源Linux代碼
※Facebook 開源新一代機器學習 GPU 伺服器 Big Basin;谷歌召開 Google Cloud Next 雲技術大會等
※TensorFlow Agents日前開源,輕鬆在TensorFlow中構建並行強化學習演算法
※阿里巴巴積極擁抱開源 正式開源全球化OpenMessaging和ApsaraCache項目
※常用的三大Java EE開源伺服器Apache Geronimo3、Tomcat8和JBoss7比較分析
※Facebook開源PyTorch版本fairseq翻譯模型,訓練速度提高50%
※說一說Facebook開源的Litho
※愛開源的微軟是如何擊敗 Facebook、Google 成為 GitHub No.1 的?
※重磅!阿里巴巴正式開源全球化OpenMessaging和ApsaraCache項目
※大規模Kafka集群的管理利器:LinkedIn最新開源的Cruise Control帶來了什麼?