當前位置:
首頁 > 最新 > WEKA平台應用

WEKA平台應用

機器學習主要分為有監督學習(supervisedlearning)和無監督學習(unsupervised learning)。

監督學習,就是人們常說的分類,通過已有的訓練樣本去訓練得到一個最優模型(這個模型屬於某個函數的集合,最優則表示在某個評價準則下是最佳的),再利用這個模型將所有的輸入映射為相應的輸出,對輸出進行簡單的判斷從而實現分類的目的,也就具有了對未知數據進行分類的能力。

例如:在人對事物的認識中,我們從孩子開始就被大人們教授這個是樹木,那是花,等等。我們所見到的景物就是輸入數據,而大人們對這些景物的判斷結果就是相應的輸出。當我們見識多了以後,腦子裡就慢慢地得到了一些泛化的模型,這就是訓練得到的那個函數,從而不需要大人在旁邊指點的時候,我們也能分辨的出來哪些是樹木,哪些是花。監督學習里典型的例子就是KNN、SVM。

無監督學習與監督學習的不同之處,在於我們事先沒有任何訓練樣本,而需要直接對數據進行建模。

例如:我們去參觀一個畫展,我們完全對藝術一無所知,但是欣賞完多幅作品之後,我們也能把它們分成不同的派別(比如哪些更朦朧一點,哪些更寫實一些,即使我們不知道什麼叫做朦朧派,什麼叫做寫實派,但是至少我們能把他們分為兩個類)。無監督學習里典型的例子就是聚類了。聚類的目的在於把相似的東西聚在一起,而我們並不關心這一類是什麼。

機器學習平台比較

機器學習平台提供了從頭到尾完成一個機器學習項目的功能,包括數據分析,數據準備,建模和演算法評估及選擇。常用的機器學習平台有:(1)WEKA:一款免費開源的機器學習和數據挖掘可視化工具軟體,其操作簡便,運行速度快,尤其適合小規模的機器學習建模,適合於科研探索和機器學習入門人員等;(2)RapidMiner:在機器學習領域應是一個全面綜合的軟體工具,在演算法和可視化效果方面都很突出,特別適用於不同數據的多方面分析和研究,適用於數據和業務分析人員;(3)Knime:接近RapidMiner,但界面比較複雜,比較適合開發人員,尤其是具備Eclipse開發經驗的人員。

WEKA簡單應用

Weka輸入數據的格式:

@relationweather

@attributeoutlook

@attributetemperaturereal

@attributehumidityreal

@attributewindy

@attributeplay

@data

sunny,85,85,FALSE,no

sunny,80,90,TRUE,no

overcast,83,86,FALSE,yes

rainy,70,96,FALSE,yes

……

選擇分類演算法:從演算法庫裡邊選擇J48演算法。

結果顯示:根據天氣情況,判斷外出遊玩這個狀態進行判斷。例如:當天氣是多雲的時候,可以外出遊玩,當天氣是雨天並且有風的時候,不可以外出遊玩。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 楓葉飄飄myl 的精彩文章:

TAG:楓葉飄飄myl |