當前位置:
首頁 > 最新 > 如何使數字圖片分類任務的準確率達到99%以上?

如何使數字圖片分類任務的準確率達到99%以上?

任務描述:訓練模型,識別圖片上的手繪數字。

數據集描述:數據集train.csv和test.csv包含從0-9的手繪數字的灰度圖像,每張圖片為28×28 = 784個像素值,像素值的範圍在0-255之間。

train.csv文件:一共785=(1+784)列,第一列稱為「標籤」,即手繪圖片上的數字,其餘列為與標籤對應的像素值。

test.csv文件:與train.csv文件相同,只是不含有標籤列。

提交文件應採用以下格式:對於測試集中的每個圖像,輸出一行,其中包含圖像標識ID和您預測的數字例如,如果您預測第一張圖像是3,第二張圖像是7,第三張圖像是8,那麼您的提交文件將如下所示:

ID,label

1,3

2,7

3,8

本文使用的深度學習框架

tensorflow-gpu版本:1.2.0

keras版本:2.1.6

建立模型

Step 1:導入要用的包

Step 2:讀取數據

Step 3:查看數據集

Step 4:查看數據集分布是否平衡及是否有缺失值

對每一類圖片進行數量統計

train_y.value_counts()

查看數據集是否有缺失值

train_x.isnull().any().describe()

Step 5:數據歸一化和重整數據集

Step 6:將類別標籤轉化成one-hot編碼

Step 7:劃分train_x數據集為訓練集和驗證集

Step 8:建立CNN模型

Step 9:運行模型

Step 10:畫出訓練集和驗證集的準確率和損失圖

Step 11:畫出混淆矩陣

Step 12:展示預測錯誤的結果

思考:如何進一步改進模型?

Step 13:對測試集做預測


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 計算材料學與大數據 的精彩文章:

TAG:計算材料學與大數據 |