當前位置:
首頁 > 知識 > opencv實時識別指定物體

opencv實時識別指定物體

一. 引入

opencv人臉識別大家應該都聽說過,本篇目的是利用opencv從視頻幀中識別指定的物體,並框出來,且可以保存截取到的物體圖片,會將整個流程都講一下,包括訓練自己的分類器,使用訓練好的分類器進行識別。這裡以識別舌頭為例。

二. 環境:

1. python 3.6.3

2. opencv 3.4.0

三. 訓練自己的分類器

1. 注意點:訓練集分為正樣本,負樣本,樣本全部為灰度圖片,正樣本圖片尺寸需要固定,一般40*40左右即可,大了電腦跑不動,負樣本尺寸不固定,負樣本數量要比正樣本多才行,少了有問題。

圖片批量縮小工具下載:鏈接:https://pan.baidu.com/s/1pMAp19p 密碼:vpp1

圖片批量灰度處理:使用美圖秀秀

2. 正樣本製作,使用美圖秀秀將舌頭的圖片全部裁剪出來(尺寸一致為:40*40的),保存到一個文件夾pos中,當然可以先用大尺寸正方形框進行裁剪,然後再用圖片縮小工具進行制定尺寸縮小。最後再用美圖秀秀批量灰度化。

附上名字自動有序化Java代碼:

[java] view plain copy

  1. String path = "C:\Users\Administrator\Desktop\pos";
  2. File f =

    new

    File(path);
  3. File[] files = f.listFiles();
  4. for

    (File file : files) {
  5. i++;
  6. file.renameTo(

    new

    File(path+i+"."+file.getName().split("\.")[1]));

  7. }

處理後得到如下所示圖片:

opencv實時識別指定物體

3. 負樣本製作:如上操作類似,不過這裡不要求尺寸一樣,但是負樣本圖片中一定不要包含待識別的區域(如這裡的:舌頭)

如下所示:

opencv實時識別指定物體

4. 生成樣本資源記錄文件:

a. 正樣本資源記錄文件

新建pos文件夾,將正樣本的灰度圖拷貝進去

使用JAVA代碼生成正樣本資源記錄文件:

[java] view plain copy

  1. String path = "E:\tools\python\eclipse\work\pythonTest\demo\0202\img\train\tongue\pos";
  2. File txtfile =

    new

    File(path+"pos.txt");
  3. FileOutputStream fos =

    new

    FileOutputStream(txtfile);
  4. PrintWriter pw =

    new

    PrintWriter(fos,

    true

    );
  5. String s = "";
  6. File[] files =

    new

    File(path).listFiles();
  7. for

    (File file : files) {
  8. pw.println("pos/"+file.getName()+" 1 0 0 40 40");
  9. }

生成後刪除最後一行的帶有(pos.txt)的內容,讓正樣本資源記錄文件內容如下類似所示:

opencv實時識別指定物體

(1 0 0 40 40)分別指代: 數量 左上方的坐標位置(x,y) 右下方的坐標位置(x,y)

處理好後,將pos.txt 移動到上一級文件夾

b. 負樣本資源記錄文件

新建neg文件夾,將負樣本的灰度圖拷貝進去

使用JAVA代碼生成負樣本資源記錄文件:

[java] view plain copy

  1. String path = "E:\tools\python\eclipse\work\pythonTest\demo\0202\img\train\tongue\neg";
  2. File txtfile =

    new

    File(path+"neg.txt");
  3. FileOutputStream fos =

    new

    FileOutputStream(txtfile);
  4. PrintWriter pw =

    new

    PrintWriter(fos,

    true

    );
  5. String s = "";
  6. File[] files =

    new

    File(path).listFiles();
  7. for

    (File file : files) {

  8. pw.println("neg/"+file.getName());
  9. }

生成後刪除最後一行的帶有(neg.txt)的內容,讓負樣本資源記錄文件內容如下類似所示:

opencv實時識別指定物體

處理好後,將negtxt 移動到上一級文件夾

得到如圖所示文件夾結構:

opencv實時識別指定物體

5. 使用opencv提供的opencv_createsamples.exe程序生成樣本vec文件,新建批處理文件:createsamples.bat

內容如下:

[python] view plain copy

  1. opencv_createsamples.exe -vec pos.vec -info pos.txt -num 25 -w 40 -h 40
  2. pause

說明:25是正樣本圖片的數量 40 40 是正樣本圖片的寬高

這些參數的詳細解釋:http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/user_guide/ug_traincascade.html

運行後會生成 pos.vec文件

6. 使用opencv提供的opencv_traincascade.exe程序訓練分類器,新建xml文件夾,再新建批處理文件:LBP_train.bat

內容如下:

[python] view plain copy

  1. opencv_traincascade.exe -data xml -vec pos.vec -bg neg.txt -numPos 25 -numNeg 666 -numStages 10 -w 40 -h 40 -minHitRate 0.999 -maxFalseAlarmRate 0.2 -weightTrimRate 0.95 -featureType LBP
  2. pause

說明: 25是正樣本圖片的數量 666是負樣本圖片的數量 numNeg是層級數 40 40是訓練樣本的寬高 .....

具體參數解釋請查看文檔:http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/user_guide/ug_traincascade.html

運行後會在xml文件夾生成如下文件:

opencv實時識別指定物體

其中cascade.xml是我們需要使用的分類器

四 . 測試訓練好的分類器

[python] view plain copy

  1. """""
  2. Created on 2018年2月2日
  3. 實時人臉檢測
  4. @author: nuohy
  5. """
  6. import

    cv2
  7. # 載入opencv自帶的人臉分類器
  8. # faceCascade = cv2.CascadeClassifier("haarcascade_frontalface_alt2.xml")
  9. # faceCascade.load("E:/python/opencv/opencv/sources/data/haarcascades/haarcascade_frontalface_alt2.xml")
  10. faceCascade = cv2.CascadeClassifier("cascade.xml")
  11. faceCascade.load("E:/tools/python/eclipse/work/pythonTest/demo/0202/img/train/tongue/xml/cascade.xml")
  12. cap = cv2.VideoCapture(0)
  13. flag = 0
  14. timeF = 10
  15. while

    True:
  16. flag+=1
  17. ret, frame = cap.read()
  18. img = frame.copy()
  19. gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
  20. rect = faceCascade.detectMultiScale(
  21. gray,
  22. scaleFactor=1.15,
  23. minNeighbors=3,
  24. minSize=(3,3),
  25. flags = cv2.IMREAD_GRAYSCALE
  26. )
  27. for

    (x, y, w, h)

    in

    rect:
  28. cv2.rectangle(frame, (x, y), (x+w, y+h), (0, 255, 0), 2)
  29. #識別到物體後進行裁剪保存
  30. #jiequ = img[x:(x+w), y:(y+h)]
  31. #cv2.imwrite("E://tools//python//eclipse//work//pythonTest//demo//0202//img//save//"+str(flag) + ".jpg",jiequ) #save as jpg
  32. #讀取到保存圖片
  33. # if(flag%timeF==0):
  34. # cv2.imwrite("E://tools//python//eclipse//work//pythonTest//demo//0202//img//save//"+str(flag) + ".jpg",frame) #save as jpg
  35. cv2.imshow("frame", frame)
  36. if

    cv2.waitKey(1) & 0xFF == ord("q"):
  37. break

  38. cap.release()
  39. cv2.destroyAllWindows()

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 程序員小新人學習 的精彩文章:

RDF 的實例
網站主機提供商

TAG:程序員小新人學習 |