視頻廣告段落檢測——從一個偏門說計算機視覺的發展歷史

最新 05-08

先加個宣傳，請大家通過下面二維碼關注大話計算機視覺公眾號。關注發送「資源共享」可以或者電子書，論文，訓練數據集等持續更新數據

視頻內容的語義分析是CV重要的一個技術分支，根本的目的是要讓計算機了解這段視頻中究竟發生了什麼。基於不同的視頻類型會產生不同的關注點，進一步決定了採用不同的技術，從監控視頻中對於人、車的檢測、識別、跟蹤、行為的分析，到新聞視頻的拆分、搜索，以及到體育視頻的精彩片段分析等，每一個門類都有各自的側重點以及對應的技術。本文所講述的卻是一個不太為人們所熟知的領域——視頻廣告段落的檢測，希望通過對於之前技術的回顧，去聊一下CV的技術是如何讓計算機去了解視頻的。

在介紹整篇文章之前我們整體看一下廣告去除的歷史:

這和現在其它的CV類的發展歷史很類似，大家即使不做廣告去除也可以從這篇文章中的內容和自己的研究內容發展歷史做對比

視頻廣告段落的檢測的目的是為了在電視播出的信號中自動檢測出廣告段落出現的位置，後續將這些位置中的視頻廣告自動進行濾除，已達到記錄完整電視節目的目的。從應用場景來看，一些將電視信號進行轉錄的視頻公司，往往會利用這類技術實現自動化的視頻生產，節省人工工作；而對於一般用戶來講，利用智能機頂盒錄製回溯電視節目時，也不希望受到廣告的打擾，需要自動將這些廣告濾除；但隨著互聯網技術的興起，人們可以通過視頻網站越來越快的獲取視頻資源，這方面的需求逐漸變成了一個偽需求。

但是現在國內的上傳視頻，和一些提供下載的視頻中還是有大量摻雜的廣告。這對於視頻共享網站和一些本地觀看視頻的用戶依然造成了很大困擾。因此檢測視頻廣告還是有很大市場的。

從技術角度看，廣告檢測技術的難點在於樣本的多樣性以及不規律性，廣告製作者會利用各種不同的創意、風格以及技術手段去製作廣告，這導致了廣告並不是一種結構化很強的視頻格式，給計算機的理解帶來了很大的難度。回顧這類技術的相關文獻，依照其設計原理的不同可以大致分為三種方法，即基於規則的方法（Rule-based Methods）、基於重複識別的方法（Repeatedly Recognition-based Methods）以及基於學習的方法（Learning-basedMethods）。

基於規則的方法[1]-[11]是一種較早運用於視頻廣告段落檢測的方法。該技術主要是利用各國電視台監管部門制定的視頻廣告播放的特殊規定或是依據某類特定節目的播放規律，對廣告與普通電視節目進行區分。例如一些西方國家在播放廣告時規定：電視台必須在每個獨立的廣告之間插入一些黑色的單色幀（Monochrome Frame）並配以靜音效果（稱為黑幀與靜音幀），以便於分割獨立廣告（如圖3所示）。一些早期的基於規則的方法[1]-[6]正是利用在一定時間內出現的黑幀與靜音幀的頻率來判定所播放的內容是否屬於廣告，同時基於廣告短時間內視覺變化劇烈的特性，引入鏡頭切換頻率、時域邊緣變化比以及運動向量等特徵，加強對廣告鏡頭與非廣告鏡頭的分類。

圖3西方國家中視頻廣告段落播放時需插入單色幀與音頻靜音幀示意圖

而另一些具有代表性的工作[7]-[9]利用西方電視台在播放普通節目時會在固定位置顯示自己的電視台標識（Logo），而當播放廣告時則會將這種標識隱去的規定，將自動廣告檢測轉化為電視台標識跟蹤的問題。Albiol等人[7]-[8]就利用視頻畫面的四個角部的梯度變化信息實現對透明與半透明的台標檢測，並藉助於HMM結合鏡頭長度信息對節目中的台標的消隱情況進行跟蹤，從而確定廣告段落的位置。

雖然上述這類方法在廣告段落檢測過程中取得了平均90%以上的正確率，同時也已有部分西方國家，採用這些技術開發了相應的廣告檢測軟體，如MythTv[10]及CompSkip[11]等，但其卻存在著明顯的技術不足：第一，該方法過分依賴於電視台在播放廣告時的所採用的各種規則，來判斷視頻流中是否存在視頻廣告。對於某一特定電視台來說，即便開發出對應的檢測演算法，如果由於國家政策法規的改變造成電視台播放策略的變化，也會使得現有方法失效。因此該類方法的魯棒性較差。第二，該類方法缺乏可移植性與普適性，由於各個電視台、各個國家和地區之間的規則不同，很難形成一種通用的檢測方法，開發出的系統只能適用與特定國家和地區的特定頻道。例如我國大陸地區，據目前掌握的信息，尚無任何管理部門要求在播放視頻廣告時，電視台需要添加黑幀和靜音幀或者隱去台標和字幕，上述方法都無法對我國大陸地區的視頻廣告進行檢測。

基於重複識別的方法[12]-[19]在技術層面上，其本質是視頻拷貝檢測(duplicatedetection)技術在廣告段落檢測領域中的一種應用。對於拷貝檢測技術而言，一般會從更加魯棒的視頻描述子或者大規模索引的方向進行更深入的研究，但目前來看視頻廣告技術中出於對使用場景的不同考量，僅僅是其簡單的應用。基於重複識別的方法出發點是根據視頻廣告會在一定時間內大量重複播出；而普通電視節目重複播放次數較少的特性，在視頻流中尋找大量重複播放的視頻，並根據一定的規則，如重複視頻播放頻率等，判定其屬於廣告還是重播的電視節目；或者預先建立一個視頻廣告的資料庫，通過視頻廣告的資料庫對視頻流中出現的廣告進行識別。

Gauch等人[12]-[13]的工作就是利用這種重複播放的特性，實現對於72小時連續電視信號的廣告檢測。其中的主要工作是利用RGB三個通道中獲得的全局、水平以及垂直方向的27維顏色矩信息描述視頻信號中每個鏡頭的內容，並通過哈希表技術將前24小時的廣播視頻的描述子進行索引，而對於後48小時待檢測視頻的描述子，將其映射到對應的條目中，尋找這些描述子對應的拷貝。對於滿足時間約束條件的重複拷貝，該方法根據視頻廣告畫面變化劇烈的特性，利用K最近鄰（K-NearestNeighbor, K-NN）演算法對這些重複拷貝中提取出的五種視覺特徵（如強切變率，黑幀率等）進行分類，從而確定這些重複播放的視頻哪些屬於廣告。而Berrani等人[15]則將視頻的拷貝檢測轉化為相似特徵的聚類問題。他們利用視頻幀空間信息的DCT變換係數構成視頻描述子，並利用BIRCH聚類演算法對每個鏡頭的關鍵幀所提取出的描述子進行聚類，將每個滿足時域信息約束的聚類作為一個重複出現的廣告鏡頭，而未被聚類的局外描述子（Outliers）被作為正常節目。

雖然這類方法具有較高的識別率與檢測速度，但其缺點亦非常明顯：首先，廣告投放者每天都會推出新穎的視頻廣告，一部分廣告也會在商品推廣期結束後停止播出。如何實現對於在線建立的重複資料庫的動態更新成為該類技術是否可持續發展的關鍵問題。其要求，可以對退出播放周期的廣告進行及時的刪除，減少在線檢測過程中匹配的規模與複雜度；而對於新播出的廣告應及時添加到資料庫中，以避免漏檢。目前尚未有工作在這方面提出良好的解決策略。其次，對於最新播出的廣告，該類技術不會做出及時的響應，只能夠通過一段時間的觀察，獲得該樣本信息並進行回溯，這種情況在一定程度上限制了其作為在線實時廣告段落檢測技術的應用。第三，對於重複播放次數的閾值設置的混淆，極易造成對於廣告段落檢測的漏檢與誤檢。本類技術並未過多分析廣播視頻中包含的語義特性，僅僅簡單基於廣告在一定時間內重複播放的特點。但在實際數據檢測過程中，一些電視節目也會多次重播，而部分廣告也會由於廠商經濟條件的限制，僅選擇在部分時段播放少量幾次，甚至低於某些節目的重播次數。因此對於重複播放到何種程度才可以判別為視頻廣告的規則的設定就顯得尤為重要，如果設置不當極易造成虛警。但是由於該類技術普遍具有較高的正確率，其仍可作為廣告段落檢測方法的一個重要補充，結合其他類型的檢測方法，為可靠決策提供判斷依據。

為了克服上述兩類技術中存在的問題，人們提出一種基於學習的廣告段落檢測方法[20]-[38]，通過搜集大量的廣告樣本，挖掘其中視頻廣告區別於普通節目的語義特性，如強烈的視覺變化、快速的音樂切換、文本變化等，構成描述廣告的中層特徵；在此特徵基礎上利用各種機器學習方法訓練分類模型，作為在線檢測過程中的判斷準則，以判斷未知鏡頭的所屬類別。

如Hua等人[23]在六種視覺（如邊緣變化率、幀間變化的均值與方差）與五種音頻基本特徵（如音頻場景（Audio Break Detection）、音頻種類檢測（Audio Type Discrimination）的基礎上，結合廣播視頻鏡頭之間的時域信息（如圖3所示），提出了基於視頻上下文信息的音視頻描述子；並藉助支持向量機（Support Vector Machine，SVM）構造分類模型；同時引入了後處理機制，實現廣告片斷的合併與拆分。而Mizutani等人[99]通過提取視頻場景變化位置附近一定時域窗口內的視頻視覺（如場景切換率（Scene Change Rate），黑幀變化率（Blank Frame Rate）視頻文本位置信息（Text Location Indicator）等）、音頻特性（如音頻類別直方圖（AudioClass Histogram））的變化規律，採用了兩層分類器級聯的分類方法實現鏡頭分類，即，在第一層利用支持向量機及隱馬爾科夫模型對各獨立特徵進行分類，在第二級利用SVM實現最終的融合。T. Y. Liu等人[25]通過對廣播視頻的觀察，提出一種廣告鏡頭的時間關聯（Temporal Coherence）的特性，即：廣告鏡頭總是成段落連續出現且段落中不會包含單獨的正常節目鏡頭；為了充分利用這種特性，其結合AdaBoost提出一種時域約束AdaBoost（Time Constraint AdaBoost）分類模型，在分類器訓練過程中結合鏡頭序列的時間關聯性影響樣本權重的分布，達到提高分類器泛化能力的目的；並以幀差、鏡頭切換頻率、音頻能量等信息作為特徵，進行判別。

N.Liu等人[35]提出一種基於視覺-音頻-文本模態交互融合的視頻廣告段落檢測技術，在構造特徵描述子方面：通過對大量廣告的觀察，發現其視覺、音頻以及文本模態在播放過程中均與正常節目，有很大區別。由於廣告要在有限的時間內向觀眾傳達產品以及服務內容，強化對廣告的記憶，廣告經常使用動態鏡頭並且進行大量色彩、目標的切換，並常常伴隨背景音樂、高分貝的人聲、說話人之間快速切換等音頻特性，尤其是廣告中文本出現的位置、字體、數量較之於正常節目具有很大的隨機性。在常用的視覺與音頻模態外，提出一種基於廣告中視頻文本屬性時空域變化的文本特徵，先利用文本檢測演算法定位鏡頭關鍵幀中文本的出現位置，計算時域空間中文本位置，數量面積的變化特性，作為文本層面的特徵。並利用交互集成學習融合機制，尋找各模態之間的聯繫，實現對多模態內容的理解，進而對視頻廣告片段與非廣告片段進行有效判別。

圖6視頻廣告、新聞以及電視劇中視頻文本隨時間變化模式的示意圖

提到基於學習的方法，就繞不開傳統方式和深度學習之間的對比，上文介紹的所有基於分類的廣告檢測演算法全部基於人工設定的特徵，配合對應的分類器進行判斷，屬於傳統的機器學習的分類範疇。而目前通過對於現有論文的調研，尚未發現有關將深度的模型直接應用於廣告檢測領域的論文與嘗試，從技術角度來看並不是現有的C3D，I3D網路模型不適用於此類問題，恐怕更主要的原因還是在於難於收集到可以真正訓練網路的數據集；也期待可以看到深度模型可以更好的解決此中分類問題。

通過上述對於廣告檢測技術的分類，我們可以大致了解到，我們是如何讓計算機去理解這個視頻的，早期手段是通過對於視頻中規律的一些總結與抽象，提取到某類或是某些視頻的一些通用的規則，並將這些規則轉化為計算機可以理解的客觀性的判斷標準，例如出現了黑幀，logo消失，重複播放出現等，但往往這種高級抽象出來的標準並不能適用於各種情況，人們開始考慮尋找一些通用的模式識別的方式去解決問題。

人們通過對於某類樣本的觀察，設計一系列具有樣本類間區分度的特徵，這種特徵可以是通過圖像像素、或是音頻數據按照某種方式以及規律計算得來的（例如直方圖的變化率，頻譜的變化率等），也可以是通過某種演算法檢測獲得到一些基本目標信息後，在這個基礎上再次抽象出來的所謂中層特徵（mid-level feature）（例如文本變化的信息），並配合各種分類器以及多模態融合方法去解決問題。所提到這些特徵並不是一種像前者一樣的絕對有效的特徵，而是一種對於某類中大多數樣本具有一定區分度的一種描述（比如，對於廣告來說廣告的文本位置變化劇烈且集中在視頻幀中間位置，而普通節目中文本位置基本不變，維持在視頻底部，但也均能在實際的樣本中找出部分負例），通過一定量樣本以及足夠種類的特徵，分類器去學習這些特徵構成空間中的一個最優分類的方式，並對未知的同樣的特徵進行類別的判斷。這類方法設計的初衷在於人，而人與機器的理解存在著比較大的語義鴻溝，同時從資訊理論的角度來說通過各種特徵提取的手段，必然損失了數據中的信息；總結起來，說人話的意思就是，你認為合適的特徵表達機器並不認為合適，你通過演算法提取出了特徵，但可能將機器認為重要的部分進行了丟棄，因此這種類型的演算法在其他領域。例如ImageNet比賽中已經被證實要比基於深度學習的方法要差。

基於深度學習的方法，可以簡單的理解為，將所有的圖像，視頻片段，音頻片段放入卷積網路中，由這個網路提取有用的特徵，並實現端到端的分類，檢測以及回歸。深度學習的基礎是神經網路，也是一種很早就出現的機器學習方法，但在SVM橫行的年代，並沒有得到足夠的重視。隨著GPU計算能力的上升以及利用卷積代替大量的全連接層，使得深度學習的實際計算成為了可能，另一方面前段卷積層代替全連接層的應用也使得其可以利用局部空間信息提升特徵的表達能力，2012年以後深度學習出現了井噴式的發展，從AlexNet到ResNet，DenseNet,網路變得更深以及更廣，性能變得越來越高，橫掃很多傳統的CV方法。在CV領域，你沒有用過深度學習真的不好意思和別人打招呼。但現在的技術或者應用層面上的困惑似乎變為了對於大量標註數據的極度依賴，之前對於傳統分類方法幾W量級的數據量，在深度模型面前變成了前菜，很多公司都形成了一定規模的人工標註團隊或是將任務外包。而對於一些相對偏門的應用，也似乎少了那麼一些關注。

後面有大量參考論文

先加個宣傳，請大家通過下面二維碼關注大話計算機視覺公眾號。關注發送「資源共享」可以或者電子書，論文，訓練數據集等持續更新數據

[1]R.Lienhart, C. Kuhmiinch, and W. Effelsberg. On the detection and recognition oftelevision commercials. Technical Report, University of Mannheim, 1996,http://madoc.bib.uni-mannheim.de/madoc/volltexte/2004/800/pdf/TR-96-016.pdf.

[2]R.Lienhart, C. Kuhmiinch, and W. Effelsberg. On the detection and recognition oftelevision commercials. In Proc. of the 1997 IEEE International Conference onMultimedia Computing and Systems, (ICMCS 1997), Ottawa, Canada, 1997, USA,IEEE, 1997, pp.: 509-516.

[3]A.G. Haupmann and M. J. Witbrock. Story segmentation and detection of commercialsin broadcast news video. In Proc. of the 1998 IEEE International Forum onResearch and Technology Advances in Digital Libraries (ADL 1998), SantaBarbara, USA, 1998, USA, IEEE Computer Society, 1998, pp.:22-24.

[4]D.A. Sadlier, S. Marlow, N. O"Connor, and N. Murphy. Automatic TV advertisementdetection from MPEG bitstream. In Proc. of the 1st International Workshop onPattern Recognition in Information Systems (PRIS 2001), Setúbal, Portugal,2001, Portugal, ICEIS, 2001, pp.:14-25.

[5]D.A. Sadlier, S. Marlow, N. O"Connor, and N. Murphy. Automatic TV advertisementdetection from MPEG bitstream. Pattern Recognition, 2002, vol. 35(12), pp.:2719-2726.

[6]N.Dimitrova, S. Jeannin, J. Nesvadba, T. McGee, L. Agnihotri, and G. Mekenkamp.Real time commercial detection using MPEG features. In Proc. of the 9thInternational Conference on Information Processing and Management ofUncertainty in Knowledge-based Systems (IPMU 2002), Annecey, France, 2002,Berlin, Springer, 2002, pp.: 481-486.

[7]A.Albiol, M.J.C. Fulla, A. Albiol, and L. Torres. Commercial detection usingHMMs. In Proc. of the 5th Workshop on Image Analysis for Multimedia InteractiveServices (WIAMIS 2004), Portugal, 2004, USA, IEEE Computer Society, 2004,pp.:1-4.

[8]A.Albiol, M. J. C., Fulla, A. Albiol, and L. Torres. Detection of TV commercials.In Proc. of the 2004 IEEE International Conference on Acoustics, Speech, andSignal Processing (ICASSP 2004), Montreal, Canada, 2004, USA, IEEE, 2004, vol.3, pp.: 541-544.

[9]K.Sch?ffmann, M. Lux, and L. B?sz?rmenyi. A novel approach for fast and accuratecommercial detection in H.264AVC bit streams based on logo identification. InProc. of the 15th International Multimedia Modeling Conference on Advances inMultimedia Modeling (MMM 2009), Sophia Antipolis, France, 2009, Berlin, Springer,2009, pp.:1-9.

[10]MythTv[Online]. Available: http://www.mythpvr.com/mythtv/taxonomy/term/4/ .

[11]Comskip[Online]. Available:http://www.kaashoek.com/comskip/.

[12]J.M. Gauch and A. Shivadas. Identification of new commercials using repeatedvideo sequence detection. In Proc. of the 2005 International Conference onImage Processing (ICIP 2005), Genoa, Italy, 2005, USA, IEEE, 2005, vol. 3,pp.:1252-1255.

[13]J.M. Gauch and A. Shivadas, Finding and identifying unknown commercials usingrepeated video sequence detection. Computer Vision and Image Understanding,2006, vol. 103(1), pp.: 80-88.

[14]Z.Zeng, S.W. Zhang, H. B. Zheng, and W. Y. Yang. Program segmentation in atelevision stream using acoustic cues. In Proc. of the International Conferenceon Audio, Language and Image Processing 2008 (ICALIP 2008), Shanghai, China,2008, USA, IEEE, 2008, pp.: 748-752.

[15]S.A.Berrani, G. Manson, and P. Lechat. A non-supervised approach for repeatedsequence detection in TV broadcast streams. Image Communication, 2008, vol. 23(7), pp.: 525-537.

[16]J.Wedin. Commercial detection based on audio repetition [Dissertation]. Sweden,Lule? University of Technology, 2008.

[17]X.Naturel and P. Gros. Detecting repeats for video structuring. Multimedia Toolsand Applications, 2008, vol. 38(2), pp.: 233-252.

[18]I.D?hring and R. Lienhart. Mining TV broadcasts for recurring video sequences. InProc. of the 8th ACM International Conference on Image and Video Retrieval(CIVR 2009), Santorini Island, Greece, 2009, USA, ACM, 2009, pp.:1-8.

[19]X.Naturel, and S. A. Berrani. Content-based TV stream analysis techniques towardbuilding a catch-up TV service. In Proc. of the 11th IEEE InternationalSymposium on Multimedia (ISM 2009), San Diego, USA, 2009, USA, IEEE ComputerSociety, 2009, pp.: 412-417

[20]G.Wei, L. Agnihotri, and N. Dimitrova. TV program classification based on faceand text processing. In Proc. of the 2000 IEEE International Conference onMultimedia and Expo (ICME 2000), New York, USA, 2000, USA, IEEE ComputerSociety, 2000, vol.3, pp.: 1345-1348.

[21]L.Agnihotri, N. Dimitrova, and T. McGee, S. Jeannin, D. Schaffer, and J.Nesvadba. Evolvable visual commercial detector. In Proc. of the 2003 IEEEComputer Society Conference on Computer Vision and Pattern Recognition (CVPR2003), Madison, USA, 2003, USA, IEEE, 2003, vol. 2, pp.: 79-84.

[22]P.Duygulu, M. Y. Chen, and A. Hauptmann. Comparison and combination of two novelcommercial detection methods. In Proc. of the 2004 IEEE InternationalConference on Multimedia and Expo (ICME 2004), Taipei, China, 2004, USA, IEEEComputer Society, 2004, vol. 2, pp.: 1267-1270.

[23]X.S. Hua, L. Lu, and H. J. Zhang. Robust learning-based TV commercial detection.In Proc. of the 2005 IEEE International Conference on Multimedia and Expo (ICME2005), Amsterdam, Netherlands, 2005, USA, IEEE Computer Society, 2005,pp.:149-152.

[24]M.Mizutani, S. Ebadollahi, and S. F.Chang. Commercial detection in heterogeneous video streams using fusedmulti-modal and temporal features. In Proc. of the 2005 IEEE InternationalConference on Acoustics, Speech, and Signal Processing (ICASSP 2005),Philadelphia, USA, 2005, USA, IEEE, 2005, vol. 2, pp.: 157-160.

[25]T.Y. Liu, T. Qin, and H. J. Zhang. Time-constraint boost for TV commercialsdetection. In Proc. of the 2004 International Conference on Image Processing(ICIP 2004), Singapore, 2004, USA, IEEE, 2004, vol. 3, pp.:1617-1620.

[26]M.Montagnuolo and A. Messina. TV genre classification using multimodalinformation and multilayer perceptrons. In Proc. of the 10th Congress of theItalian Association for Artificial Intelligence and Human-Oriented Computing,Italy, 2007, Berlin, Springer, 2007, pp.:730-741.

[27]L.Zhang, Z. F. Zhu, and Y. Zhao. Robust commercial detection system. In Proc. ofthe 2007 IEEE International Conference on Multimedia and Expo (ICME 2007),Beijing, China, 2007, USA, IEEE Computer Society, 2007, pp.: 587-590.

[28]X.Wang and Z. M. Guo. A novel real-time commercial detection scheme. In Proc. ofthe 3rd International Conference on Innovative Computing Information andControl (ICICIC 2008), Dalian, China, 2008, USA, IEEE Computer Society, 2008,pp.:536-539.

[29]Z.Liu. Commercial detection in program videos. In Proc. of the 2009 InternationalForum on Computer Science-Technology and Applications (IFCSTA 2009), Chongqing,China, 2009, USA, IEEE, 2009, pp.:107-110.

[30]M.Montagnuolo and A. Messina. Parallel neural networks for multimodal video genreclassification. Multimedia Tools and Applications, 2009, vol. 41(1),pp.:125-159.

[31]B.Satterwhite and O. Marques. Automatic detection of TV commercials. IEEEPotentials, 2004, vol. 23(2), pp.:9-12.

[32]S.A. Berrani, P. Lechat, and G. Manson. TV broadcast macro-segmentation:metadata-based vs. content-based approaches. In Proc. of the 6th ACMInternational Conference on Image and Video Retrieval (CIVR 2007), Amsterdam,Netherlands, USA, ACM, 2007, pp.:325-332.

[33]N.Liu, Y. Zhao, and Z. F. Zhu, and R. R. Ni. Commercial shot classification basedon multiple features combination. IEICETransaction on Information and System, 2010, Vol.E93-D (9), pp.: 2651-2655.

[34]N.Liu, Y. Zhao, and Z. F. Zhu, and H. Q. Lu. Multi-modal characteristics analysisand fusion for TV commercial detection. In Proc. of the 2010 IEEE InternationalConference on Multimedia and Expo (ICME 2010), Singapore, 2010, USA, IEEEComputer Society, 2010, pp.: 831-836.

[35]N.Liu, Y. Zhao, and Z. F. Zhu, and H. Q. Lu. Exploiting visual-audio-textualcharacteristics for automatic TV commercial block detection and segmentation.IEEE Transactions on Multimedia, 2011，vol.13, issue5, pp.961 - 973。

[36]R.Kannao, P. Guha. TV advertisement detection for news channels using LocalSuccess Weighted SVM Ensemble, Annual IEEE India Conference,2015

[37]J.Q. Wang, M. Xu, H.Q. Lu，I. Burnett，ActiveAd: A novel framework of linking advideos to online products, Neurocomputing, Volume 185, 12, 2016, pp. 82-92.

[38]R.Kannao, P. Guha. TV Commercial Detection Using Success Based Locally WeightedKernel Combination, International Conference on Multimedia Modeling 2016,pp793-805

請大家通過二維碼關注大話計算機視覺公眾號。關注發送「資源共享」可以或者電子書，論文，訓練數據集等持續更新數據

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 大話計算機視覺 的精彩文章:

TAG:大話計算機視覺 |