當前位置:
首頁 > 最新 > YouTube是如何推薦視頻?人工智慧演算機制大揭秘!

YouTube是如何推薦視頻?人工智慧演算機制大揭秘!

YouTube用戶每日觀看小時數高達10億小時,而每分鐘就有超過500小時的視頻被上傳到YouTube平台中。其數據量之大,若真的要做到每位YouTube用戶的個性化推薦與設計,的確有一定的難度。

對此,YouTube工程研發副總裁克里斯多·古德羅(Cristos Goodrow)說明,YouTube的工作之一,就是幫助用戶在大量內容中主動提供他們想看的,從而改善他們的服務體驗、提高其滿意度,而至今全球YouTube用戶的觀看時間高達7成來自推薦視頻。

而針對平台服務方面,谷歌也分享了YouTube優化平台服務的三大曆程:

第一階段(2011年-2012年):「觀看時長」才是演算法的重點

早在2011年,YouTube就留意到使用者的觀看次數並不能真實反應出推薦的內容是否符合用戶需求,因此這段時間,YouTube將重點放在「觀看時長」(Watchtime)。雖然這麼做導致了觀看次數在一天內下降20%,但觀看時間卻從平均120秒提高到140秒,而如今證實這個想法是正確的,在2017年,YouTube上用戶每日觀看視頻總時數已經達到10億小時。從觀看次數轉為觀看時數,代表YouTube更看重使用者的黏著度,也就是用戶可能感興趣的內容。

第二階段(2014年-2015年):人工智慧讓個人化視頻推薦更精準

隨著移動用戶的急劇攀升,當時已有超過60%的YouTube觀看時間發生在智能手機和平板計算機上。為此,YouTube在這段時間針對移動裝置進行優化,比方說在移動版中加入「再看一次」(Watchit Again)的功能;同時調整了首頁頁面的排版方式;同時透過谷歌大腦(GoogleBrain)團隊導入人工智慧技術,強化了人工智慧推薦系統、提升視頻推薦機制的準確,使到推薦視頻更加個人化。

第三階段(2016年-2017年):用戶介面個人化

隨著機器學習技術的成熟發展,讓開發團隊可以作出更多事情,YouTube在2016年至2017年內推出了超過190個更新。為了維持使用者觀影新鮮感、提高滿意度,YouTube持續優化個人使用體驗,確保每個人都獲得最新、最熱門的內容推薦;同時,YouTube也將「個人化」的概念應用至使用者頁面,並於2016年推出更新的YouTube移動版首頁,介面設計比以往都更乾淨簡潔,也在首頁顯示與用戶更相關的YouTube個人化推薦視頻。

針對YouTube優化方面,「YouTube搜尋與探索團隊」隨時在YouTube上準備高達100小時觀眾感興趣的視頻內容,並在YouTube首頁上每天推薦高達2億個不同類型的視頻,涵蓋了76種不同語言,讓所有用戶都感受到YouTube真的了解他們的喜好,其成果就是「超過七成的觀看時間是來自觀看YouTube自動推薦的視頻內容」。若與三年前相比,使用者在YouTube首頁點擊推薦視頻的觀看時間成長了20倍。

由於每分鐘有超過500小時的視頻被上傳到YouTube,因此推薦系統必須對最新上傳的視頻以及使用者最新行為擁有相當的反應能力。同時,從不斷為使用者開發多元內容的角度來看,推薦系統也希望能平衡新的視頻內容和現存的內容,作出更適合用戶的推薦。

為此,谷歌這兩年積極使用所謂TensorFlow的人工智慧系統,TensorFlow是谷歌於2015年研發的人工智慧學習系統,像是Gmail、谷歌相簿、谷歌翻譯等都有其影子。在YouTube用戶推薦系統當中,用戶喜歡及不喜歡的視頻都是訓練數據,包括:使用者直接在視頻下方點擊「我喜歡」或「我不喜歡」的按鈕,或其他隱性回饋訊號,例如用戶完整看完一段視頻等,都將會被TensorFlow基礎上的學習視頻推薦系統所讀取。

古德羅指出,為了提供更好的用戶推薦,團隊搭建置了結合候選生成模型(Candidate Generation Model)與排名模型(Ranking Model)這兩個神經網路的推薦系統。前者將數百萬個視頻數據縮小分成多個數百個與用戶相關視頻的數據子集,這些資料子集把許多變因都考慮進去,包括:瀏覽歷史、搜尋歷史以及人口變項信息(如年齡等)。而後者則會透過提名特徵(Nominating Features)來下評分訊號的權重(Scoring Signals),相關熱門推薦視頻評分結果判斷標準如下:

人口統計信息(Demographic information),例如地理位置

最受歡迎的視頻(Most popular videos)

用戶和視頻所使用的語言

近期觀看紀錄

使用者和該視頻頻道的過往連結

至於智能判斷視頻內容,並下架不雅內容這方面,主要來自YouTube認為「恐怖主義和暴力極端主義內容不應在網路上散播」,因此2017年六月開始將人工智慧應用在辨識視頻內容上。

古德羅又指,過去團隊僅依賴YouTube用戶主動檢舉不當內容,再由YouTube小組依規定進行審核、移除違反社群規範的內容,或是加上年齡限制等設定。過往的做法實在太慢了,因此在去年六月起,團隊導入人工智慧技術去識別暴力極端主義相關內容,找出這些內容後,再交由系統進一步判別並審查。截至去年九月,所有因為含有暴力極端主義內容而遭強制下架的所有違規視頻中,有超過80%的視頻是在用戶還沒提出任何檢舉之前,就已經從YouTube上移除掉,相比前一個月,提升了8%。

谷歌表示,這仍是實行至今的初步成果,為了加強這個移除機制的準確度,以及減少誤判的情況發生,YouTube小組審核了超過100萬部的視頻,希望能夠通過為系統提供大量的訓練實例,讓機器學習的應用效益達到優化。

即便如此,開發團隊仍然認為機器識別技術和審查機制仍不夠完善,還需要持續進步以降低誤判,因此開發團隊開始讓人工智慧來「認識」視頻中人類的動作,為了提升機器學習認知視頻中人類動作的能力,開發團隊導入原子可視化動作數據學習模式(Atomic Visual Actions, AVA)。

直到去年11月,AVA已經分析了超過57萬組視頻片段、生成21萬個動作標籤,總計標註了9.6萬組人類的動作。不過目前AVA仍在研究的初步階段,谷歌承諾,未來希望有更多的研究投入,能夠加速AVA的發展,讓YouTube的視頻內容生態朝向正向發展。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 微視榜 的精彩文章:

YouTube的2017年:犯錯最多,收入最高!
凱莉·詹娜喜獲「生產禮物」:價值140萬美元的限量版法拉利

TAG:微視榜 |