右劃科技CTO侯明強:內容領域對技術人員將始終充滿挑戰
【獵雲網(微信號:ilieyun)北京】4月12日報道 (文/田甜、周效敬)
在由達泰資本管理合伙人方元主持、以「人工智慧技術的成熟到產業融合」為議題的高峰論壇上,右劃科技CTO侯明強就論壇議題發表了精彩觀點。
侯明強曾在今日頭條做視頻研發工作,負責頭條視頻和西瓜視頻的研發工作,目前右劃科技開發了一個新的短視頻和語音APP。短視頻業務屬於內容產業,侯明強認為內容是與AI結合最深度、最到位的一個產業。
關於AI在內容產業落地的場景,右劃科技主要體現在兩點:第一是個性化推薦,使用戶在單位時間裡得到最大的信息收益;第二是關於隱私、版權以及對兒童的保護等。
侯明強表示,當技術水平提升之後,應用場景又會帶來一些新的東西。新的App里又有語音的內容,用戶有很多下沉市場人群,他們的語音帶有相當程度的方言,對這些內容的識別、理解就比標準的畫面有了很多新的技術難度和挑戰,到現在還在花非常大的力氣突破。
侯明強坦言,隨著應用水平越來越高,用戶的使用越來越符合自己本身的操作習慣,這也帶來新的挑戰。
侯明強表示,每個領域都需要有不同的模型,如果該模型什麼都能識別,這個模型準確率不會太高,對某些特定領域不夠敏感,各種預測的閾值都不會太好。因此,針對特定領域的問題,需要單獨設立新模型,分別處理樣本數據,進行數據的標註、採集,進行大數據計算,進行分別訓練和優化。這些領域都很困難,需要一個個去做。
內容領域,包括後面的軟體演算法本身,在整個AI各領域走得比較靠前。侯明強再次強調,演算法或者工具先進,用戶用得更好,數據規模就會上升,這會帶來新的問題、新的交互,他相信未來這個領域將始終充滿挑戰,對於技術人才來說,它是最有挑戰的領域。
以下為侯明強論壇發言實錄,經獵雲網整理刪改:
方元:按照慣例,先請各位嘉賓介紹一下各自的所在機構和你們本人的情況。
侯明強:大家好,我叫侯明強,我之前在今日頭條做視頻研發工作,最早的頭條視頻和現在的西瓜視頻是我做的。一直從事視頻技術領域的工作。
鑒於之前的經驗,我們現在又做了一個新的短視頻和語音APP。我們公司的短視頻業務屬於內容產業,我認為它與AI結合的最合適,也是最深度、最到位的。內容產業有幾個特點:
首先,它本身就是數字化的,它已經沒有很多信號需要採集,從原來物理的數據轉化成數字信號這麼一個過程。
內容產業第二個特點,內容非常豐富,非常多。像抖音快手每天上傳的數據達一千萬量級,對數據規模超大的情況,統一優化也能起到比較好的作用。
AI在內容產業這邊落地的場景會比較具體和直接,我們公司主要在兩大部分:第一是在個性化推薦上,我們認為個性化推薦非常重要、非常核心。剛才說過的內容很多,必須要給用戶一個選擇,不管什麼場景,可以把我們的產品理解成閱讀的助手,過去早晨起來看新聞,現在早晨起床打開手機看內容,這時候手機和APP成為一體就是閱讀的助手了,這個助手要給你自己最喜歡的內容,才能讓你在單位時間裡得到信息的收益最大。
個性化又特別關鍵,比如歐洲人和東亞人體內DNA的組成確實不一樣,我們有很原始的智人的基因,東亞人和歐洲人尼安德特人的比重確實不一樣,非洲人絕大部分體內沒有尼安德特人的基因。從DNA推斷出人跟人真的不一樣,但是天生有差異,個性化一定是永恆的,更符合人性的訴求。所以說個性化推薦,在內容產業適應用戶的需求,這是特別關鍵的問題。
我們的應用場景主要有幾個大的方面:
隱私。大家很重視隱私保護,要做隱私保護的話,前提是要能識別出來這個內容涉及隱私,以提供更多的工具來保護這個隱私。
版權。從內容識別涉及版權的問題才能對它進行保護。簡單說,有一個機構有保護版權的訴求,針對海量用戶上傳的體系,也需要識別出用戶上傳的會不會是他的二次轉載甚至是盜版侵權的內容,這個需要識別出來。
對兒童的保護。我們也非常重視,我們國家也有很多內容缺少分級,行業也想建立這樣的體系,色情、暴力、血腥的內容,不希望自己孩子看到,要識別出哪些內容不適宜兒童,哪些不適宜在公眾上面進行傳播。
低俗。最近在歐洲和美國Facebook上,有很多內容傳播不適宜的東西。過去,大家都認為這個平台要儘可能地兼容並包,給更多人展現內容的機會,但是整體的社會文化在一個特定的文化群體里還是希望有一些內容。
方元:您原來做短視頻,現在也是做短視頻,AI在海量數據的基礎上做精準化推薦。
侯明強:做推薦和內容識別,主要是這兩大領域。
方元:我們自己在過去幾年看AI項目的時候,我們很好奇,到底您這個生意是什麼樣子的?你們這個AI到底跟您的生意有什麼關聯?用在哪方面?剛才侯總提到,短視頻裡面用于海量數據的篩選,個性化的推薦等方面,侯總關於AI在您這個行業的應用還有其他補充嗎?
侯明強:沒有了。
方元:從投資機構的角度,過去12個月,行業有哪些你們看到的進展,未來12個月,又會有哪些新的突破?應用的過程當中,你們所在行業的現狀有哪些是幫了忙的,有哪些是有挑戰的?視頻這邊對算力有時間要求?就這個話題請各位再展開講一講。
侯明強:我簡單介紹一下我們內容領域的AI落地情況。其實我們在2015年做今日頭條頭條視頻的時候,在內容安全領域,把AI應用進去,在深度學習這樣強大的計算工具幫助下,我們實施比較順利。為了去掉有害的內容,需要大量人工審核員去做,這對每個企業都是一個煩惱,甚至對於審核員本身也是高強度的工作。大家不太願意做這個工作,他們有這個需求,我們把內容識別AI化,當時是比較成功的。
當技術水平提升之後,應用場景又會帶來一些新的東西。我們到做新的app的時候,我們又有語音的內容,我們的用戶有很多下沉市場的人群,他們的語音帶有相當程度的方言,對這些內容的識別、理解就比標準的畫面有了很多新的技術難度和挑戰,到現在還在花非常大的力氣突破。
大家都覺得訊飛在語音上做得不錯,相對於通用的、更標準的普通話,它的準確率比較高。在內容領域,首先是方言的差別。第二個是針對幾個問題,每個領域都需要有不同的模型,這個模型如果什麼都能識別,大雜燴,這個模型本身準確率就不會特別高,對某些特定領域不夠敏感,各種預測的閾值都不會特別好。
因此,需要針對特定領域的問題,每一個都需要單獨設立新模型,需要分別處理樣本數據,進行數據的標註、採集,進行大數據計算,分別訓練和優化。剛才我們提到的這些領域都很困難,都需要一個個去做。
個性化推薦整體進展比較順暢。我們在今日頭條之前有比較多、比較好的實踐方式,現在主要還是在應用的數據規模上去做,但具體應用場景仍有新的挑戰。比如,我們的APP可以上下滑動、左右滑動,喜歡的視頻可以多看,不喜歡可以滑過去。像快手APP是雙瀑布流,有非常明確的信號,告訴你這是正樣本還是副樣本,等於你要猜用戶真正的喜好是什麼。
這就取決於你對用戶的理解和對數據的把控,這樣才能夠做得很好,這也是挺難的一個挑戰。隨著應用水平越來越高,用戶的使用越來越符合自己本身的操作習慣帶來新的挑戰。
方元:類似於語音這樣的新功能需求,對演算法的模型帶來的要求。
侯明強:還有交互方式。
方元:在座各位都是AI各個行業應用當中的領先行業,我們一起展望一下詩和遠方,有哪些行業要素、技術進步、人員進步會影響到你這個行業在AI方面的應用。
侯明強:內容領域,包括後面的軟體演算法本身,在整個AI各領域走得比較靠前。演算法或者工具先進,用戶用得更好,數據規模就會上升,這總會帶來新的問題、新的交互,未來我相信這個領域始終充滿挑戰,對於技術人才來說,它是最有挑戰的領域。
我們現在的產品主要圍繞手機,人體第二「器官」,一個智能的全方位的助手。因為獲取信息是人永恆的需求,自己的一些想法,可能是場景化的,閱讀助手能夠跟著你到處走:在廚房的時候,廚房的冰箱上,這個助手也可以顯示出來;坐車或做事情的時候,不需要主動掏手機。隨著5G帶來更快的網路,我們可以暢想一下多屏時代,會有那麼一天的。
方元:所以,5G有可能讓短視頻無處不在。
※知乎與言幾又達成戰略合作,打通線上線下消費場景
※聯想創投宋春雨:AI發展仍處於早期,與行業深度融合將帶來巨大經濟價值
TAG:獵雲網 |