專訪影譜科技研發中心吉長江 理解行業讓AI更具「韌性」
提到AI(人工智慧),人們往往最先想起的是AI智能音箱、AI智能機器人、AI手機等等讓人目不暇接的產品。其實,AI落地的場景遠不止於此。至頂網採訪了影譜科技創新研發中心負責人吉長江,從而試圖了解AI技術賦能文化娛樂行業的心路歷程。
至頂網個人商用頻道 05月07日 北京消息(文/陶婧婕)提到AI(人工智慧),人們往往最先想起的是AI智能音箱、AI智能機器人、AI手機等等讓人目不暇接的產品。其實,AI落地的場景遠不止於此。我們每天會用的導航地圖APP內,有些就加入了AI技術;當你瀏覽電商APP時,首頁推薦滿足你心儀的產品,很多都是通過AI技術對「你」進行分析,之後再進行精準推送;AI還可以幫助藝術家鑒別畫作的真偽,幫助新聞工作者寫文章,甚至還可以幫助醫生更好的掌握醫患的病情……AI,正在加速滲透到各行各業當中。結合從業人員關注的AI技術+行業的融合問題,至頂網採訪了影譜科技創新研發中心負責人吉長江,從而試圖了解AI技術賦能文化娛樂行業的心路歷程。
工信部原副部長楊學山曾表示,人工智慧領域的創業一定要圍繞價值,首先必須是真正的經濟社會和生活中需要解決的問題;其次必須要把解決這個問題帶來的價值,通過商業模型變成利潤。這對於大多數人工智慧企業來說都是個挑戰,但也有少數企業實現了從解決問題到帶來價值再到創造利潤的過程。
以影譜科技為例,他們在過去多年一直在通過視覺技術帶動文娛產業發展,提供基於智能影像生產相關的商業化綜合服務,通過視頻原生影像平台可自動掃描並挖掘視頻內容中的海量可視化信息資源,自動批量智能擬真像素製作處理,通過綜合利用智能影像生產等技術,影譜為視頻產業降低製作環節生產成本,提高生產作業效率發揮了巨大作用。
吉長江認為,AI技術的「韌性」來自於對垂直行業的深入理解,對技術的需求一定是從市場中來,然後再到市場和用戶中去。例如,現在短視頻領域存在著一種矛盾,就是用戶對於視頻的需求激增,尤其隨著近兩年短視頻的爆發,對視頻的需求是越來越緊迫,量越來越大,但是產量卻是不足的,尤其是有一些媒體形式還停留在文字跟聲音這個階段上,怎麼讓他們把這種單一的信息形式快速的轉換成更迎合用戶需求和口味的視頻的方式,這是非常有價值的工作;另一方面,就是傳統影視內容生產的自動化程度不高,傳統影視製作非常依賴於計算機,但是即使有這樣的工具存在,工作量還是非常巨大並且很繁瑣,因此,提升視頻的生產效率同樣備受期待。他們的一些工作都是通過洞察到這樣的行業痛點而產生研發初衷的,理解行業是必要條件。
「影像,譜未來」是影譜科技的技術使命,吉長江也認為,影譜的研發工作一直也是圍繞影像端展開的。為什麼要用AI技術來產生視頻內容呢?吉長江解釋道,視頻創作的方式可能有兩種,一個是,比如說要創造一個電影,從手工搭建場景、製作道具開始,然後把這些元素疊加在一起,形成一種影像。還有一種,比如提到一個概念,或者一個想法的時候,你並不能把裡面的所有元素在你腦海當中造出來,而是從過往的視覺經驗中「生成」某種影像的東西,這種現象特別符合現在AI的本質。AI的本質就是從數據中學習和提取特徵,進而把這個特徵還原成我們所需要的東西。當我們積累了足夠多素材的時候,這條路理論上是能走的通的。比如「飛翔的感受」,可以從坐飛機的經驗、或者看到鳥類飛翔的狀態想像出來,我們稱這種經驗數據為素材庫。素材庫內的內容,我們可以從以往的影視資料當中來提取,畫面、鏡頭等內容都可以成為素材,當素材庫的量達到一定的級別,變成個海量的時候,我們就可以從這個素材庫中進行特徵學習,然後採用組合或生成的技術,進行視覺內容的創造,這就是影譜智能影像生產的實現過程。
據了解,自動化視頻生產AGC(Auto- Generating Video Content)是影譜科技的核心引擎之一,可以實現影像的識別及內容生產。今年兩會期間,影譜就通過自由素材庫的內容,嘗試根據語義場景生產可視化信息,為「委員全息履職」欄目帶來更豐富的內容和趣味性。
吉長江表示,AGC是四個要素的組合,即數據+演算法+領域知識+商業模式,缺一不可。好的技術未必是有用的技術,根本是看能不能解決實際的問題。
近期,網路上用AI技術把一個人的臉換成另外一個人的臉的惡搞視頻非常多,這種現象引申出來一個新的名詞——AI作惡。把AI技術用於不好的地方,大家從倫理的角度來理解這個事情,如果沿著這條路走下去的話,一定是死胡同。吉長江認為,技術的真正價值在於能夠整合到現有行業和技術解決方案中,優化和重構產業格局。比如上面說的視頻AI換臉,應用到虛擬主持人方面就為媒體行業帶來了很好的生產變革。
還有很多領域可以讓AI技術大展拳腳,比如說短視頻與VR。短視頻領域的火爆,抖音等APP的成功,有一個非常有利的條件,用戶能夠用最簡單的方式(手機拍攝)來生產內容,吉長江認為,這個可能還是一個比較初期的方式,未來,隨著技術的進步發展,包括硬體條件的進步成熟,或許人人都可以去做視頻特效,人人都可以去做建模,這可能是下一步的趨勢。
※Cloud Next:Google將眾多開源軟體帶入雲端
※你想要的自動駕駛汽車,為何遲遲不能出現?
TAG:至頂網 |