當前位置:
首頁 > 新聞 > 語憶科技完成千萬級pre-A輪融資,高美資本領投、天使灣創投跟投

語憶科技完成千萬級pre-A輪融資,高美資本領投、天使灣創投跟投

【獵雲網(微信:ilieyun)北京】8月13日報道

獵雲網今日獲悉,2018年7月,在老股東杭州天使灣創投的支持及系統服務下,語憶科技完成了由蘇州高美資本領投、杭州天使灣創投跟投的千萬級pre-A輪融資,並將繼續投入到人工智慧自然語言技術的研發與精進上。

對於自然語言處理技術的開發和精進一直是人工智慧領域的重點研究課題之一。其重要性主要體現在兩個方面:一是因為語言溝通本身是人類交往所必不可少的互動行為,從人工智慧最終形態的長遠發展角度出發,具備語言理解、表達能力無疑是人工智慧全面化的必經之路;其次,信息時代,如何利用好各行各業各類大數據,從中提煉極具價值的商業洞察幫助企業發展,已成為了當下不可或缺的重要競爭力。而傳統技術難以解析的非結構化數據(如語言、文本)更能為企業帶來顯著的優勢。

正如很多人相信那樣,下一個十年,對人類影響最為深刻的自然語言技處理技術將是人工智慧發展的又一個重大突破。


大數據中的藍海

在理解為何自然語言處理有著如此重要的地位之前,我們應當認識到,非結構化數據在未來扮演的重要角色。

區別於傳統結構化數據,針對非結構化數據目前尚缺少有效的技術手段進行深度的剖析,以至於企業對這部分數據寶藏都淺嘗輒止。如何理解非結構化數據的重要意義,讓我們舉個非常簡單的栗子:當你在電商網站購物時一定有通過閱讀評論以了解用戶對該產品的真實反饋(這裡我們就先忽略水君的作用),那麼呈現在你面前的將是兩組數據,如下圖所示:

評論區的上半部分一般是一組帶數字的標籤,標籤內容是已整合好的典型問題,而括弧內的數字則代表著包含該類問題的評論數。而下方則是具體的每一則評論內容和用戶信息。

上方標籤欄可以看作是所有評論的觀點總結,用戶可以通過直接觀察數字的方式快速地判斷產品的整體情況;同時,已總結好的觀點標籤也為用戶提供了快速通道,方便直接定位(點擊跳轉)某一類評論。這就是結構化數據為理解問題、分析問題帶來的便利性:數字的大小成為了方便獲取的簡單評判依據,明顯區分開的標籤也減少了用戶自行判斷、總結的時間,大大降低了決策成本,提高了購物體驗。

但試想一下,如果只顯示下方評論區內容,而沒有上半部分結果會怎麼樣?四位數、動輒百字以上的非結構化數據——評論文字無法定向、無法刪選,無法總結。用戶只能憑自己的直覺挑選著閱讀,而有限的樣本也很難令用戶得出的客觀的結論。這部分評論雖然作為源數據為「上方」總結提供了的依據,但其本身很難產生有用的價值。

事實上,如今各行各業里都存在著太多極富價值的語言文本類非結構化數據,如:大量的員工郵件是不是能幫助企業優化內部管理?開放性調研問題能不能自動歸納觀點?運維人員能否從大量客服對話中總結業務痛點?音樂歌詞及網路文學等能否智能概括大意?等等……然而最主要的問題是,受限於技術手段,大多數此類非結構化數據都無法像電商評論那樣可以被簡單地提煉成結構化數據從而產出商業價值,這也阻礙了很多企業對此類數據價值的進一步探求。


有多重要,就有多難

不同於圖像識別技術的高成熟度,自然語言處理在整個商業化過程中仍然處於比較初級的階段,以最熱門的應用——個人助手來說,也許微軟小冰和蘋果的Siri功能已經足夠讓你感到驚艷,但事實上,這些針對性較強的應用場景——簡單系統操作、任務布置——都難以單獨作為技術主體實現商業變現。事實上,目前自然語言處理的低商業化水平及需求度不高,本質還是因為技術瓶頸以至於沒有達到商業化要求。截至目前,單單自然語言閱讀的準確度,行業內也不不過將近9成。而同時,計算機視覺的物體識別準確率已經可以達到將近百分之百。

受行業內普遍認同的是,同樣是非結構化數據,自然語言處理的難度要比圖像識別要高一個等級。

首先,從人工智慧的宏觀分類來看,計算機視覺屬於「感知智能」,而自然語言則屬於「認知智能」,不同於對客觀事物的純粹識別,「認知智能」理解和消化內容的認知能力,從某種意義上來說才是更接近於人工智慧最終形態的技術核心。

其次,儘管計算機視覺技術有著廣泛的應用空間,例如安防領域、車輛識別、個人身份認證等,但本質上,計算機視覺技術的核心就是物體探測。雖然應用很多,但基本上核心演算法都離不開物體探測這個方向,背後使用的邏輯也相當一致。

此外,圖像識別都是一輸入一輸出,問題非常乾淨、簡潔。比如輸入一個圖片,要判斷裡面有沒有花或者草,直接判斷就行了。這些方向中間沒有多輪,不需要交互,一般不太依賴於知識圖譜和常識,即使用也被證明沒有什麼太大效果。目前普遍認為,計算機視覺的技術成熟度已經達到商用化的標準,所以我們可以看到很多不同的公司百花齊放。

但自然語言處理的情況完全不同。不同場景、不同語言,甚至不同專業所需要用到的自然語言處理層次都不同。賓夕法尼亞大學教授Dan Roth曾說道:在各種專業應用中,必須要選擇正確的自然語言模型,沒有任何單一模型可以解決自然語言領域中所遇到的所有問題,自然語言處理沒有一個可以解決所有問題的魔術盒子存在,你必須要把所有相關的知識庫放進盒子里,選擇對的演算法,並且針對性的處理特定問題,那麼這個盒子最後才有作用。這種現狀加大了技術落地的難度。


語憶核心技術 —— 細化語言理解技術

語憶科技正是在這樣一種背景下孕育而生。早在2016年,語憶核心創始人就基於早年海外豐富的自然語言模型研發經驗,嘗試通過創新深度學習演算法將中文文本的智能理解提升至一個新的高度。於是便誕生了語憶科技最初的核心技術優勢 —— 語憶情感解析引擎。

語憶情感解析引擎雖然不是市場上第一款中文文本情感分析工具,但卻是第一個精準實現了多維細節情緒提取的智能引擎。此前,已有的許多常規中文情感分析工具大多只能實現情感狀態的正負極判斷,即只能區分某句中文是否積極、消極(、中性),這一點很大程度上局限了情緒解析技術的應用範圍。

而語憶自主研發的自然語言處理演算法,其核心思想是摒棄傳統的、研究詞與詞之間關係的學習模式,而是細化至分析字與字之間的關係,並專註於某幾個細分領域,強化訓練數據的可用性及針對性,以此打造出能夠識別中文文本中多達12種細節情緒——如憤怒、失望、興奮、愉快、悲傷等——的智能解析引擎。除此之外,這套新型情感分析工具還能區分不同情緒濃度——即某一種情感的激烈程度,以及情感關鍵詞——引起某一種情緒的特定對象,進一步豐富了模型的使用場景。

基於行業領先的中文文本情緒解析引擎,語憶於2017年4月完成了天使輪融資,並進一步專註於人工智慧演算法的精進與商業化發展。

為了克服當下自然語言技術商用的最大局限——難以匹配商業需求的處理精度,語憶的核心策略是兩個「細化」:

一、細化具體行業及應用領域。正如Dan Roth所述,不同於計數機視覺技術,行業與行業之間的語言文本數據將呈現出極大的結構內容差異,而相應的自然語言處理技術也將有著截然不同的實現方法,「大而全」的解決方案是無法滿足當前市場需求的。在這個前提下,語憶基於不同行業對自然語言解決方案的需求程度和可行性分析,判斷並挑選數個細分領域,專註於行業高度定製化的模型研發,大大提高產品的實用性。

二、細化人工智慧模型功能開發。自然語言處理本身涵蓋了豐富的語言文本處理技巧及維度,同樣,要做到「大而全」不僅需要分散大量的資源,同時亦很難在任何一方面實現「單點突破」。語憶繞開了這條彎路,將大量精力投入至細分功能的研發及精進,最終確定了以語憶專利技術——語憶深度學習演算法——為核心的智能語言文本解析體系。該體系涵蓋了以情緒解析引擎為主的數個功能,並將繼續以專利技術為基礎進行自然語言理解技術的開發與迭代。

(由語憶科技獨家提供技術支持的《今日頭條手機行業白皮書》)

在歷經一年多的實踐過程後,語憶成功地為數個領域帶來了基於自主研發自然語言技術的業務智能化方案:基於通話內容理解的客服智能管理方案;基於社交網路發言分析的輿情洞察方案;基於整合內容剖析的文學IP評估方案。並已經與業內知名的新聞媒體、保險公司、科技公司、電商代理、運營商等展開了正式合作。

以客服智能管理方案為例:電商時代,每天將產生巨量的客服通話數據,這些對話內容不僅涵蓋了客服本身的服務表現——情感控制、敬語禁語、話術準確性等,更是包含了消費者對指定產品的偏好、態度、觀點。甚至還能從中挖掘品牌的接受度和等。如今,語憶藉由人工智慧自然語言處理技術,解析客服通話內容,將非結構化數據轉化成結構化數據:客服服務規範度、消費者滿意度、消費者關注熱點等。幫助企業做到實時、全量、準確的理解服務情況和業務痛點,大大提高企業管理效率,降低了運營成本。

(基於自然語言處理的客服對話實時分析、監控界面)


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 獵雲網 的精彩文章:

UU跑腿完成B輪2億融資,東方匯富領投,匯德豐資本、因諾資產跟投
血液檢測創企Genalyte是神話,還是下一個Theranos騙局?

TAG:獵雲網 |