思科黃樂：融創新納智慧思科智能協作策略

最新 08-13

2018年7月27日，周五，由深圳市商用顯示系統產業促進會聯合北京奧維雲網大數據科技股份有限公司主辦、深圳融華智顯產業服務有限公司承辦的2018中國智慧會議產業（夏季）高峰論壇在深圳麒麟山莊隆重召開。本次論壇共吸引500多位智慧會議產業嘉賓代表出席，共話會議產業的發展大計。

高峰論壇上，思科（Cisco）大中華區協作事業部架構師黃樂經理以《融創新納智慧，思科智能協作策略》為題為參會嘉賓分享了思科在全球範圍內的智慧會議事業以及智慧AI在國內一些具體的場景應用。

思科（Cisco）黃樂經理正在演講

以下是黃樂演講實錄：

文中附完整PPT

大家好，我是思科在南區負責協作的技術顧問黃樂，基本南區五省協作相關的工作都由我來負責，謝謝商顯產促會給我這樣一次機會來分享思科在全球範圍內的一些事業和在國內一些場景的結合。

協作對於社會而言非常重要，其中和本次論壇相關的一點是，智慧會議將會迎來一個大爆發的時期，今天視源周總講的「雲、網、端」的架構，代表了企業未來的發展方向。

我的演講題目是《融創新納智慧，思科智能協作策略》，主要與智慧會議中的協作有關。為什麼講這個？現在智慧是一個非常重要和火爆的主題，基本不講AI和智慧，在IT行業就已經落伍了。

思科在協作領域已經發展非常多，大家聽到「思科」這個名字可能就想到網路，但事實上思科不只是網路，我們在基於網路的應用上也做了很多開發。

「協作」是一個很大的話題，根據思科的企業管理與運營經驗，我們為「協作」下了這樣的定義：協作是一堆人在一起為同一目標進行工作。

商業級的協作，有幾個主要元素，最基礎的是技術，沒有技術很多事情就沒有辦法完成，所以必須有技術積累。真正的協作是基於人、基於公司，人與人之間有差異，公司與公司之間也會有差異。真正商業級協作，必須要融入到企業的流程和文化中，這才是一個真正的商業級協作。基於這樣的理念，思科做了一些規劃。

思科是一個非常有規劃的公司，在協作方面做了相應的規劃，在Gartner的魔力四象限中，思科一直處於領導者象限中。思科有一個非常遠大的Vision。

上面這張圖，是思科2005年產品部做的，除了加上中文，至今一字未改。

當時，思科決定進入協作市場後，就為自己做了一個規劃，協作架構要分五步來走。

第一階段，先做產品覆蓋，也就是技術積累。因為通訊在協作里是講人與人的溝通，通訊手段需要非常豐富，不會只有一個，有視頻的、語音的、文字的、內容的，這些都需要不同的技術手段去積累才能達到，因為人與人的溝通應該是多種方式的。所以2005年時，思科就開始做產品覆蓋。

第二階段，是產品整合。這麼多的技術手段需要融合、簡化，所以第二個目標就是把產品簡化，也就是如何讓更多人更簡便地把它使用起來。

第三階段，就是產品進化。思科有了更多工具之後就要考慮怎麼讓它更加無縫地工作在一起，隨時可以互相調用，作為一個完整的平台出現，而不是一個孤島。

第四階段，是雲。大概設定是2015年的事情。當有了這麼多好的前端之後，需要一個完整的雲平台去延伸，因為這種協作不會只發生在一個企業內，要跨出去，與B2B、B2C連接起來，這需要很強的移動性，或者說要有非常彈性的網路以及平台支持。

第五階段，是數字化。人與物品等許多東西，在網路里要出現，首先要用數字信號來代替。不然就無法進入網路，無法互聯，所以必須要有數字化的階段。有了數字化階段之後，就要做開放介面。

三大元素，最終要融入到企業文化和流程中。沒有相應的開發，沒有API介面，就沒有辦法融入，所以必須要數字化。思科2005年就已經把這個規劃做完了，而且目前來看，時間點跟實際發生的事情也是非常貼近。

這些年，思科在決定了這個規劃後，就一直在按照規劃不斷完善自己，包括自主研發和通過併購。這幾年，思科通過併購實現了快速發展，但併購不是隨便的，都是按照規劃一步步完成。2003年，思科發布了IP電話電解方案；2005年，開始做IP電話的整合；2006年，發布CTS網真解決方案；2007年，收購Webex，介入網路會議/雲端會議/數據會議的產品領域；2008年，收購Jabber，進入個人通信領域；2009年，收購TANDBERG，完成了整個產品覆蓋的過程，包括視頻、語音、文字、內容、交互和和技術積累，都完成了。

接下來有兩年時間，思科什麼新產品都沒有做，兩年時間把各種技術手段融合在同一平台里，所以直到2013年才開始有新的產品出來。

思科的步伐並沒有停下，2015年，收購了原來從思科分出去的小企業——acano，去做會議平台，為開放式和數字化做準備；同時，也收購了TROPO——做API的廠商，為數字化階段做好準備；2017年，收購boardsoft，這一系列的動作都是按照思科的規劃，一步步去完成，把技術積累融入到企業流程和文化中，做了一個完整的準備。這是思科發展到今天，現階段的狀態。

今天的主題是智慧會議。有了全面技術積累之後，思科在後面就會有一個新的規劃，因為現在經歷了雲、數字化，接下來就是AI人工智慧發展，思科在這方面也有自己的規劃和展望。

思科認為，智慧、AI跟會議之間會經歷這五個階段。

最簡單的語音指令，已經完全實現了，比如語音查天氣、開關燈，等等；

第二階段就是自然語言的識別，機器能夠自己去識別、理解意思，自己表達；

第三階段，專業領域語義識別，不僅可以完整地知道參會者講的內容，還能完整地理解語句真正的意思。

前面這三步其實就是用AI助手幫助人去做這些事情。第四和第五這兩個階段，就會有改變，需要AI助手主動介入來幫助人們去做。

第四階段是AI智能團隊成員，不僅幫助用戶，也作為一個團隊成員，幫與會者準備內容。開會前，就知道你需要調查哪些內容，通過大數據分析可以得到相應的結論，預先準備好。可以幫你準備相關的會議紀要，會後有哪些任務安排等。

到第五階段，它會作為團隊成員出現，幫你去組織這個會議。比如你現在想要辦一件事情，要達成這個任務需要什麼資源、這些資源在誰手上、需要哪些人與會等，都提前由AI幫你安排好。你只要有想法，AI就能幫你完成組織工作。

思科認為，AI智慧會議旅程，是分這五個階段完成的，這要一步一步走，有些已經實現了，有些會在未來實現。

無論如何，AI的介入是肯定會出現的，而且這個介入圍繞著一個很重要的東西，協作最關鍵的，還是人作為主體，會議的主體還是人。會議裡面最重要的，是用戶的使用體驗，它是永遠放在第一位的。有AI幫忙，第一步要做的是改變會議環境，改變會議室，這樣才能提升會議體驗。

這個場景大家都非常熟悉了，今天的會議室就長這個樣子，我們用了很多年，裡面有好多東西，因為我們在會議室里要做很多事情，比如說開視頻會議要有終端，要分享PPT要做投影，要聲音擴聲就要有音箱，要有麥克風拾音等等。

這些設備已經帶來了很多操作界面，有一堆遙控器。還不只，想簡化它？做個中控，把這些都控起來，再加上白板來分享。這樣的一個會議室，用戶體驗會如何？簡單說，用不起來！這涉及多少線纜？誰能維護？這麼多遙控器，誰能用？只有管理員，或者經過培訓的專業人員才能把這個會議室用起來，這絕對是智慧會議的阻礙，因為沒人會用。真正的智慧會議，應該是回歸到每個使用者手上，誰都會用，這才是最關鍵的。

思科認為，這應該簡化一下，像這樣就夠了，如何實現呢？

2016年底在國外、2017年在中國，思科發布了一個產品叫Room Kit，Room系列終端，主打的就是Room Kit 和 Room Kit Plus。很榮幸，拿了紅點大獎。很簡單，就是把這個設備放到會議室中，簡化會議室。

為何這款產品在會議室能做這麼大的簡化呢？它有很強悍的性能，包括支持H265編碼的壓縮協議，可節省一半帶寬，支持5K攝像機，還有超聲波的識別設備等，有很多很多這樣的工具。

但它最關鍵、最厲害的一點在哪裡？是它內嵌了AI晶元。Room系列的產品線，都嵌入了NVIDIA Jetson晶元。自動駕駛、智能汽車是如今非常火的議題，在谷歌的自動駕駛中用的晶元就是NVIDIA Jetson，它是一個為AI做準備的晶元。而我們整個Room系列的產品、前端都嵌入了這樣一個AI晶元。為何要這樣？因為我們要把「智能」放到每一個前端設備、每一個人機交互界面上。

其實思科在人工智慧領域已經有非常長久的技術積累。

人工智慧第一個階段是機器智能，這裡面包括最簡單的回聲消除、視頻的移動檢測、空間音效、波束成形麥克風等等，都會涉及到AI，只不過這些相對來說簡單一些，就算沒有晶元集成也能做出來。還有一些超聲波檢測等，也比較簡單。但是為什麼要把晶元做進去呢？因為接下來還要做第二階段、第三階段，就是機器學習。

它對面部、聲場進行檢測，都是要一定運算量的，都需要晶元發揮作用。再加上後面還有深度學習，通過整個環境的採樣，之後會做相應的分析，實時做出一些反應，給出一些回饋數據，包括專業領域的語義識別、面部識別、面部偵測以及之後的物件偵測都要靠晶元來提高效率。思科一直在推進，規劃有明確的時間線，每一個功能在大概的時間都會完成。

現在用得最多的就是鏡頭跟蹤，這是我們在現有設備中的第一個應用，為什麼？會議分為會前、會中、會後，會中經常做的一個操作是什麼？是搖鏡頭。A領導說完話，B領導接著說話，這時候鏡頭要搖過去，以前這個動作要靠人完成，但現在簡化了，自動搞定，誰說話自動給特寫。還可以判斷房間內坐了多少人。

（現場演示鏡頭跟蹤功能，以及人臉識別計算人數等）

有AI之後，可以做什麼事情？第一可以判斷畫面中有人，還能知道有多少人。比如用到教育行業，就可以判斷到底有多少人上課，學生有沒有到，等等，都可以檢測出。而且誰說話給誰特寫，遠程教育時，老師說話或者遠端一個學生回答問題，直接就能看到學生的表情。

知道有人之後，還能認出這些人——只要有後台數據支持，這樣就可以實現人臉簽到了，你想代簽是沒有可能的，坐著有沒有認真聽、是不是睡著了，AI都能認出來。

還可以引入會議助手，有了後台數據支持，AI認得你了，你一進到這個房間，你今天要開哪個會，AI都知道，可以提前替你準備，不再需要去記會議號碼了，一鍵進入，甚至連按鍵都不用。

自動配對會議的主要內容，PPT預先準備好。還可以提升會議室的使用效率，比如預定了的會議沒人來，可以自動「釋放」。可以做的事情非常多，很關鍵的一點是除了這樣的AI晶元，我們還是一個開放的平台，思科的做法是把API開放出來，讓大家可以根據API做自己的定製，這樣才能融入到企業的文化中，因為每一個企業文化都不太一樣。

這是基於視覺方面做的一些事。

聲音方面也有很多東西，包括智能降噪，比如三角演算法，能知道聲音是從哪裡發出來的，可以調用波束成型技術，直接針對這個方向採樣，達到最好的音效，這是現在可以做的，機器學習、智能降噪。

下一步還可以做什麼呢？深度學習。可以用這個設備監控整個會場的聲場，會不會有雜音，比如高頻噪音、寵物叫聲等，經常會出現的雜音都可以記錄下來，進行數據分析，預先準備好預案，對整個聲場進行監管。

這可能會造成這樣的效果——把思科的產品買回去，發現這個聲音一般，但是用了一兩個月之後，發現這個聲音怎麼突然棒了，因為有學習的功能，這就是有AI的好處，通過數據的積累，通過人工智慧給你相應的對策，而且是個性化、針對性的。

還能做什麼？智能助手，這些都簡單，可以幫你用指令去操作一些事情，幫你做對話管理，包括直接回答你一些疑問，幫你組織這個會議，都可以用語音來實現。

再接下來是什麼？我們還有超聲波技術。超聲波有一個特性，不穿牆。把設備放在這個房間裡面，超聲波就只會在這個房間里出現，它絕對不會延伸到外面去，因為它不穿牆、玻璃、木門，而且人聽不到，你不知道你自己被監控。

超聲波可以用來幹什麼？思科做了一個超聲波同步投屏與控制。拿這個設備來房間裡面，根本不用做配對，自動就可以識別設備，可以做一些投屏的動作，甚至可以拿著小平板或者手機直接操控終端。這是超聲波同步投屏與控制。

但它的作用遠遠不止於此，AI還可以做超聲波移動檢測，可以做簡單的智能喚醒和房間監控的事情。

場景大概是這樣子的：一開始設備是待機狀態，當有人進入到房間的時候，通過超聲波檢測，設備會自動進入半喚醒狀態。

半喚醒後，它可以做一些提示如，Hello問好。如果是掃地阿姨就不管了，如果是真正用這個設備的人，它就會為你準備一些東西。

它會判斷你可能是今天的與會者，幫你準備好相應的東西。

識別出來一些信息，這就是一鍵進入激活狀態，然後就可以直接開會了。

甚至，還能做什麼呢？後台有AI，幫你把會議內容準備好，所以整個過程就非常順暢。

這是都是目前我們已經知道可以做，甚至有明確路線即將會發布的功能。

最關鍵的是什麼？思科是做網路出身的公司，最強的東西是設備對網路的識別能力，這是我們最強的地方。思科也會有自建雲的服務在其中，智慧雲、協作雲。我們的終端可以搭配著平台雲實現更多的功能。

最後總結一下，其實智慧、AI，和會議有非常多的可集成的東西，而思科就是通過這樣的智慧前端以及智慧的雲平台去實現整個會前、會中與會後的管理，讓整個會議充滿智慧。最關鍵的是，思科是一個很開放的平台，不單提供自己的技術，還開放了所有API介面，可以跟很多合作夥伴一起融合在這個平台裡面，一起做智慧會議。

思科有統計，關於智慧會議這個市場究竟能有多大？思科認為有100億美金這樣的龐大市場，而現在已經採用智能技術的會議室，只佔5%，還有95%等著我們跟大家一起去開發。

希望我的分享能給大家帶來一些火花和思考。思科提供開放平台，也願意跟各位一起去開發這個開放的平台，謝謝大家！

文章來源：《商顯世界》公眾號

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 ISVE智慧顯示 的精彩文章:

TAG:ISVE智慧顯示 |

思科黃樂：融創新納智慧 思科智能協作策略

思科黃樂：融創新納智慧思科智能協作策略