當前位置:
首頁 > 科技 > Google推出網頁版跨平台AI工作管線框架MediaPipe

Google推出網頁版跨平台AI工作管線框架MediaPipe

Google將跨平台多模應用機器學習工作管線框架MediaPipe移植到了網頁平台,在去年的時候,Google發布MediaPipe開源項目,可以讓開發者在移動設備Android和iOS,以及邊緣設備Google Coral上,以MediaPipe圖(Graph)形式構建和執行機器學習工作管線。

現在通過WebAssembly技術以及XNNPack機器學習預測函數庫的加持,Google將MediaPipe帶上網頁瀏覽器,並且能即時執行MediaPipe圖。Google提到,他們用Emscripten將所有需要用到的C 程序代碼都編譯成WebAssembly,因此在執行的時候,網頁瀏覽器可以非常快速地執行這些指令,比傳統的JavaScript程序代碼有效率的多。

而且Google還創建了一個簡單的API,讓JavaScript和C 之間能進行必要的通信,使得JavaScript能夠直接更改MediaPipe圖,並且進行交互,而機器學習模型與輔助的文本和數據文件,則被打包成二進位數據包,在執行的時候才載入。MediaPipe會自動使用WebGL,來處理需要用到OpenGL的運算。

雖然WebAssembly比純JavaScript快得多,但還是比原生C 還要慢,Google提到,他們進行了許多優化,在可能的情況下,盡量使用GPU進行圖像操作,並選擇最輕量的機器學習模型版本,犧牲品質以換取速度。

但由於計算機著色器無法廣泛地用於網頁,因此沒辦法簡單地利用TensorFlow Lite GPU機器學習預測,而使用CPU預測又會成為性能瓶頸,為了降低這情形帶來的影響,Google使用XNNPack機器學習預測函數庫,以擴展TfLiteInferenceCalculator,提升多數應用程序2到3倍的速度。

Google將MediaPipe網頁版集成到網頁可視化工具Visualizer中,提供互動式Playground環境,開發者可以快速迭代圖的設計,使用滑鼠和滾輪就能縮放圖形表示,圖也會即時根據編輯器的修改變化,而且每次圖迭代,都可以即時的使用網路攝影機進行流媒體測試。

網頁版MediaPipe目前仍然有一些限制,開發者只能使用模板圖(Template Graph)進行編輯,無法重頭開始設計,另外,圖的執行程序還必須是單線程的。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!


請您繼續閱讀更多來自 十輪網 的精彩文章:

關係型資料庫服務Amazon RDS現可直接導出快照到S3存儲服務
人體基因編輯是在編什麼?5分鐘搞懂基因神剪CRISPR