當前位置:
首頁 > 科技 > 如果你也對語音交互感興趣,這裡有份書單可以參考

如果你也對語音交互感興趣,這裡有份書單可以參考

如果你也對語音交互感興趣,這裡有份書單可以參考

在完成 《2018,語音交互何去何從》一文的過程中,出於興趣收集了一些語音交互設計相關的文檔及書籍資料。

其中有專門針對對話式交互設計的,有交互設計與機器學習結合的,還有一些與 VUI 設計相關的拓展閱讀內容。

如果你對語音交互同樣感興趣,希望這份資料單能為你提供幫助。

兩份文檔

1、Google 對話式交互規範文檔

以「為什麼機器人無法像人類一樣對話」作為引導,文檔大致分為三部分:

  • 對話式 UI(Conversational UI)基礎概念,包括輪次、原則、表達方式、語義語境的定義等等;
  • 對話式 UI 的設計方法,包括具體的設計步驟、遵循的原則、走查清單、設計工具包等等;
  • 實踐案例及問題的解決方法,包括如何適應不同用戶的說話風格、口語化表達的修復、獲取用戶信任等等。

如果你也對語音交互感興趣,這裡有份書單可以參考

Google 還專門製作了一個關於對話交互的小短片

地址:https://developers.google.com/actions/design/

2、Amazon 語音交互設計規範文檔

與 Google 的文檔相比,Amazon 的文檔相對「務實」,沒有太多抽象的定義(類似「格里斯原則」這類只看名字完全不知道內容的原則),以目的引導執行,從最直接的確定對話目標、撰寫腳本開始。

Alexa 的特點之一是超過 1.5 萬種「技能」(Skill),出於幫助設計者更好的為 Alexa 開發的目的,文檔內容會傾向於技能的構建。同時由於 Amazon Echo Show 系列帶有屏幕的產品上線,文檔中也會涉及一些與文字視覺相關的交互原則。

如果你也對語音交互感興趣,這裡有份書單可以參考

去年 5 月上市的 Echo Show

Amazon 的設計規範分為五部分:設計流程、用戶表達、Alexa 的回應、走查清單以及辭彙表。

  • 設計流程包括開發前的設計工作,如確定對話目標及用戶、撰寫腳本、制定流程、準備開發等等;
  • 用戶表達部分則是讓 Alexa 了解用戶的意圖的一些方法和原則,如在構建前完成設計、如何處理用戶的過度回答等等;
  • Alexa 的回應部分是 Alexa 回應用戶的方法和原則,共有 14 項,包括保持對話簡潔、使用會話標記等等,並包括一部分與文字視覺相關的交互原則;
  • 走查清單共 5 項,包括確保用戶從技能中受益、確保用戶可依找到技能、使用自然語言交流等等;
  • 辭彙表則為文檔中的名詞定義。

地址:https://developer.amazon.com/designing-for-voice

三本設計類書籍

3、《Designing Voice User Interfaces : Principles of Conversational Experiences》

作者 Cathy Pearl 是 Sensely 的用戶體驗總監,擁有 17 年語音交互設計經驗,在 Nuance 和微軟任職期間設計過多款 VUI 系統。

如果你也對語音交互感興趣,這裡有份書單可以參考

書籍的內容包括語音界面的基本設計原則、虛擬角色的構建、語音識別技術、用戶測試,以及設備實例等等。偏向於實踐,圖文豐富,出版於 2016 年 12 月,美亞評分 4.3。

中文版已於上個月出版,譯名為《語音用戶界面設計:對話式體驗設計原則》,譯者為阿里設計師,各大電商均有售。

4、《Machine Learning for Designers》

作者 Patrick Hebron 是紐約大學信息交互項目(Interactive Telecommunication Program,偏向藝術、科技媒體融合的傳播類項目)的客座科學家及兼職教授,曾為 Google、Oracle、BMW 服務。

如果你也對語音交互感興趣,這裡有份書單可以參考

與上一本《Designing Voice User Interfaces》同樣都是 O』Reilly 出品,不過是數字出版物。發佈於 2016 年 6 月,是一本 71 頁的小冊子。

從機器學習是什麼、為其進行設計的不同之處講起,包括為機器學習系統進行設計會遇到的挑戰,以及如何與機器學習平台協作。

從 34 頁開始為「Creating Dialogue」(創建對話),包括如何開始對話、話術設計原則等等。整本的內容相對簡單,很適合初心者。

這本小冊子的最後提供了不少資源鏈接,比如 arXiv、Reddit、Hacker News 等,以及一些機器學習、數學線上課程推薦,機器學習平台和開源工具等等。

Patrick Hebron 的個人網站上還有不少與機器學習設計相關的內容,地址:http://www.patrickhebron.com/。

5、《Sonic Boom》

作者 Joel Beckerman 是聲音解決方案公司 Man Made Music 的創始人,曾為迪士尼、AT&T 等服務。同時也是一名作曲家,曾與 John Legend, will.i.am, Moby 等音樂人合作。

如果你也對語音交互感興趣,這裡有份書單可以參考

從聲音的意向、影響,聲音與品牌的關聯、實際案例到如何創造聲音體驗,《Sonic boom》的內容偏向產品音效設計及聲音品牌化。對於構建 VUI 的個性、如何與產品契合等有不錯的借鑒意義。

中文版《音爆》已於 2016 年出版,各大電商平台有售。

兩本技術類書籍

6、《解析深度學習:語音識別實踐》

理解語音識別技術的中文必讀書之一,作者是前微軟研究院首席研究員、語音識別及深度學習資深專家俞棟,以及人工智慧、機器學習、語音語言信號處理專家鄧力。

如果你也對語音交互感興趣,這裡有份書單可以參考

內容相對偏理論,覆蓋了大部分語音識別知識,如果對語音識別底層技術感興趣可以參考學習。

7、《統計自然語言處理》

理解 NLP(Natural Language Processing, 自然語言處理)的中文必讀書之一。語音識別是將語音轉換為文字,NLP 則是讓機器理解理解文字背後的意義。能不能利用 NLP 技術理解用戶語言?這項技術現在能做到什麼程度?

技術類書籍的作用就是在進行語音交互開發、設計前,幫助把握技術的邊界。

如果你也對語音交互感興趣,這裡有份書單可以參考

內容完備(且非常厚),從基礎概念、預備知識到底層技術,以及機器翻譯、篇章分析等應用方向的具體解決辦法都包含其中,對 NLP 技術感興趣可以深入閱讀。

(一些好玩的)其他內容

1、《Best Practices in Designing Speech User Interfaces》

微軟平台 2004 年發布的語音交互設計文檔,充滿年代感,比如第一課是「你永遠都別想拿到足夠的數據」(笑)

左側的《Heuristics: Lessons in the Art of Automated Conversation》中有一些設計自動對話基礎原則可以借鑒,如製造真實、讓用戶有良好體驗等等,後面大多是使用微軟語音識別平台的方法,總之頗具考古價值。

地址:https://msdn.microsoft.com/en-us/library/ms994646.aspx

2、《Voice User Interface Design》&《Voice Interaction Design:Crafting the New Conversational Speech Systems》

這兩本都是 2004 年附近出版的 VUI 方向書籍,針對的是早期 IVR(Interactive Voice System,互動式語音系統),不過裡面的一些設計原則在今天依舊適用,前文提到的《Designing Voice User Interfaces:Principles of Conversational Experiences》就引述了不少這兩本書的內容。

3、網路課程

雖然直面語音交互設計的課程幾乎沒有,但還是有一些與語音識別相關的課程,可以幫助技術入門。英文無障礙可以選聽愛丁堡大學的 ASR 課程,科大訊飛的 AI 大學有語音方向的中文課程。

愛丁堡 ASR 課程地址:http://data.cstr.ed.ac.uk/asr/2017-18/asr-lec01.html

訊飛 AI 大學地址:http://ai.xfyun.cn/college/index

4、arXiv

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 動點科技 的精彩文章:

《王者榮耀》Switch 版或能與手機版聯機
iPhone X 出現無法接聽電話問題,蘋果正在調查

TAG:動點科技 |