以人為本的機器學習:谷歌人工智慧產品設計概述
選自Google Design
作者:Jess Holbrook
機器之心編譯
參與:Panda
取代了手動編程,機器學習(ML)是一種幫助計算機發現數據中的模式和關係的科學。對於創建個人的和動態的經歷來說,它是一種強有力的工具。從 Netflix 的推薦系統到自動駕駛車輛,它已經在驅動生活中的很多事物。但隨著構建機器學習的經歷越來越多,如何設計用戶體驗(User Experience Design)讓人們感覺是在掌控技術,而非技術控制人,很明顯 UXers 在這方面仍舊有很多需要我們深入探索。
就像手機和之前的網路革命一樣,機器學習使我們重新思考、重組結構,它將取代並對之前所有我們之前建立的體驗帶來全新可能性。在谷歌用戶體驗社區,我們已經開展了一項稱為「以人為本的機器學習(HCML)」計劃以助於讓人們重視並引導這個過程。通過這種方式,我們可以觀察產品,看看機器學習是如何使用一些特有方法解決人類需求的。我們在谷歌的隊伍與公司內的用戶體驗工程師共同開發了加速核心機器學習理論的演算法,他們知道如何將機器學習與用戶體驗相結合,並且保證以包容性的方式構建機器學習和人工智慧。
如果你剛開始使用機器學習,你也許會對其空間的複雜性和廣泛的創新機制有些不適應。慢慢來,不要著急,你需要一點時間去適應。你並不需要為了在團隊中表現的更有價值而重新塑造自己。
我們已經開發了 7 個要點幫助設計師找到一種新的平台設計以機器學習為驅動的產品。誕生於我們與 UX 和谷歌的人工智慧團隊共同完成的工作,這些要點將幫助你把用戶放在首位、快速迭代並理解機器學習創造的獨特的機會。
讓我們開始吧
1. 不要指望機器學習能幫你找出需要解決的問題
如今有很多圍繞機器學習和人工智慧的誇張的宣傳。許多公司和產品團隊將機器學習視做一些產品策略的解決方案,而忽略了真正需要解決的、有意義的問題。
這對於純粹的探索或者了解一項技術的能力來說是不錯的,並且這經常會激發新的產品的靈感。然而,如果不考慮人類的需求,你將要構建的非常強力的系統只能解決一個非常小—或者不存在的—的問題。
所以我們的第一個要點是,你仍然需要做那些一直所做的辛苦工作去找出人們的需求。這些工作就是所有那些人類學、情景調查、採訪、深入調查、瀏覽消費者的投票、日誌分析等等。你要貼近大眾,以了解你是否在解決一個人們未明的需求。機器學習不會找出需要解決的問題。我們仍舊需要定義它。作為用戶體驗設計者,無論主導技術的框架如何,我們已經有了引導我們的團隊的工具。
2. 機器學習是否能以一種獨特的方式解決問題?
一旦你明確了需求或者明確了你想要解決的需求,你會考慮一下究竟機器學習能否以獨特的方式解決這些需求。有許多切實存在的問題不需要機器學習的解決方案。
然而在這點所面對的挑戰在於,如何確定哪個任務需要機器學習,哪些通過機器學習能獲得有意義的提升,哪些不會從機器學習中獲利或者甚至讓體驗變得更差。許多產品可以在沒有機器學習的情況下讓人感受到「智能」或者「個性化」。不要認為只有通過機器學習這些才有可能實現。
當你忘記添加附件時,Gmail 尋找包含「附件(attachment)」和「附上(attached)」之類的短語並向你發出提醒。啟發式方法在這方面表現的不錯。一個機器學習系統更可能發現更多的隱含錯誤,但是構建這樣的系統卻消耗太大。
我們創建了一組練習幫助團隊理解機器學習對其用例的價值。這些練習通過挖掘人們所帶有的思維模型和期望與機器學習系統和系統所需要的數據進行交互時的細節,從而幫助團隊。
以下是 3 個示例練習,我們使一些團隊看過練習並回答他們想要使用機器學習解決的用例:
描述一種理論上人類「專家」今天可能執行任務的方式。
如果你的人類專家將要執行這項任務,你將如何對其反饋使下次得以提升?對混淆矩陣的 4 個階段執行此操作
如果人類執行這項任務,用戶希望其採取怎樣的假設?
花費僅僅幾分鐘的時間回答這些問題揭示了人們對以機器學習為驅動的產品提出的必然假設。他們同樣適用於作為產品團隊的討論中或者在用戶研究的刺激中的提示。當我們討論到定義標籤和訓練模型的過程時,我們還會再談論它。
在完成這些練習,梳理出一些特殊產品和特徵的額外概要和故事之後,我們就能將團隊所有的產品創意在一個簡單的二維坐標系中畫出來。
在二維坐標系中繪製出想法。使隊伍投票得出哪種想法具有最大的用戶影響力、哪種使用機器學習的方案體驗可以獲得最大限度地提升。
這可以讓我們區分具有影響力的想法與影響力較低的想法,並與那些沒有或者只從中受益很少的想法相比較,機器學習 vs. X。你應該已經在這些會話中結合了工程師的思想,如果你沒有,你需要讓他們考慮一下這些想法在機器學習上的可行性。無論哪種想法對用戶有著最大的影響且機器學習唯一適用(位於上述矩陣中的右上角),這都是你首先想要關注的方面。
3. 個人示例和測試
機器學習系統面臨的一個重大的挑戰是原型的製作。如果你的產品的全部價值就是使用唯一的用戶數據為她專門設計一種體驗,你不能僅僅使原型提升速度並使其盡量貼近真實。同樣,如果你等到完全地建立一個適當的機器學習系統對設計進行測試,那麼在測試後再進行改變就沒有多大的意義了。然而,以下兩種用戶研究方法可以幫助你:使用參與者的個人的實例和「綠野仙蹤」研究。
當使用早期設計圖做用戶研究時,在這一階段使參與者帶來他們自己的數據—比如,個人照片、他們自己的聯繫人名單、他們所接受的音樂或者電影推薦。記住,你需要確定已完全告知參與者們在測試中數據的用途以及銷毀時間。在階段開始前,對於參與者這甚至可以是一種有趣的「家庭作業」。(畢竟,人們習慣談論他們最喜歡的電影)
使用這些事例,你就可以模仿系統所做出的正確或者錯誤的回應。比如,你可以模仿系統為用戶推薦錯誤的電影,以觀察她的反映以及她對系統返回錯誤結果所做出的假設。比起使用模仿的示例或者概念性的說明,這使得你評估這些可能性的消耗和收益有效得多。
第二種比較好的測試建立機器學習系統的產品的方法是執行巫師研究(Wizard of Oz studies)。這種方法曾經風靡一時,在過去 20 年左右的時間中,其作為用戶研究方法不被看好。好的,他們現在又回來了。
聊天界面是最簡單的檢測巫師研究的經歷了。只需要一名隊友扮演一方與「人工智慧」聊天
快速提示:巫師研究的參與者們與他們所認為的人工智慧系統進行互動,但是該自主系統實際上由人控制(通常是一個隊友)。
讓一個隊友模仿機器學習系統的行為,比如聊天響應、為參與者建議應該呼叫的人選或者作齣電影推薦,這些行為可以假裝正在於「智能系統」進行互動。這些互動對於設計的指導非常重要,因為當參與者認真地與他們認為的人工智慧接觸時,他們會自然地傾向於形成系統的心理模型並根據這些系統調整他們的行為。觀察他們與系統的適應性以及二次交互對於影響其設計非常有價值。
4. 衡量權重
機器學習系統也會犯錯。弄清楚出錯的緣由以及對用戶體驗的影響至關重要。上文中我們提到的混淆矩陣(confusion matrix) 是機器學習中的一個關鍵概念,闡釋了系統在正常和不正常時分別應該有什麼樣的表現形態。
混淆矩陣的四種狀態及用戶相應的反應。
儘管系統對每種錯誤都一視同仁,但是對於用戶來說,每種錯誤的體驗不盡相同。比如,我們有一個『人類與怪獸』分辨器,偶而一次將人類識別成怪獸對於系統來說只是一次小小的識別錯誤。系統無意冒犯用戶或者出於某種文化傾向做出這樣的判斷。它也不明白,相較於怪獸被錯誤地識別為人類的情況,用戶經常碰到的卻是被錯判成怪獸。但或許那是我們的人本位意識在作怪。
在機器學習的範疇里,必須在準確率和召回率之間做有意識的權衡取捨。也就是說,明確哪種結果更符合需求--得到所有正確信息,這意味著結果中包含更多的錯誤信息(優化召回率); 或者最小化錯誤信息量,而這意味著會犧牲部分正確的信息(優化準確度)。例如,如果用 Google 搜索遊樂場(playground),可能會得到以下結果:
這些結果包含了一部分兒童玩耍的場景,但是並不全都在遊樂場。這種情況下召回率優先於準確率。重要的是能夠獲取全部的遊樂場圖片,哪怕結果里包含了少量類似但並不正確的圖片,而不僅僅只是獲取有遊樂場的照片而恰恰漏掉了需要的那張。
5. 共同學習和適應計劃
最有價值的機器學習模式會隨著時間的推移與用戶的心理狀態一同演變。當人們與這些系統交互的同時,也影響和調整著產品即將呈現的狀態。進而這些調整也將反過來影響用戶與系統交互的過程,並通過循環反饋改造模型本身。這會形成所謂的『陰謀論』——人們構築了一套系統卻或錯誤或不完整的心理模型,並試圖根據這些虛構規則來控制輸出——旨在用明確的心理暗示來引導用戶,鼓勵用戶提供對其自己和模型互利的反饋。
一個良性循環的例子:Gboard 不斷改進技術以預測用戶要打出的下一個字。使用系統建議的人越多,這些建議就會變得越好。
當機器學習系統根據現有的數據集進行訓練時,它們會以不可預知的方式來適應新數據的輸入。因此我們也需相應地調整對用戶及其反饋的研究。這意味著我們應先於產品周期對用戶進行縱向,廣泛其高頻的研究。由於用戶和用例增加,以及需要第一時間了解人們在使用系統時其心理如何隨著每次的成功和失敗而發展變化。我們應當計劃足夠的時間,通過量化準確度和錯誤來評估機器學習系統的性能,並在用戶使用系統時獲知情感模型的表現。
此外,作為 UXer(用戶體驗設計者 User Experience Design),我們需要考慮如何在整個產品生命周期內獲得用戶的原始反饋,以改進機器學習系統。交互模塊的設計如果能做到便於反饋且能夠及時呈現快速反饋的優越性,這就使得該系統與普通的好系統區別開來。
Google 應用程式會在一段時間內詢問特定的卡牌是否有用,以獲取相關建議。
人們可對 Google 搜索自動填充功能提供反饋,包括預測可能不準確的原因。
6. 讓你的演算法使用正確的標籤
作為用戶體驗設計者,我們已經習慣於把點線三維模擬圖,小樣,樣機和進度條作為可交付成果的標誌。但對於得到機器學習加持的設計者來說,需要關注的範圍有限,其中就不得不提到『標籤』。
標籤是機器學習的標配。有專門的人員每天的工作就是為成千上萬的內容打標籤,回答諸如『圖片里是一隻貓么』這樣的問題。一旦有足夠的圖片被標註成『是』或者『不是』,我們就得到一個資料庫可以用來訓練專門辨識貓的模型。或者,準確地說,有了這樣的標籤構成的資料庫,就可以在相當程度上預測一張新的圖片上是否有一隻貓。很簡單,對不對?
你能通過這個小測驗么
但是真正的挑戰在於當模型用於一些比較主觀的判斷的時候,比如『一篇文章是否有趣』,或者『一封電郵回復是否有意義』。但是,這樣的模型不僅訓練的時間很長,並且獲得一個完整標記的數據集的代價可能非常高,更不要說錯誤的標籤可能會對產品的可行性產生巨大的影響。
大致的流程應該是這樣: 首先作出合理假設,並與相關人員進行討論。這些假設通常是這樣的--對於XX用戶的XX情況,我們認為他們會傾向於XX而不是XX』。然後儘快地將這些假設轉化為最接近可行的測試小樣,以便收集反饋和不斷改進。
無論想要做任何預測模型,我們都需要找到最適合給機器當老師的專家--具有相關領域專業知識的人。我們建議只需僱傭少數的專家,或把他們當做後援,更重要的是在目前的團隊中培養這樣的專家,我們稱之為「內容專員」。
從這個角度來說,確定哪種假設更具可行性很重要。在展開大規模數據收集分析和標註之前,需要「Content Specialists」從實際用戶數據中挑選出示例來執行關鍵的第二輪驗證。用戶應該對一個高度接近成品的測試機進行測試,使其認為他們正在與一個真正的 AI 交流(按上述第 3 點)。
無論對 AI 產品有何需求,通過實地驗證,「Content Specialists」就可以創建一系列手動標註示例。通過這些例子便可以掌握數據收集流程,用於訓練模型的標籤,以及用於設計大規模標籤協議的框架。
7. 擴充用戶體驗設計師隊伍,機器學習是一個創意過程
作為 UXer,試想一下最糟糕的所謂微管理「反饋」是什麼。是不是就好像一個奇怪的傢伙靠著你肩膀對你的每個動作指手畫腳?好的,記住這個場景,並且萬分確定你絕對不會碰到這樣的工程師。
有很多潛在的方法可以應對任何機器學習的挑戰。對於 UXer 來說,過早地被條條框框束縛可能會無意間變得被動而缺乏創造力。相信工程師們的直覺並且鼓勵他們大膽去試驗,哪怕缺乏完整的評估體系會使其對用戶測試猶豫不決。
機器學習是一個比我們想像中更具創造力和表現力的過程。訓練模型過程很漫長,可視化的工具還不是很好,所以工程師在調整演算法時最終靠的是他們的想像力(有一種被稱為「主動學習」的方法,手動「調整」每次迭代後的模型)。持續地幫助工程師們做出偉大的以用戶為中心的選擇任重道遠。
與工程,產品為伍,拼接對的體驗。
工程師們需要被啟發--規則,個人經歷,視頻,模型,用戶研究的剪輯--不論任何方式,只要能夠呈現出什麼才是超棒的用戶體驗--讓他們能順暢地展開用戶研究,並出其不意地將其帶入充滿設計師頭腦風暴,研討會和設計大賽的精彩世界從而更深入地了解產品原理和體驗目標。工程師越早地進入產品改進階段,機器學習系統的魯棒性就會越好,那麼就會對產品形成更加積極有效的影響。
總結
以上就是谷歌內部對開發團隊強調的七個要素,我們希望這些在你的機器學習產品創造過程中同樣有用。隨著機器學習開始助力越來越多的產品和用戶體驗研究,讓我們繼續堅持以人為本,為人們尋求獨特的價值,讓每一次體驗都變得彌足珍貴。
※「當我想像未來的醫院時,我想到空中交通管制塔」
※從全連接層到大型卷積核:深度學習的語義分割全指南
※專訪喬治亞理工終身教授藍光輝:開創隨機加速梯度法助力深度學習
TAG:機器之心 |
※人工智慧產品展示商用潛能
※「產品經理」傅盛的機器人亮相,獵豹的人工智慧轉型立起了「旗子」
※獵豹的人工智慧產品:當做瀏覽器的做起了機器人
※谷歌發布人工智慧新原則:產品不會用於武器和不合理監控工作
※產品經理,如何轉行到人工智慧/機器人領域?
※VR、人工智慧等技術和產品發展日趨成熟更多樣和創新性強的分享模式
※人工智慧新產品——萬圖拍
※生活中的那些人體工學產品
※國家重點研發計劃智能機器人專項「工業機器人控制器產品性能優化及智能升級」項目啟動會在浙江智昌集團召開
※國際計算機學會對話芮勇:讓多媒體計算技術革新聯想產品與服務
※人工智慧技術進入大規模商用階段,人工智慧產品全面進入消費級市場
※神州泰岳「小富」機器人斬獲中國人工智慧產業創新聯盟「競爭力產品」大獎
※邁睿機器人的叉車機器人邀你來「2018工業機器人創新產品評選」擂台攻擂!
※物靈科技:賦靈人工智慧 讓AI產品更具靈性
※工業設計中產品族設計DNA探討
※集多個智能化產品於一身的兒童智能機器人—小朵機器人
※浙江融創利用人工智慧賦能醫療產品創新
※科學築家 智美精工 ——金地集團產品品牌全面升級
※產品工具學習篇
※OPPO亮相人工智慧大會,分享AI技術與極致產品的看法