人工智慧:不智障何智能
本文只討論產品思想,不設計研發語言,AI智能作為目前最流行的話題同時也是未來很多行業的發展方向。隨著行業的發展和互聯網的鋪天蓋地,目前主流的行業都在向人工智慧方向發展,都在尋求自有內容的人工智慧化。
一.智能的兩個方向
人工智慧最初的發展即是依託於計算機計算能力的不斷提升,人類對於原本計算速度的追求上升到了超越人類智慧的目標。其中語音識別和圖像識別是人工智慧的兩大主要功能,也是最直觀體現人工智慧的技術所在。
目前的人工智慧發展為兩個基礎方向一個是針對toB的以符合工業生產和商業使用為基本目的。例如日常消費電子和企業電器設備,當人們使用智能音箱時設備會根據人們發出的語音指令進行識別並提供相應的服務內容,銀行業務機可根據人臉識別對客戶進行身份校驗等等。
另一個方面,則更為專註於智能的深層領域對於感情(motion),意識(consciousness)和思維(mind)等方面的研究。這也是人工智慧中對於智能部分的多重爭議。很多科幻影片都對這種技術的發展抱有悲觀的態度。
二.應用型智能
這類人工智慧的開發對於目前許多應用型產品已經趨於成熟,應用型智能設備的主要功能在圖像識別和語音文字處理部分尤為突出。2018年的上海車展就有對於車載語音識別系統的精彩展示,用戶可以使用普通話或方言以不同的語速對設備發送指令,並且設備可以準確地解析所接收的內容。
圖像識別
語音識別
目前相關的技術也隨著開源的方式被廣泛應用。如微軟,谷歌,百度,IBM等企業都有相應的語音識別SDK開放。尤其在IBM時代的語音識別(ASR)和文語轉換(TTS)就已經相當成熟。
雖然這類應用型智能設備已經得到比較廣泛的應用,但是除了本身的識別技術還在不斷提升外,對於部分場景應用的處理能力還是有些力所不能及。舉個簡單的例子,目前智能音箱的語音識別技術都已經比較成熟了,識別率和辨識度都比較高方便用戶使用。但是對於同名內容會缺少場景應用能力,當用戶提供一個歌名重複率比較高的歌名或比較另類的演唱者名字時系統的識別能力就會像個智障。這就是在語音識別和場景應用中的取捨,首先設備不能吧所有同名歌曲列舉出來給用戶選因為有些可能有上百個重複內容單靠語音播報會增加用戶使用負擔。換言之設備不能基於用戶所處的環境進行判斷的智能應用類型。
三.意識型智能
意識型智能設備更趨於科幻,也是對於人工智慧的最高期許。最著名的圖靈實驗就是一種識別人工智慧程度的實驗理論。目前各類的智能賽事和產品目標都是在向這個方向發展,但是難度之大。首先我們要理解意識型的智能設備是逐漸擬人的一個過程,這裡首先要對人做一個分類即我們如何通過溝通判斷對方是人類的思考。
人們往往害怕缺乏感情的純理智思考,人們熟知的阿西莫夫的機器人三定律(第一條:機器人不得傷害人類,或看到人類受到傷害而袖手旁觀。第二條:機器人必須服從人類的命令,除非這條命令與第一條相矛盾。第三條:機器人必須保護自己,除非這種保護與以上兩條相矛盾。)就會在高度人工智慧的計算中出現一個漏洞即由人工智慧接管社會並圈養人類,這個推斷有錯么?邏輯上沒有錯誤,但是想想不覺得可怕么?
智障是不是更可愛些?當我們面對一個會出錯的人的時候往往會更有親切感,因為錯誤的結果也是存在一定邏輯判斷的只是超出了我們預判的範圍。比如當我們詢問siri什麼叫做愛時(請自行斷句),不會得到學術性的回答而是順勢被siri進行一番調侃,雖然從邏輯上沒有正面的回答問題但是打趣的效果反而會讓人覺得更舒服。
四.圖靈實驗破解假想
上面提到的圖靈實驗是目前最著名的人工智慧判斷時間之一,簡單來講就是由一個測試人員在不知道對方身份的情況下與一人一機進行問答對話。如果測試人員沒有判斷出哪一個是人哪一個是計算機則計算機勝。截止到目前為止只有一個俄羅斯團隊研發的設備通過了測試。雖然我們為之震驚的AlphaGo可以在圍棋比賽中戰勝人類,但是更多採取的是以學習及再次計算使用的技術。這和圖靈實驗索要達到的人工智慧判斷還是有差距的。我們妄自對圖靈實驗做一個假設,在測試人員只能以文字溝通的情況下:
測試人員面對一個智商障礙人士(輕微)和一個機器:當你作為一個測試人員在提出問題後得到兩個回答一個是存在邏輯一個是正面答覆,那麼你會判斷誰是機器?若你在參與判斷之前並不知道這是圖靈實驗並且並不知道對方一定是一個人類一個機器,那麼你又會做何種判斷呢?其實並非一定要是輕微智障人士與機器做比較,這是指一個極端的例子為了闡述這個邏輯更清晰,在一人一機的情況下就算是普通情況也會存在這種判斷的可能。
我們可否假設目前唯一通過圖靈實驗的俄羅斯團隊的設計邏輯就是通過這種逆向思維進行的呢?
五.回歸現實的開發邏輯
討論了那麼多主要是分享一下對於AI的一些理解和在產品構思中的一些基本原則。當我們在設計人工智慧類產品的時候是否應該將多種可能性考慮進去是否應該給定程序一個隨機選擇答覆的權利或者計算方法。
當然隨著現在很多互聯網企業跨界經營,可以在智能設備中加入大數據的基礎提高程序的判斷性。例如當用戶在百度搜索了大量抖音音樂或相關內容後通過賬號關聯可以在用戶使用百度智能音響時優先提供以抖音音樂為主的內容,當用戶語音搜索《love u》時由於是語音識別無法判斷用戶的love you和love u的區別,則可以根據云端數據做優先推薦,因而避免錯誤的內容推送。
AI是一個比較長的道路,深層的開發才是整個行業的發展基礎,對於深層開發需要設計的思考就更多的要以場景為主。將實際場景應用到產品設計之中來增強核心語言的識別率。
TAG:雨屋語 |