亞馬遜眾包網站:現代血汗工廠,也是人工智慧進一步發展的契機
編者按:《連線》雜誌發表了一份報道,描述了人工智慧創業公司利用亞馬遜的眾包網站Mechanical Turk來獲取數據訓練演算法的過程。文章由36氪編譯。
因為地處遠離街道的一個角落裡,舊金山SoMa區的全食超市嬰兒食品區並沒有太多的客流量。我瞥了一眼保安,然後伸手去拿蘋果和西蘭花檸檬泡芙。把它們放進我的空購物車中後,馬上又把它們放回去了。「你拍到了嗎?」我讓我的同事用他的iPhone拍攝這一過程。這是我第一次帶薪「表演」。我正在幫助訓練軟體,以便讓未來的機器人能夠幫助人們購物。
全食超市是一個不知情的參與者,這是一個德國-加拿大的創業公司Twenty Billion Neurons的項目。我悄悄地做了其他9個簡單的動作,包括打開冰櫃,從右向左推車,然後從左向右等等。然後我什麼東西都沒買就離開了。後來,我花了大約30分鐘把視頻剪輯到對方所需的2到5秒,並把它們上傳到亞馬遜的眾包網站Mechanical Turk上。幾天後, 我得到了3.5美元的報酬。如果Twenty Billion想要開發一個購物助手機器人軟體,它將需要更多的數據。
在偷偷摸摸的環遊全食超市的時候,我加入了一支無形勞動力隊伍:他們的報酬很少,以推進人工智慧的名義做一些奇怪的事情。你可能已經被專家或者媒體告知人工智慧是技術的頂峰,但這些工人是是人類背後混亂現實的一部分。
支持者認為,生活和商業的每一個方面都應該由人工智慧來調解。這是一場由Alphabet(谷歌母公司)等大型科技公司發起的運動,表明機器學習可以處理識別語音或圖像等任務。但目前大多數機器學習系統,如語音助手,都是通過訓練演算法來構建的,這些演算法有大量的標籤數據,這些標籤則來自於檢查圖像、音頻或其他數據的承包商,他們會給出標註,比如那是一隻考拉,那是一隻貓,她說的是「汽車」等等。
現在,研究人員和企業家希望人工智慧能夠理解現實世界中的行動。因此,工人們需要在超市和家裡進行「表演」。他們正在生成數據來訓練人工智慧演算法。這就是為什麼有一天早上,我會臉朝下趴在辦公室地板上, 讓粗糙的合成纖維擠壓著我的臉。然後,我的同事拍了一張照片。把它上傳到Mechanical Turk後,我從伯克利一家名為「Safely You」的八人創業公司那裡獲得了7美分的報酬。當我打電話給其首席執行官喬治·內舍爾(George Netscher)說謝謝時,他突然大笑起來,然後假裝正經起來。「這是否意味著存在利益衝突?」(我寫這篇文章所獲得的6.30美元已經捐贈給 Haight Ashbury 免費診所了。)
內舍爾的創業公司開發了一種軟體,通過監控來自養老院的視頻信息,來檢測老人是否已經跌倒。老年痴呆症患者往往不記得他們為什麼或怎麼會倒在地板上。 在加州附近的11個設施中,Safely You的演算法可以幫助工作人員快速找到一個視頻中的位置, 從而揭開這個謎團。
Safely You正在收集像我這樣的假摔數據,以測試它們的系統。該公司的軟體主要是由護理設施中產生的老年人視頻數據來進行訓練,不過在訓練前需要讓員工或承包商進行標註。通過用其他地方(比如Mechanical Turk)搜集而來的數據進行訓練,可以迫使機器學習演算法擴大理解範圍。
那家願意為我在全食超市中表演付錢的創業公司,Twenty Billion Neurons,下的本錢更大,花費了大量的資金來獲取數以百萬計的人們表演數據,來訓練演算法。聯合創始人兼首席執行官羅蘭·梅瑟維奇(Roland Memisevic)認為,這是讓機器獲取物理世界常識的唯一實用途徑,這是人工智慧領域的長期追求。
像國際象棋和圍棋這樣的遊戲,擁有有限的、嚴格的棋盤和明確的規則,非常適合計算機。在現實世界中,哪怕是一個孩子的常識是超越了計算機的。想要倒一杯咖啡,他可以毫不費力地抓住和平衡杯子和水瓶,並控制倒水的弧度。人們利用同樣的根深蒂固的知識,以及對他人動機的理解,來解釋自己在世界上所看到的一切。
如何讓機器能夠這樣做是人工智慧的一大挑戰。一些研究人員認為,那些能有效識別語音或圖像的技術不會有多大幫助,想要突破,需要有新的技術。梅瑟維奇從久負盛名的蒙特利爾學習演算法研究所(MontrealInstitute of Learning Algorithms,MILA)離開,創辦了Twenty Billion,因為他相信如果訓練得當,現有的技術可以給我們帶來更多的幫助。「它們工作得非常好,」他說。「為什麼不通過強迫它們學習真實世界的東西,將其擴展到更微妙的現實方面呢?」
為了做到這一點,這家創業公司正在收集大量的視頻數據,在這些視頻中,眾包演員們會表演不同的身體動作。其希望通過訓練來讓它們的演算法能夠「學習」物理世界和人類行為的本質。這就是為什麼當在全食超市裡表演時,我不僅從貨架和冰箱里拿東西,而且還製作了幾乎相同的視頻剪輯片段。
Twenty Billion的第一個數據集現在已經開源發布了。它裡面有超過10萬個視頻片段,描述了日常物品的簡單操作,比如拿起鞋子,把遙控器放在一個硬紙盒裡,然後沿著桌子推一個綠辣椒直到它掉下來等等。梅瑟維奇沒有提起「製造一個能夠幫助我們購物的機器人」的問題,而是說汽車應用是一個很好的領域,其已經與寶馬合作過了。
我在Mechanical Turk上也看到了Twenty Billion的這個項目,目的是讓汽車能夠識別人們在汽車裡做什麼。人們被要求假裝吃零食,打瞌睡,或者坐在車座上看書。能夠檢測到這些行為的軟體可能會幫助半自動駕駛汽車來識別一個人是否準備好了駕駛,或者是他/她正在拿著飲料等等。
做這項工作的人是誰?其中一個是土耳其安卡拉的地質工程專業大三學生烏爾·布里亞特卡哈林(U?ur Büyük?ahin),他是Twenty Billion系列任務中數百個視頻的主角。他估計每周要在Mechanical Turk上花7到10個小時,賺的錢大概和他以前工作的餐館的小費一樣多。他說Twenty Billion是他的最愛之一,因為它報酬豐厚, 而且到賬也很快。有時候會有一些奇怪的任務,但這並不妨礙他的熱情。「有些人可能會羞於在超市裡拍數百個視頻,但我並沒有這種感覺,」布里亞特卡哈林說。他的女友比較內向,起初對這個項目很謹慎,但看到他的收入後也開始做了,而且有些收入已經轉化成了禮物,比如一套新的捲髮鉗。
布里亞特卡哈林和另一位Turker(指以Mechanical Turk為生的人)——31歲的凱西·考登(Casey Cowden) ,告訴我說,我的一些做法是錯的。總之,我的10個視頻為我贏得了大約4.60美元的小時工資。 他們通過在超市裡呆上幾個小時來完成Twenty Billion的任務,從而獲得更多的報酬。
布里亞特卡哈林表示,他的個人紀錄是在一個小時內完成110個超市視頻。他使用萬向架來拍攝高質量的視頻,當必要時,他會以「這是一個大學的人工智慧研究項目」來應對好奇的店員。根據考登的計算,他和他的一個朋友在當地的一家沃爾瑪超市工作了兩個半小時,每小時的工資是11.75美元。這比沃爾瑪11美元的起步工資要高,也超過了考登的未婚妻在漢堡王賺到的7.75美元。
考登的工作也似乎比沃爾瑪的員工更有趣。去年年初,在他工作的建築公司倒閉之後,他開始成為一名Turker,這讓他能夠在家工作。在家工作意味著他可以在身邊照顧他未婚妻患有老年痴呆症的母親。他說,他最初被Twenty Billion的任務所吸引,因為只要有正確的方法,從中獲取的收入要比Mechanical Turk上的數據錄入工作要高。但他也對在技術前沿工作的想法感到滿意。考登告訴我,他試圖在不同的視頻中改變背景,甚至是他穿的衣服。「如果你的視頻看起來大同小異,你就不能用它訓練機器人去超市購物了,」考登告訴我。「我試著去調整,這樣一來,編程就能獲得多樣化的視角了。」
Mechanical Turk經常被稱為是現代血汗工廠。最近的一項研究發現,其平均工資大約是每小時2美元。它也缺乏一個工作場所的公共氛圍。這個網站將勞動力原子化,讓世界各地的家庭或手機上工作的個人都能幹活。
Twenty Billion僱傭了合同工人來審查人們上傳的視頻。不過,在Mechanical Turk上的一個常見策略是,這家創業公司有時候也會將審核的任務眾包出去。我審查50個相關的視頻後,得到了10美分的報酬。主要內容是審查人們是否按照既定的「腳本」去進行表演——「坐在座位上睡著了」,「從杯子里喝點東西,」或者「兩手捧著東西」。
這項任務把我送到了卧室、休息室和浴室中。我也欣賞到了不同風格的表演。為了假裝睡著, 一個赤膊的男人在黑暗的房間里輕輕地向後傾斜, 帶著一種沉思的表情;一個女人似乎在一個壁櫥里, 讓她的頭似乎像一個被切斷線的木偶一樣向前突然前傾。
其中一些人是孩子——這違反了亞馬遜的規定,即要求員工至少年滿18歲。一個穿著校服的9歲的亞洲男孩,從一張髒兮兮的塑料椅子上向外張望, 然後假裝睡著了。 另一個亞洲男孩,年紀稍大一點,「用杯子或罐子喝水」,而另一個孩子則躺在他身後的一張床上。Twenty Billion的首席技術官英格·巴克斯(Ingo Bax)告訴我,該公司在最終的數據集上屏蔽了這類視頻,但也有可能在排除這些視頻之前,已經給他們付了錢。梅瑟維奇說,公司有防止系統支付這些視頻的協議。
我在YouTube上也發現會有孩子出現在這些視頻之中。在幾十個被意外曝光的視頻片段中,人們會根據腳本表演一些「一個人跑下樓梯,邊笑邊喝咖啡,而另一個人在修理門把手」之類的視頻。
我在試圖從「AI Indoors Project」中揭開Mechanical Turk表演工作背後的人的時候, 發現了這些視頻。在論壇上,人們聚集在一起抱怨和交換信息,這表明了西雅圖卡內基梅隆大學和艾倫人工智慧研究所的合作。
像Twenty Billion一樣,他們也收集了成千上萬個視頻,試圖提高演算法對物理世界和我們在其中所做的事情的理解。這個項目的研究生貢納·阿特利·西古德森(Gunnar Atli Sigurdsson)回應了梅瑟維奇的說法,當我問他為什麼要付錢給陌生人,讓他們倒飲料或拿著手機下樓時。他說他想要演算法來理解我們。「我們已經看到人工智慧系統在一些非常狹窄、明確定義的任務中表現得非常出色,比如國際象棋和圍棋,」西古德森說。「但我們希望在我們的公寓里有一個人工智慧管家,讓它了解我們的生活,而不是我們在Facebook上發布的那些無聊的東西。」
如果科技公司能夠讓人工智慧征服日常生活,那麼它將是機器學習專家的最新勝利。如果Twenty Billion的方法能解決問題,那麼真相將會變得更加混亂和有趣。如果你曾經在超市裡得到過機器人的幫助,或者乘坐一輛了解它的人在做什麼的汽車,想想那些可能訓練過它的人群。考登說,他喜歡Twenty Billion的任務,部分原因是他的母親正在與骨癌作鬥爭。能夠理解和干預我們世界的機器人和軟體,可以幫助解決護士和家庭健康助理日益短缺的問題。如果他們所做的項目是成功的,那麼這些眾包演員可以改變世界——儘管他們可能是最後受益者之一。
編譯組出品。編輯:郝鵬程
※作畫大師、人工智慧調酒……谷歌正把AI變得更有趣
※滴滴路測無人車已有數月之久,採用改裝後的觀致5 SUV
TAG:36氪 |