全球公認機器學習之父 Tom Mitchell：人工智慧如何跟智適應學習相互聯繫

最新 11-17

i黑馬&火柴盒訊 11 月 16 日，在雷鋒網聯合乂學教育松鼠 AI舉辦的「全球 AI+智適應教育峰會」上全球公認機器學習之父 Tom Mitchell發表了演講。

以下為他的演講內容，經i黑馬&火柴盒整理編輯：

Tom Mitchell：非常感謝，首先我要感謝本次會議的主辦方，讓我們今天有機會來到這裡。我要告訴大家一件事，我覺得智適應學習以及相關的教學一直都在發展，但是我覺得最近10年是最好的10年。因為在最近10年我們開始看到了這些技術更加成熟，公司也開始運用這些技術，所以我覺得本次會議，尤其是今年是我們這個領域的轉折點，今天的各位觀眾會發明新一代智適應學習的技術。

今天要跟大家談的幾個點是分享一下我的想法，跟大家談一談人工智慧以及人工智慧如何跟智適應學習相互聯繫。這三張PPT是從YouTube上截取的，告訴了我們智適應學習是什麼。智適應有個體系，在體系當中老師會不斷評估學生的能力，會發現學生的不足點，給他們設立目標，會發現學生學習的需求，根據學生的學習速度給他們一些更好的建議。

我們發現有些系統已經開始做這件事情了，但是他們都處於早期階段，我們接下來會做更多的工作來改善這個系統。今天要跟大家講機器學習以及人工智慧，它們會是智適應學習當中的一種驅動式的技術。

我們仔細的來看一下，當前機器學習在過去10年發展得非常快，所以過去10年在計算機視覺方面AI剛開始做得不是特別好，但是後來它的識別精度就非常高了，幾乎跟人眼一樣。所以在屏幕上我們可以看到，自2010年以來計算機視覺的精確度非常高，這裡的橫軸是人的，旁邊是機器識別的情況，有個對比，準確率非常接近，機器學習的速度非常快。對於語音學習的發展速度也非常快，還有在圍棋方面，AI已經打敗了世界冠軍，還有在機器人汽車方面我們也會有很多無人駕駛汽車跟機器人的結合。

所以展望未來，我們可以說這樣的機器學習如何會促進AI的發展，促進智適應學習的發展呢？我覺得有三個問題值得我們討論：

1.機器應該學習什麼？

今天或者昨天我們做了很多有益的討論和探討，我們要有個性化的，基於每個學生的教學戰略。比如說學生的退學率，學生的考試成績以及提出一些建議，老師應該在什麼時候介入，如何在學生和機器之間進行介入。

2.我們要從哪些數據中學習？

長期以來，我們看到很多系統都會計算網路的數據，會計算學生是否答對了題目，以及在這道題上花的時間和滑鼠點的次數。我們發現不同類型的數據，包括環境式的數據，比如說教室里的攝象頭、耳麥、話筒等等，有這些環境數據我們可以更好的了解學習者的情況，比如說教室里是不是有噪音，溫度是不是合適，我們也看到了很多身體上的感測器，比如說有智能手錶和智能椅子，都可以感知學習者的學習狀態。未來我們還會有智能椅子的發明，它可能會監測到學生是不是搖來搖去，有沒有走神，我們也可以用EEG來監測大腦的狀態，所以機器學習方面我們發現數據的來源也很重要。還有演算法，對於機器學習來說也很重要。

我們可以看一下演算法的情況，這種是監督式學習的體系，這是卡耐基梅隆大學一個博士生提出來的，有這樣一個網路，可以預測哪些學生會退學，或者會從網課中退出來。它監測的一些數據就包括了學生在課程上花的時間，以及滑鼠的點擊數量，所以監督式的學習會從輸入和輸出端進行監測。中間是一個網路式的結構，監督式學習對於智適應教育也非常重要，我們就需要一系列的技術來提升監督式學習的精確度和效率，要考慮到學習當時的情景。

比如說我們想要把網路訓練的更加智能，會更好的監測，這個學生會從哪門網課中退出，或者會不會從其他的課程中退出，這也是在跨任務轉移當中我們需要關注的點。

3.多任務處理學習。

這個學習理論是20世紀90年代末期提出來的，我們想要有很好的訓練體系，有時候我們想提升準確度，我們會預測其他的一些變數。比如說我們要去監測哪個肺炎病人在疾病末期會變得非常嚴重，不光是肺炎的嚴重程度，還可以來評判一些其他的參數或者變數，比如說白細胞的數量或者是他們有沒有到ICU進行治療，我們就可以讓系統來預測很多不同這樣的變數，其中最重要的就是看一下肺炎的嚴重率。

在這方面我們也可以考慮一下，用這樣的模式來預測學生的退學率。其中一個方式我們並不是讓系統只看他的退學率，而是看其他的變數。比如說他期終考試的成績，這樣的技術之所以能成功，是因為它可以訓練我們的系統，有對多個變數的預測，這樣就能讓學習者更好的來學習神經系統，而且在這個過程中可以有一些歸納的程序，讓這個系統能夠更好的預測我們真正感興趣的變數。

在機器學習的演算法中，另外一個非常有意思的方法就是非監督式學習，這也是我的同事在卡耐基梅隆大學做的研究，他們看了一下不同學生的聚類，主要是看一下他們回答問題的正確率，他們把所有的學生聚在一起，把不同的表現分類。大家可以看到有三種非常不同的曲線，紅、綠、藍。對於綠色這一組來講，他們一開始做得特別好，但是後來突然間下降了，之後就做的沒有那麼好了。對於這種非監督式學習，我們發現一個規則之後就可以進行干預。比如說我們可以預測一下這三組人他們期末考試成績是怎麼樣的，更好的指導其他的學生。

增強學習，這一定非常重要，是因為有特殊的學習演算法。也就是在每一個時間點，在整個過程中我們都會給它不同的行動，我們可以在AlphaGo中學習，也可以使它不斷增強能力，打敗了圍棋冠軍。在增強學習這方面它也是基於決策過程，簡單的說法就是比如說在圍棋方面，每個圍棋上的點，下每個子都是一個決策，我們會有一個獎勵或者激勵的機制，就是我們要通過這樣的獎勵機制告訴系統他們應該做什麼，怎麼樣達到成功的結果，我們就有這種獎勵機制，如果對手放棄的話你加一百分，你放棄的話就減一百分，我們不斷的訓練這個系統。這個過程中可能會產生數百萬個行動的序列，不同的順序，在AlphaGo方面一直是跟自己對弈進行訓練的。

我們看一下這樣的方式，其實是和我們智適應學習概念非常類似的，比如說在智適應學習中我們也有不同的狀態和不同的行動，這個狀態指的就是學生的學習狀態、心理狀態。現在的行為是指教學行為，我們應該給他考試、放視頻還是評估呢？我們同時也可以定義一些獎勵機制，告訴我們想要選擇什麼樣的行動能更好的促進學生的學習。如果是正分就說明我們做得好，負分就說明做得不好。在每一個學習的狀態下應該採取什麼樣的行動，在這樣的反覆訓練中我們就可以有整個行動的序列，最終拿到最好的獎勵。

關於增強學習非常有意思的一點，就是在這方面有很多進展，在過去5年中有非常大的進展。大家可以看到，在圍棋中我們也有很多的變數，在這個過程中我們有很多變化的問題模型，也是一個非常個性化的模型。在機器學習的研究人員來看，我們也會有這樣一些變數以及一些抽樣的方法，包括對於演算法，對於數據來進行選擇，現在我們處在最好的時代，對於諮詢教育來說。

我們再來看一下第二部分，看一些更加具體的研究，首先看一下新的收集學生問題的類型。每次我們想到機器學習的時候都會相應的演算法，比如說是40%，另外60%的重要性來自於數據，我們想要做得好的話數據是非常重要的。我想給大家看一下我的同事做的一個研究，這個人和計算機在進行互動。「你好嗎」「我很好」，大家可以看到他現在的表情和面部在不斷的被追蹤，「你想要看什麼樣的新聞？」「看一下棒球的新聞」，它有不同的監測。這個系統所做的是1秒1秒的來追蹤這個人的面部表情，同時來追蹤他的語音，這樣可以推斷這個人的情感狀態，大家可以看到紅點在不斷的移動，就是看一下這個人的情感狀態，是積極的還是消極的狀態，以及他的能量和整個情感狀態。這樣的項目現在仍然在進行中。

它是由卡耐基梅隆大學的教師做的，也是和另外一位教師合作，他們要將這樣的技術應用來分析視頻，這個視頻也是師生互動。這個視頻講的是有些學生他們想要解決數學題，我們看到橫軸是時間，在這個過程中我們可以看到每一秒都可能有不同的情緒變化，學生的情緒會辦法改變，這些小的框代表誰來說話了，或者他們有沒有看老師這樣的動作。

我們看到第一部分學生在大生的讀，因為上面可以看到有學生說話的顯示。我們可以看到在這一階段的最後，系統推斷出這個學生應該有一些沮喪和消極的情緒，在這個時間點老師就介入了，老師介入能夠幫助學生更好的理解這道題。再往下走，第三部分學生就開始做這道題，在上面會說「我不明白」，學生就會說「那你需要幫助」。學生沒有理老師，而是繼續做這道題。再往下走，學生再說一些話，感覺他應該是做出來了，我們的系統檢閱到了一些喜悅的情緒，我們現在已經需要改變了，你是不是需要幫助，老師會這樣寫。在這個方面老師就和學生一塊進行問題的解決，做出來之後就會發現系統檢測出來有一個非常快樂的情緒。

這樣的一個技術現在仍然在開發，大家可以看到它的基本概念，這個技術如果變得越來越好的話我們就會面對這樣的情況，就是每一秒我們都會監測學生的情感狀況。比如說我們在一個屋子裡，有很多學生和一個老師，這個老師就會有每秒鐘的反饋，看哪一個學生他現在就要給予指導。因為在他們的實證研究中發現，教師延時的反饋和負面影響是有正相關關係的。

這是剛才給大家舉的一個例子，就是現在我們仍然在進行的一個研究，以後可能對整個教育界會產生非常大的影響。

另外一個研究的方向我覺得也是非常有意思，就是要探索新的教學互動方式，我會給大家看一下我們大學一位教授的研究。他說有的時候我們通過教別人反而學得更好，也就是說在這個過程中我們會讓學生充當教師的角色，讓他們來教這些模擬學生。大家可以看到這樣的一個情況，是有一些真的學生在線上教這些模擬學生。在這個過程中我們可以看到，其中有三個不同的方面，有模擬學生，也就是基於計算機的方面來學習如何解數學題。他們這方面也是有一個機器學習的演算法，也是可以通過不同範例的問題來學習解決這一類問題。

在屏幕上會有一步一步的解決方法，來徵求人類教師的解答。我們的人類學生是來教這些機器人做這個題的，教這些機器的系統，他們會教模擬的學生如何來正確的做這道題，正確的回答。

還有第三個方面，基於計算機的人物Willams先生，知道如何解決任何題，可以及時記錄並且指導，他是來幫助這些人類的同學，讓他們在這個過程中如果有需要指導的話可以進行指導。這也是非常有意思的，我們可以看到是通過教學來學習的，它可以比傳統的教學更加有效。比如說我們剛剛談到的計算機里的專家Willams先生，可以先幫助學習比較差的同學，讓他們獲得成功。

我們也做了一些其他的研究，這些研究發現我們教河流生態系統的時候，用這種教的模式讓學生去學，比傳統教學模式效果好很多。這是非常有趣的想法，但是我們必須有人工智慧的技術才能創造這種模擬的學生，這樣的教學模式才可以實現，所以這種教學模式會有很大的可能性。

我自己的團隊也做了一些嘗試，我們想要建立一個體系，讓學生去教計算機。我們用的是自然語言來進行理解，我們的想法剛開始跟教育沒有什麼關係，我們剛開始的想法就是想做一個東西，讓手機的用戶教手機一些東西，用自然語言進行教學。比如說我告訴我的手機，我生產在匹茲堡，如果下雪的話請提前30分鐘告訴我，因為我需要知道天氣的情況。在這個過程當中我想要讓所有人都能夠教他們的手機進行重新的編程，所以我就給大家舉一個例子，我們是如何去做的。

給大家舉一個非常簡單的例子，我們是用當前的系統去做的。我們可以看到有一個視頻，會聽到我們的博士生跟機器說「四點鐘的時候我們要開會」，機器就會說「我不知道四點鐘開會是什麼意思」，所以它會說「你想要教我的話你就教我」。他就會跟系統解釋「下午四點開會」是什麼意思，機器要做什麼事情，我們可以看一下這個視頻。

「首先你要創造一個新的郵件」「寫一個新的郵件是吧」「是的」。已經有了新的郵件了，「把收件人全部改成我團隊的成員」「收信人是你的團隊成員，已經寫了」「我們寫主題是下午四點開會」「郵件主題是下午四點開會」「再點發送」「好的，我已經發送了」就是這樣子，所以它要做一個測試。「我現在已經知道了，會去通知別人做事」「跟我的助手說一下下午四點我會很忙」「跟你的助手說一下你下午四點會很忙是吧」「是的」「現在就去執行」「好的」。

我們就放到這裡，我們可以看一下，對話剛開始是跟團隊說一下下午四點鐘開會，這個系統會說我不知道，然後你一步一步的教它，比如說要發寫郵件，收件人是誰然後再發送，這就是一個訓練的模型。

對話的第二部分是說告訴我的助理，要告訴這個系統自然語言是什麼，要一步一步的教它，這個訓練之後系統會說我明白了。你告訴我的助手下午四點我會很忙，所以第二個語句跟第一個語句是非常像的，這就是說你要告訴別人做一件事情，但是這個系統經過訓練之後他們就會在第二次理解這樣的語言了，這就是自然學習語言的方式目標和做法。

這裡面有兩個理念，第一個理念就是每句話的句式它都是可以執行的，對句式進行翻譯並且變成可執行的代碼。還有學習，比如說系統要學習新的步驟，系統也在不斷的學習自然語言處理的能力，因為它可能不知道「告訴」是什麼意思，現在它就知道了「告訴」是什麼意思。像這樣的一個研究是我們之前做的，剛開始只是一個小的想法，沒有想到是教育，如果把這樣的想法跟當前的教育行業結合起來的話，跟模擬學生、計算機學生結合起來的話，我們會發現學生跟計算機的體系會有很多互動，之間的潛力是很大的。

最後要跟大家做一個總結，在剛開始的時候，我們談到了現在對於智適應教育來說是一個非常興奮的時代，我主要的理論是人工智慧是這個時代主要的驅動力，會改變我們數據的本質，會讓我們收集到非常多的互動性的數據，人與電腦之間的互動性數據，我們還可以獲得更多關注學生的高質量的數據，我們可以加入到對話式的學習。我覺得會有一個轉變，之前我們會覺得教育是老師和學生之間的事情，但是我覺得它現在是一個三方的事情，包括老師、學生和電腦，以及這三者之間的互動。

現在在中國我們有非常好的獨一無二的優勢，能夠在AI教育方面成為世界的領先者。中國的教育部也有非常有趣的一些項目，就是中國有最大的學生數量，所以我們發現今天有很多人來參與教育AI人工智慧的會，這也表明了大家對此非常重視，中國也很有可能會成為世界上首個國家能夠向大家展示如何用學生當中獲得的數據來改善AI的教育，以及教育和AI的結合，中國也能向其他國家展示如何運用方面的知識。

最後要感謝大家的聆聽，謝謝！

關注「火柴盒」觸摸教育產業未來

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 i黑馬 的精彩文章:

※呼喚電影營銷新時代？這家公司眼中的新機遇
※拼多多雙十一物流訂單增長逾300％萬人線上大拼團成為普遍購物場景

TAG:i黑馬 |