AI無法培養出老舍,卻能讓頂級名師不再是稀缺資源
作者|蘇一
編輯|Natalie
AI 前線導讀:AI+ 教育可以讓老師提高教學效率、幫父母減輕「陪讀」負擔,但是否會讓孩子在應試教育的泥沼中越陷越深?
AI 時代的到來,讓傳統的教育行業站上了前沿技術應用的風口,國民教育市場這塊大蛋糕正被垂涎瓜分。
經歷了被稱為「在線教育元年」的 2016 年,2017 年在線教育的浪潮依然澎湃。「鯨准數據」顯示,2017 年教育領域的融資數量超過 450 起,入場的投資機構近 200 家,其中不乏頂級投資機構:紅杉、經緯、華平、GGV、招商局、遠翼資本、IDG、鼎暉、雲鋒基金等。
其中,覆蓋時間長、用戶規模大(超 1.8 億)且是剛性需求的 K12(kindergarten through twelfth grade,即幼兒園到高中畢業),是最有爆發力的細分賽道之一。2017 年,K12 領域 AI+ 創業公司的融資堪稱數字接力賽,億級美元的融資層出不窮:學霸君 2017 年 1 月獲得 1 億美元 C 輪融資;猿輔導 5 月獲得 1.2 億美元 E 輪融資;8 月份作業幫獲得 1.5 億美元 C 輪融資;不到一周,VIPKID 就刷新了前者記錄,獲得 2 億美元 D 輪融資。
在資本推動的教育 AI 浪潮中,AI 教育技術究竟發展到什麼階段?加上了人工智慧的教育,究竟發生了什麼變化?就此,我們採訪了學霸君首席科學家陳銳鋒。
更多乾貨內容請關注微信公眾號「AI 前線」,(ID:ai-front)
教育的「AI 故事」從數據開始
AI 對教育賽道的入侵,基本上是打著「掃除知識盲點」、「實時反饋溝通」以及「因材施教」的大旗。在實際產品中,拍照搜題、在線輔導和 STEAM 教育等是 K12 賽道最常見的落地模式。
目前,貼上「因材施教」等標籤的公司很多,操作思路也大同小異:藉助 AI 等技術,拆解不同學科的知識點,在較短時間內檢測出學生對知識點的掌握程度;在對學生情況充分了解後,進行個性化推薦。不過,從技術角度來說,要實現 K12 學習的個性化匹配並不容易。
想用 AI 來打通某個行業,前提是大量優質數據和強大的計算機能力,教育行業也不例外。個性化的前提,是對學生數據的採集和處理,隨後才能進行模型訓練,提出解決方案。
收集龐大且高質量的數據並不容易。拿學霸君來說,其收集數據的過程經歷了多個階段。2012 年,公司以拍照搜題技術起家,其移動端拍照搜題 app「學霸君」藉助圖像識別等技術將學生拍的照片轉化為題目,同時,基於此前積累的題庫資源,可以為這些題目匹配相應答案。
圍繞此前構建的諸多技術壁壘,學霸君拍照搜題 app 為其帶來了一定的 C 端流量:9000 萬註冊用戶,超過 100 億答題搜索,這些都成為其沉澱的重要基礎數據。
2016 年 12 月,學霸君推出在線一對一輔導產品「君君輔導」(現已更名學霸君 1 對 1),在此前純工具性的拍照搜題中加入了教師。「這個階段的困難在於大規模直播技術的壁壘:在個人對數百萬學生的實時答疑中,為了保證某些通用技術差的區域網路能始終不卡、不斷,我們需要定義自己的數據格式來有效傳輸視頻、手寫筆跡、課件等數據,在網路傳輸協議上做定製開發等。」陳銳鋒稱。
相比前兩次相對具體的難點和目標,學霸君第三個階段的目標顯得有些抽象:「實現教育公平,讓老師教得更好,學生學得更好」。公司為此推出了以「智能筆 + 本 +Pad」套裝,結合包含教師端、學生端和題庫等在內的「AI 學智慧教育平台」,提供給 B 端(包括學校和機構等)。在這三個階段,關於公司收集的數據及其背後的技術迭代,陳銳鋒在採訪中進行了解讀:
AI 前線:從拍照搜題、學霸君 1 對 1 到 AI 學教育平台,中間有哪些數據和技術迭代?
陳銳鋒:我們早期在做拍照搜題時,題目只要能看懂,有參考價值,基本上就可以了。在一對一階段,因為是一個老師對一個學生,它的精度也不需要像入校級別的 AI 學教育平台精度那麼高。
但到了入校級別、需要布置作業的 AI 學平台,是一個老師對一幫學生,很難像一對一那樣針對性地描述疏漏、細節以及相應的不足。所以我們要求入校級別的數據精度要非常高,這對我們的題庫提出了很高要求,導致我們早期搜集的題庫,不一定能在 B 端里直接用。為了迭代這樣的技術,我們在題庫的重新加工上,提出了整套的數據生產方案,以保證應用的題庫是高度可靠的。這其中綜合應用了錄入、數據生產以及自動解題中的題目修正等技術,以保證題目的高精度和比較精確的知識點標籤。目前我們的核心題庫文字正確率要求是達到 99.99%。
AI 前線:目前收集到的是哪些層面的數據?不同階段的數據來源有哪些不同?
陳銳鋒:目前收集到的數據包括內容數據和行為數據。相對內容數據,行為數據更難收集,因為後者必須發生行為才能進行搜集,每次行為的發生成本是很高的。比如說我們要收集寫字這個行為,要開發相應的硬體作為數據收集終端。
我們收集時主要有幾個渠道。最初,我們有教育機構,這塊的積累給我們提供了最基礎的題庫,通過不斷加工這部分數據,我們有了部分內容數據。這其中的加工需要 OCR 技術和人工矯正技術等。有了內容數據後,我們開始收集行為數據,比如在用戶問問題的行為中,我們可以了解到他們喜歡問哪些問題;在答疑中,我們可以了解學生怎樣問問題,怎麼聽老師的講解;另外還有學生的手寫數據等。
在學校中,老師在教師 Pad 上布置作業,學生端 Pad 即時顯示題目,學生用智能筆在本上作答。這個過程中,結合了攝像頭和感壓晶元的「智能筆」成為收集學生書寫習慣等數據的重要工具,包括學生每天寫作業的時間,某道題寫了多久,寫第幾步時有所猶豫等數據都被全面地記錄在平台里,系統由此可以判斷學生的學習風格,歸納出「學霸」、「中等程度」等學生類型。
通過「智能筆」獲得的數據,包括每一筆的力度、從起始點到最後一點握筆到抬筆的時間、過程順序等。比如,筆不斷穿越某個 20 秒前寫的字,快速地和其筆划進行交集,這意味著這個字正在被塗改。在書寫時有掙扎,反映學生寫時不確定,大量塗改意味著他可能不明白。這些特徵都可以有邏輯地提取出來。目前 AI 學智慧教育平台已在安徽、廣東、福建、西藏、上海、深圳等省市的近百所學校試點,並成功幫助試點班級實現提分。
經過幾個階段的產品落地,目前我們收集到的數據主要包括:早期教育機構積累的題庫數據;學生拍照和答疑數據;學生手寫行為數據和人工精標性數據。這些數據的背後,是各項技術的「組合拳」:包括「拍照搜題」中的圖像和文字識別技術;「學霸君 1 對 1」中的手寫識別技術以及「AI 學平台」中的自適應學習體系、個性化推薦等。
AI 前線:對任何 AI 公司來說,精標性數據都非常重要。學霸君在收集精標性數據上是怎麼做的?
陳銳鋒:我們的精標性數據中,最典型的就是手寫數據。學生寫的沒有成人那麼規範,所以通過傳統模型,手寫數據的精度上不去。
為了解決學生手寫中因為塗改、寫作不規範等導致的數據精度不足,我們或讓成人在數據層中模擬寫大量數據,然後對此進行搜集;或在學生手寫數據基礎上,讓成人進行二度標註。這裡面有部分自動化,也有人工手寫標籤。
對標註團隊的要求,會因為不同數據而有所不同。如果是標註題目的話,要求標註人必須有教學經驗,否則其標註的標籤讓人不敢確信。如果只是簡單標註文字,那標註人只要有基礎文化就可以。其他的,要看具體問題。
AI 前線:現在精標註的數據量大概有多少?
陳銳鋒:目前我們的精標註數據足夠訓練我們相應的問題。
AI 前線:目前針對同一學科中的不同科目,數據的收集和模型訓練是獨立的嗎?還是說某些部分可以復用?
陳銳鋒:未來應該會有更多復用的技術,但目前這個階段更多還是把不同的知識點拆開做針對性的處理。比如說幾何題和應用題,它所涉及的技術還是相當不一樣。尤其是立體幾何,它需要圖形的解析和重構,這一塊在計算題里是不太出現的。不過計算題里的一些符號,背後有一些計算,這些模塊在其他地方或也可以用。目前,在解題里,我們更多是根據垂直領域做針對性的調優,但在識別領域則更多是復用以前的一些技術:比如說化學式的識別,實際上可以復用公式識別的一些技術;立體幾何或平面幾何,在寫出來的部分,可以用其他領域的一些識別模型;從印刷體模型到手寫體模型,我們可以復用一部分深度學習的模型,再加入能反映手寫文字筆畫順序形態的一部分針對性網路。
從「搭脈式教學」走向 AI 教育
在陳銳鋒看來,應試教育的考試範圍和知識點相對固定。這意味著,理論上學生只要掌握了知識點對應的題型,就能拿到較好分數。
但在浩如煙海的題庫里,如何找出那些你真正需要寫的題目?
此前,選擇題目的任務主要落在老師身上。除了將知識框架進行細分,在判斷學生水平的基礎上,給出適合的練習和指導方案成了老師的核心競爭力。這種判斷力是評價老師好壞的重要標準。
不過,在傳統教學模式中,老師的這種判斷更像是老中醫,依靠感覺搭脈,這種主觀性導致「老師布置的 2/3 題目可能都是非必要的」。AI 要做的,是讓學校在教學進度管理中,用數字化替代感覺。就像「去醫院量血壓、驗血、做 CT 一樣,體檢結果會清晰地告訴你,對知識掌握了多少,離 985、211 還有多遠。」
如何讓機器實現這種判斷,首先要對學生進行自適應診斷。比如說立體幾何課上,老師想出些練習題給學生,首先要了解什麼樣的題目適合練習以及學生水平如何,隨後才能進行推薦。
在陳銳鋒看來,傳統教學的自適應問題在於:每個學期只有兩到三次考試,「評估層級獲取的頻次太低」。二是學生有了錯題後,很難向其提供更深層次能舉一反三的類型題。第三,對學生錯題的反饋間隔太長。對此,學霸君藉助 AI 學智慧教育平台一一解決問題,陳銳鋒對具體細節進行了解讀。
AI 前線:公司目前最重要的業務版塊——AI 學智慧教育平台最初是怎麼搭建起來的?它背後的架構是什麼樣的?
陳銳鋒:AI 學智慧教育平台的搭建,最初是從 C 端往 B 端轉的時候,在題庫技術、識別技術和推薦技術的基礎上,做成的一套包括智能筆、平板和部分軟體的 B 端產品。它背後的架構,一是數據層,即我們最早從 C 端獲得的調優過的數據層;中間是模型層,包括推薦和知識圖譜;外化的一層則是全新的界面交互。
AI 前線: AI 學智慧教育平台背後有哪些技術模塊?它們分別是如何運作的呢?
陳銳鋒:這裡面的技術,簡單來說,就是數據識別技術和推薦技術。背後的模塊主要有兩個維度,第一個是考試維度和作業維度,這是學生發生行為的交互場景。第二個維度包括課前、課中和課後。其中,課前有備課系統,我們的技術可以幫助老師準備上課材料,比如幫助老師選題或幫助其準備講課 PPT。這裡面有幾個模塊,其中之一是選題推薦系統,核心技術包括自然語言及個性化推薦等。
對老師來說,AI 選題系統能在課前幫助其備課,比如有針對性地向其推薦上課內容;在課堂練習中,老師對 PPT 內容進行講解,如果想多講幾道題,可以在課堂中實時接入我們題庫的大數據系統。通過觸發推薦系統,獲得想講知識點的相關題目。講完後,根據學生內容的對錯,對第二輪要講的內容進行調整,讓學生做第二輪的練習。第二輪練習是基於第一輪的錯誤情況篩選出來的。
在課後,系統可以對學生練習內容進行個性化推薦,還能實現實時批改,高效收錄錯題等。同時,老師可以在後台看到學生學習和作業數據,了解課堂中哪些知識還沒被掌握,進行有針對性的講解和答疑。
對學生而言,在個性化推薦下,每個人打開 Pad 做作業時,作業可能都不相同。上課認真聽的學生,正確率很高,作業可能相對較少。錯題較多的學生,其系統可能會提示他把某塊知識補一補。
AI 前線:個性化推薦似乎是 AI 學智慧教育平台中非常重要的部分,它背後的演算法經歷了怎樣的迭代?
第二個階段還是沒有考慮行為,但它會將知識點邏輯相關的考點演算法和步驟,一次性地推薦給學生,這個階段比第一個階段更深入一點,背後有更深層次的語義和邏輯關聯。第三個階段,系統會把行為關聯起來,根據過去的錯對題情況,結合條件反應理論和記憶曲線,綜合給學生推薦相應題目。
目前我們的演算法主要包括三個層級。一是基於回歸神經網路的行為預測,基於學生以前做的題目預測未來做題的對錯情況。二是條件反應理論,即大量題被做時,系統會對所有題進行難度曲線評估。三是知識圖譜,即把所有題目的上下層關聯起來。一道題錯了,系統不一定會再推薦同樣的題目給你,而可能會給你推薦上下沿的知識點。因為有時候學生不是不懂這個知識點,而是前面的知識點就有缺陷,有了知識圖譜後,系統就可以更全局地和學生互動。
AI 前線:您曾經說過,自動解題是實現個性化推薦的基礎。自動解題背後有哪些技術構成?
陳銳鋒:自動解題意味著將題目步驟進行拆解,轉換成計算機能理解的形式語言。同時計算機對題目難度進行推理,讓不同水平的學生做適合自己的題目。
一道題出現的時候,可能是純文本,可能帶些公式,首先要把它變成機器可以理解和解碼的形式語言和描述環境。在此基礎上,通過自然語言分析可以抽取出題目的條件和問題,然後基於條件和問題找出最佳解題路徑,形成序列。隨後,將解題路徑翻譯成人可以看懂的過程,即最終的解題結果。
基於解題結果和題庫原有的答案與學生的作業進行比對,可以判斷對錯。這些錯誤被系統記錄下來,就形成了不同學生的畫像。
AI 前線:人工智慧教育的崛起,對傳統教育會有什麼衝擊?會不會讓老師失業?
陳銳鋒:不會,它會成為老師的幫手。此前,教育的不公平主要是因為教育資源不均衡,我們系統的價值是給每個孩子一個能隨時關注其學習情況的機器人老師。在此基礎上,真正的老師生產力獲得進一步解放,可以將精力更多放到和學生的交流溝通上,對學生真正的知識薄弱點進行專攻等。
機器人可以告訴老師某個知識點有問題,但它是沒辦法代替老師進行講解的。當數據彙集到老師那兒,一個優秀的老師會根據數據讓學生有針對性地做題、有針對性地聽課,而不是盲目地做題和聽課。
AI 教育生產的只是考試機器?
「通過 AI,不能培養一個老舍,但可以培養出一個寫 B 類文的高考學生。」在面向高考的 K12 教育賽道,AI+ 教育的產品研發,目前更多還停留在如何更好地向學生灌輸知識,提高學習成績這些層面上。
在具體應用中,相比人文學科,AI 和理工類學科的結合更加緊密。這一方面是因為理科類數據相對更龐大,「數學問題是學生關注最多的,在所有學科中佔比接近 40%。語文雖說大家也關注,但查一個拼音或成語,不一定非要用人工智慧。」陳銳鋒稱,另外,「理科邏輯推演較強、客觀題較多,是 AI 很好的測試樣本」。
相較而言,因為很多題型沒有標準答案,同時過於注重思辨,人文學科在和 AI 的結合上難度更大,但這並不意味著毫無機會。「文科可以拆分,比如說古詩詞、錯別字等都可以用 AI 來訓練;而作文、閱讀理解等現階段較難用 AI 來作自適應訓練,但可以用 AI 來推薦參考學習輔助備考。」陳銳鋒稱。
「比如,考慮到高考作文打分有非常強的加分點和減分點,可以通過手寫識別標出加分點和失分點,甚至未來可以實現自動作文打分。如果能做到自動作文打分和老師打分相差不超過 5 分,對學生自我驗證作文程度相當有幫助。」據陳銳鋒透露,學霸君 2018 年將在文科方向增加發力。
但不管是文科還是理科,對於成績和應試的強調,始終是目前教育 AI 的關鍵。這種唯成績論是否會帶來技術異化,讓人忽略對其他能力和品德培養的挖掘,成為部分人的擔憂。
在陳銳鋒看來,AI 的確很難替代需要情感溝通的學習場景。比如父母看著孩子寫作業這個場景,或許可以通過監視器進行替代,但其中的感情交流互動完全不可同日而語。這也是 AI 的局限性。
回顧 2017 年,陳銳鋒透露,因為現有教育與技術深入結合的可參照成功模板有限,公司在技術和業務上需要探索新路。目前其團隊超過 700 人,技術人員超過 300 名,核心的產品研發重點關注教育行為數據的收集、知識庫的構建和自適應學習在 B 端和 C 端的應用。
他認為,目前 AI+ 教育已經取得了部分成果,但總的來說仍處於剛開始的階段。「讓機器根據一部分題目的文字的內容提取題目的條件和問題,並給出解題步驟已經有初步效果。但如果要給出更詳細的知識點,還需要繼續完善和優化深度學習模型。」未來,AI+ 教育可以努力的空間還有很多。
採訪嘉賓
陳銳鋒,學霸君首席科學家,新加坡國立大學博士,2013 年入職學霸君,擔任技術研究負責人職務,組建智能計算團隊,主攻文字識別、圖像演算法和數據挖掘方向。帶領團隊在國內率先開創同時適應自然場景、複雜版式圖像拍照識別引擎,為搜題及 1V1 實時答疑業務奠定了技術基礎。同時,將基於深度學習的文本挖掘技術引入產品,實現高效而智能化的知識導航。
如果您覺得內容優質,記得給我們「留言」和「點贊」,給編輯鼓勵一下!
今日薦文
※人工智慧發展神速?37年前的塵封檔案告訴你並沒有
※淺析eBay聯盟營銷的上下文廣告機制
TAG:AI前線 |