當前位置:
首頁 > 教育 > 大數據如何助教育更加公平優質

大數據如何助教育更加公平優質

大數據如何助教育更加公平優質

禹天建 繪

李克強總理在今年的政府工作報告中指出:「實施大數據發展行動,加強新一代人工智慧研發應用,在醫療、養老、教育、文化、體育等多領域推進『互聯網+』。」當前,發展教育大數據已成為推進我國當前教育領域深化改革和創新發展的戰略選擇。

黨的十九大報告提出,努力讓每個孩子都能享有公平而有質量的教育。在教育領域實施大數據發展行動中,好的教育大數據怎樣才能挖掘出來,又該進行怎樣的分析處理?大數據怎樣為教育助力使其更加公平優質?對此,中國教育報記者對相關專家和從業人員進行了深入採訪。

大數據如何助教育更加公平優質

訪談嘉賓:

戚萬學 曲阜師範大學黨委書記、中國教育大數據研究院院長

甘健侯 雲南師範大學民族教育信息化教育部重點實驗室常務副主任

方海光 首都師範大學教育技術系教授、遠程教育研究所所長

李 超 學堂在線總裁

大數據如何助教育更加公平優質

好的教育大數據怎樣才能挖掘出來

記者:當前,「大數據」成了一個時髦名詞。好的教育大數據是什麼樣?教育數據數量越多越好嗎?

戚萬學:大數據之「大」,我們一般理解為「數量」規模之大,通常數據樣本量越大,越有利於對數據進行多維的聚類、聚合、聚集分析,更有利於「掃描」和「透視」看似毫無價值、毫無關聯數據之中的相關性、邏輯性直至規律性,從而可以進行評價和趨勢預測。大數據之「大」,還有一種理解是處理技術的「大」。對於教育大數據而言,需要數據的不斷累積和增多,同時也需要相應大數據挖掘分析技術不斷提高。教育大數據的價值在於幫助決策,一般而言,好的教育大數據要具備精確、完整、可靠性、視覺化呈現、存取性高等特徵。

甘健侯:教育大數據之「大」並非只是數量之大,更為強調的是數據蘊含的「價值」之大。實質上,教育大數據並不是越多越好。對於數據科學家來說,重要的不是得到最多的數據,而是看通過哪些數據可以得出真正有價值的結果。教育大數據大致分為教學資源類大數據、教育教學管理大數據、教與學行為大數據、教育教學評估大數據四類。教育大數據並非包括所有數據,因為教育活動過程中也會產生大量無意義的「雜訊」數據,需要根據教育的應用目的進行數據過濾和「清洗」,為後期深度挖掘和分析做準備。因此,好的教育大數據一定是科學、客觀、準確、有用的,要把數據與人的差異化有機結合起來。

方海光:教育大數據並非越多越好,教育大數據要能服務教育發展、具有教育目的性,而非盲目地囊括一切數據。教育大數據是以業務應用導向為評判標準的,即應用是檢驗教育大數據的唯一標準。好的教育大數據可以在提升教育質量、促進教育公平、實現個性化學習、優化教育資源配置、輔助教育科學決策等方面發揮重要作用。

記者:教育大數據豐富多樣、種類繁多,在海量的教育數據中,怎樣挖掘出好的教育大數據?

戚萬學:教育過程中每分每秒都在產生大量豐富、複雜且多樣的信息,這些信息必須經過深入的挖掘才能轉化成可以運用的教育數據。如何挖掘教育大數據一直是擺在教育研究者與政府面前的重要課題,也是一個難題。好的教育大數據是憑藉數據挖掘者敏銳的洞察力與先進的挖掘技術來獲得的。好的教育大數據必須有好的理念、好的問題意識、有趣的研究設計,然後才是好的挖掘技術。在數據挖掘過程中,應該避免唯技術化和工具化傾向。

李超:大數據挖掘不能離開教育實踐,無論是在線教育還是課堂教學,我們都不能為了抓數據而去抓數據,而要從貼近教師的教學需要、滿足學生的學習需要出發,真正以學習者為中心去獲取大數據。非結構化的教育數據如圖片文本,需要通過充分利用好現在的信息技術手段,通過人工智慧、模式分析、行為分析的了解和認知科學的發展、教育技術的最新理念,把它們轉換成結構化的教育數據。更關鍵的是要能夠把這些非結構化數據,通過模型在教育過程中去指導、幫助教師以及指導整個系統開發,然後再去獲取數據優化模型,通過往複的過程以後,可以真正實現科學化指導。

甘健侯:好的教育大數據需要對教育數據進行深度挖掘。這個過程中需要綜合運用數學統計、機器學習、數據挖掘和人工智慧等多交叉領域的技術和方法,對教育大數據進行處理和分析。通過數據建模,發現學習者學習結果與學習內容、學習資源和教學行為等變數的相關關係,來預測學習者未來的學習趨勢,促進學習者有效學習的發生。

方海光:好的教育大數據也是重要的教育資源之一。為使數據資源物盡其用,當前最需要的就是挖掘能夠促進共建共享的教育大數據。共建共享不僅有利於加速教育大數據產品的應用和開發,也有利於降低成本優化體驗。對於半結構化或非結構化的數據,可以採用自然語言理解、模式識別等人工智慧手段進行信息抽取,還可以通過專家人為地進行協同標籤處理,這樣可以將其轉化為結構化數據。對於雜質較多的數據,可以在數據挖掘時進行數據清洗。對於實時產生的數據可以使用自動獲取效率優先的方式來採集數據。

大數據如何助教育更加公平優質

豐富多樣的教育大數據如何處理

記者:在雲存儲和雲計算的基礎上,如何利用信息技術等手段對非結構化和半結構化教育數據進行有效處理?

戚萬學:非結構化數據轉化為結構化數據,是大數據產生效力的重要途徑。常見的教育大數據,都是非結構化的類型,能直接進行數據分析的結構化數據反而較少。舉例而言,教師的教學視頻、學生的作業等都屬於非結構化的數據。要解決非結構化數據帶來的挑戰,就是利用信息技術進行數據轉化。在數據分析方面,目前已經有相當成熟的分析方式,包括傳統統計學的回歸分析、類別分析和決策樹等,真正面臨的挑戰反而是數據的清洗及去敏的處理,關鍵是確保數據與數據產生者之間的匿名性,即在經過數據清洗後,無法通過數據去辨識出該數據所屬者的信息。如此,才能確保學生個人的信息不外流,符合一般教學及研究的倫理守則。

李超:在教育大數據的挖掘和分析上,在整個教育教學過程中,現有的手段能夠收集到的信息還不夠。在大量佔有這些數據的時候,我們一定要利用人工智慧或者最新的神經網路深度學習等技術,基於實踐數據去進行處理總結和分析,同時要把這些結果和總結分析反哺到教育過程中去。

甘健侯:教育數據的處理可分為教育數據的獲取與抽取、教育數據的存儲與管理、教育數據的分析與挖掘三個階段。在雲存儲和雲計算的基礎上,傳統關係資料庫無論從描述能力上還是從管理數據的規模上,都無法應對非結構化和半結構化的數據管理要求,因此如何利用信息技術建立有效的非結構化和半結構化教育數據管理平台是關鍵。首先,針對半結構化和非結構化數據存儲和分析的需求,建立統一的數據模型。其次,利用雲存儲和雲計算,構建分散式與並行處理模型和架構,支持高度並行化與可擴展性,從而保證教育大數據的高效處理。再其次,支持查詢語言與數據可視化功能,滿足用戶對教育大數據進行訪問與分析的介面需要,以提升教育數據處理的有效性。

方海光:目前,人們對半結構化和非結構化數據的個體表現、一般性特徵和基本原理尚不清晰,這些都需要通過多學科交叉來研究和討論。但是,人們可用開源信息技術平台收集半結構化和非結構化數據。由於大數據所具有的半結構化和非結構化特點,基於教育大數據的數據挖掘所產生的結構化的「粗糙知識」(潛在模式)也伴有一些新的特徵。這些結構化的粗糙知識可以被決策者的主觀知識過濾處理並轉化,生成半結構化和非結構化的智能知識。人類和數據的協同加工過程,反映了教育大數據研究的新思路。

記者:在教育大數據的挖掘及分析處理上還面臨哪些挑戰?如何解決?

甘健侯:教育本身是個複雜的系統工程,其結構非常複雜,涉及教育教學資源、教育教學管理、教與學行為、教育教學評估等多方面的大數據,因此,教育大數據的挖掘和分析處理上還面臨一些挑戰:缺乏統一的數據規範;結構性的教育大數據短缺、數據分析模型有待驗證;非結構化的數據處理技術尚不成熟。對此,我的建議是,一是遵循頂層設計,制定統一規範;二是注重全過程多維度數據採集,建立科學準確的數據分析模型;三是善於使用新方法和新工具,深化挖掘模型、分析方法與教育教學的融合。

方海光:教育大數據最主要的問題是缺乏相應的方法論指導。雖然許多學校和教師都能夠意識到教育大數據的重要性,但對其在教育當中如何應用卻並不清楚,因此才帶來了數據採集缺乏全面性、數據分析缺乏針對性、結果應用缺乏有效性等問題。因此,我們應組織教育學、管理學、計算機科學、數據統計學等多學科的研究人員成立專門的教育大數據研究機構,集中優勢力量破解教育大數據應用推廣過程中存在的熱點、難點問題,同時結合教育發展的戰略需求,開展前瞻性研究,使其成為國家教育大數據發展的智庫。

大數據如何助教育更加公平優質

大數據如何助教育更加公平優質

記者:大數據對學習過程和教學反饋帶來了哪些改變?可以為個性化教育提供哪些幫助?

戚萬學:大數據的細緻性以及精準性,使得教師和其他教育工作者可以深入地了解與掌握學生的學習過程。教師可以通過大數據中每個學生學習軌跡的分析,結合他們的個性特點,分析其獨特的學習需求,在網路教學系統的幫助下推送適合每個學生髮展的學習材料或學習建議,開展因材施教。可以說,大數據具有促進教師從教學者向指導者角色轉變的潛能。

甘健侯:大數據對學習過程和教學反饋主要帶來了以下改變:第一,形成數據驅動教學範式。大數據技術可以全程記錄學習者的學習過程,深度挖掘數據背後反映的教學意義與價值,並以可視化的方式清晰呈現,從而有效支持教師精準地「教」,進而指導學生更精益地「學」。第二,大數據技術改變了教學的反饋方式、反饋形式和反饋途徑,使教學反饋更具有準確性、時效性、過程性、全面性、智能化和科學性。第三,使基於大數據的學習分析技術成為教育技術的新範式,關注每個學習者的個性發展,實現真正意義上的個性化學習,促使教育回歸本質。

方海光:在教育大數據的支持下,教師逐步由教學者轉變為幫助每個學生個性化學習與發展的指導者。傳統的學習管理系統將升級為智慧學習平台,能夠持續採集學習者的學習行為數據,並進行智能分析,依據學習者模型推送適合的學習資源,準確診斷、評價學習過程與結果,給學習者提供最適合的學習建議,實現每個學生的個性化發展,這從根本上提高了學習效果。

李超:有了大數據的支持,我們改變了過去傳統的教師和學生之間交互的方式,把整個交互過程變得更加實時有效,讓原來不敢說話的學生能夠發表觀點,教師也能夠時刻掌握課堂的進展。我們在個性化教育領域做了大量努力,包括混合式教學、在線教育與課堂教學之間如何有效連接起來等,幫助教師給遠方的學生提供有效指導,同時給學生之間進行有效的交流提供充分的工具。

記者:教育大數據與當前人們常說的數字教材、智慧校園、智慧課堂之間是什麼樣的關係?大數據在提高教育質量方面可以起到哪些促進作用?

李超:教育大數據和數字教材、智慧校園、智慧課堂之間的關係,其實是互為疊加、互為補充、互為反哺的。數字教材是從教育實踐中形成的數字化教材,通過數字化教材,大量的學習數據和學生行為可以被採集到。智慧課堂實際上是在數字教材設計上,結合了傳統和在線課堂的最佳實踐。智慧課堂更加有效地支撐了我們獲取數據和應用數據。智慧校園其實是一個更大的範圍,能夠讓學生在學習和生活等各個方面通過數字平台進行連接。所有這些大數據都是數據支持,支撐學校更好地為學生提供良好的教學體驗服務。

方海光:教育大數據是發展智慧教育最重要的基礎,是實現智慧教育的數字教材、智慧校園和智慧課堂應用的重要支撐手段之一。教育大數據是智能化學習環境的基礎,更是實現智能教育的大系統、大平台、大資源的重要特徵之一,將是我國教育信息化2.0的突出應用。教育大數據對數字教材的價值是實現了教材、課程和課堂的貫通,使得三方面應用實現了一體化。教育大數據對智慧校園的價值是實現了學生多應用場景的連接,使得學生的學習、健康、生活、娛樂和個性成長連接在一起。教育大數據對智慧課堂的價值是實現課堂信息的閉環反饋,通過數據評估反饋,讓每個學生通過不同學習路徑更接近學習目標。

記者:大數據在提高教育質量方面,還面臨哪些挑戰?如何應對?

甘健侯:要想真正發揮大數據在教育領域的應用水平,促進教育質量的提升,一方面要在正確的理念支持下應用大數據,保證數據獲取渠道更加多元化和更暢通,另一方面要加強大數據人才的培養,推動教育大數據技術的研發與應用。培養一批懂得大數據,具有大數據收集、處理和分析大數據技能,並且善於研究大數據、深挖大數據的人才,這對於教育大數據發展至關重要。

方海光:隱私和倫理道德限制是教育大數據應用過程中不可迴避的問題。教育機構在將學生的個人教育記錄數據交付給第三方機構用於教育數據挖掘和學習分析應用開發的時候,必須注意規避相應的政策和法律規定,也要避免第三方未經授權將教育大數據作為資源進行商業行為。另外,通過教育數據挖掘和學習分析所作出的預測和推薦,將會大大增加學生活動的透明性,這也將會帶來一系列的社會倫理道德問題,值得相關研究和教育機構重視。

大數據如何助教育更加公平優質

大數據怎樣推動教育均衡發展

記者:大數據在促進教育均衡發展方面可以起到什麼樣的作用?

戚萬學:教育大數據是促進教育均衡發展的重要力量和有效途徑。大數據在促進教育均衡發展方面大有可為:一是藉助大數據技術推進教育資源共享,突破教育資源區域、城鄉等發展不均衡的現狀,逐步實現教育資源配置均衡發展;二是藉助大數據技術,加強教育欠發達地區教育信息化建設;三是通過大數據技術助力教育決策,實現教育「精準扶貧」。

李超:教育大數據實際上是教學與學習過程體驗的最佳教學總結,也是對變化著的學習者的需求不斷地進行抽象和總結優化的過程。所以,教育大數據的應用對於促進教育均衡發展有非常顯著的作用。例如,學堂在線和清華大學在線教育辦公室共同推出的雨課堂,現在使用的課件其實就是整合了優秀教師在課堂中的教學實踐,可以使更多的人、更多的課堂來使用。而更多的人在使用雨課件的過程中產生的數據,又可以支撐教師更好地優化課程。

甘健侯:教育大數據既有共時的也有歷時的。共時數據指的是在同一時期所獲得的大規模數據,比如統測、中考分數或者教育財政撥款收支分布等,將班級或者學校的單一數據與總體數據均量進行比較,可以更加全面地呈現班級和學校的教育質量、教育投入等情況。更重要的,對數據進行相關分析能夠更好地發現教育規律,並幫助相關政策的制定,進而推進教育均衡。歷時數據指的是針對同一指標在不同時期的數據觀測,比如同一個學生英語學科的平時成績和期末成績的所有數據,從小學到大學的數據等,這些數據能夠幫助教師針對學生個體更好地制訂學習計劃,其核心要義就是實現對學生個體的教育均衡。

方海光:應用教育大數據技術,可以準確把握區域教育發展動態和影響其均衡發展的關鍵因素,全面推進區域教育的均衡發展。此外,還可以通過教育大數據實現跨業務的共享和優化,實現高位的資源優化效果。通過建立連續的制度化的區域教育發展數據採集機制,可以全面跟蹤了解所有學生的在校學習情況以及畢業後的工作情況,進而更加客觀地評價區域教育質量,根據評估結果動態調整區域教育體系,比如專業調整、課程計劃調整、培養方式的調整等,實現教育與社會需求之間更加無縫的對接,幫助每一個學生獲得成功。

記者:教育大數據在促進教育均衡發展方面,還面臨哪些挑戰?

方海光:我國目前大數據相關的技術資源還略顯薄弱,區域間技術資源分布不均,很多地方教育機構缺乏必要的大數據應用的基礎設施建設。例如,有些學校沒有學生信息系統、在線教育平台,也就無法為教育數據挖掘和學習分析提供基礎數據,這將是我國在大數據教育應用方面所面臨的首要問題。

戚萬學:當前面臨的困難是,現有技術無法應對海量的教育大數據,並且缺乏統一的大數據技術標準。部分地區和學校辦學思想、管理理念等較為封閉,對自己掌握的數字化教育資源不願意開放共享。而且,當前缺乏統一的資源共享平台,缺乏統一的調配和管理,在大數據知識產權保護方面的立法也相對滯後。

甘健侯:教育大數據的重中之重是出台教育大數據的統一標準,規範所有教育數據管理平台都必須提供的數據指標。除了以往的年終統計數據外,還應該關注學習過程中的具體數據。有了統一標準,各區域教育大數據管理平台可以有效對接相關數據,實現數據間的跨平台融合。同時,由於缺乏教育大數據相關技術人才,還應加快教育大數據相關人才的培養進程。(中國教育報 記者 蘇令)

《中國教育報》2018年04月17日第4版 版名:新聞·深度

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 中國教育新聞網 的精彩文章:

面對「混改」,職業院校欲試還休
讓遊戲成為新學習方式

TAG:中國教育新聞網 |