當前位置:
首頁 > 天下 > 密歇根大學科研課題:強化學習在經典控制問題中的應用

密歇根大學科研課題:強化學習在經典控制問題中的應用

科研課題:強化學習在經典控制問題中的應用

強化學習(Reinforcement Learning)是近年來人工智慧領域研究的熱門方向。強化學習面對的是序列決策問題。它旨在特定的環境(Environment)中,利用統計學、機器學習和運籌學的理論,學習一個決策規則(Policy)來最大化總回報(Reward)。強化學習有著非常廣闊的應用場景,包括現在日趨成熟的Atari遊戲、棋牌遊戲和Moba類遊戲AI,以及自動駕駛、機器人控制、精準醫療和量化金融等重量級的業界應用。

課題概覽

經典控制問題指通過對槓桿和小車等經典力學研究的對象施加力,使得對象保持或者達到某個預先設定的狀態。傳統的方法往往是研究者針對具體的情景分析受力關係,據此設計施力的大小、方向、時間。傳統方法不具備可拓展性、且耗時耗力。強化學習作為新一代的通用型人工智慧演算法,能夠從環境的稀疏回報(Sparse Reward)中學習到解決問題的策略,因此研究者可以用一套通用的策略解決一系列相似的控制問題,並且可能找到更優的策略。

本課題旨在探究強化學習演算法在經典控制問題中的應用。具體是通過使用不同的機器學習演算法去估計強化學習的策略函數,並且比較他們的不同特點,分析不同演算法的應用場景。同時實現傳統的控制策略,比較二者的優缺點。

相關學科

計算機人工智慧機器學習

應用數學統計學數據科學

控制論最優化方法運籌學

導師:密歇根大學 博士

豐富的強化學習、人工智慧等領域的項目研究經驗,並多次在國際期刊上發表論文;

研究方向:強化學習,統計學在社會科學中的應用。

課題研究方法

AI+X數據驅動型科研

AI+X數據驅動型科研是指使用人工智慧(AI)演算法,收集、處理、分析具體學科(X)的海量數據,並基於此進行預測,從而獲得科學發現的研究方法。與傳統的、基於實驗或邏輯推理的研究方式相比,AI+X數據驅動型科研可以藉助AI演算法強大的運算能力,高效地進行大數據分析,具有投入產出比高、適用範圍廣的優點。

AI+X數據驅動型科研已被廣泛地應用於各個領域,利用AI演算法研究基因數據,從而進行早期的癌症篩查便是其中一例。基因組與癌症病患的數據千千萬萬,使用傳統的科研方式對其進行分析,工程量大、過程繁瑣,在客觀上難以實現。但藉助AI演算法這一便捷的工具,生命科學家便能夠以海量的患者的遺傳信息為基礎,建立資料庫,與過往的研究成果進行對照,快速、準確地在兩者中發現規律、建立聯繫,從而使癌症診斷的「標準化」成為可能。

整個科研教學流程中,每一位學員都將有學術督導協助保障研究階段性作業和論文的進度,確保取得研究成果。

科研項目成果

成果1

獨一無二的課題成果

有方學者項目的導師會為每個學生提供獨一無二的課題,連接最前沿的科研方法和學生感興趣的學術方向,保證學生研究內容的差異性。

成果2

在英文期刊中發表學術論文

有方學者項目保證為學員在正規的英文學術期刊中發表論文。有方學者最優秀的學生,不但可以衝擊EI、SCI等高級別期刊,而且有機會參與全球頂級的學術會議。

成果3

第一作者身份

有方學者項目堅持幫助學生以第一作者身份發表論文。在申請過程中,第一作者順位恰恰是學生在科研項目中的參與程度的最佳證明。

成果4

美國Top 30院校導師的推薦信

有方學者項目將為學生提供項目科研導師撰寫的推薦信。導師作為推薦人,來自於美國頂尖學府的科研團隊,保證了推薦信的可信度。

成果5

高效備戰具有高影響力、高含金量的科研競賽

學生可以直接使用有方學者項目的成果論文衝擊多項全球頂級的科研賽事,其中包括:被譽為「中國青年的諾貝爾獎」的東潤丘成桐科學獎、谷歌科學獎和達特茅斯大學舉辦的ISEC論文比賽。

2018Top30名校錄取

有方學員TOP30錄取率高達

85%

M同學

哥倫比亞大學 賓夕法尼亞大學

雙藤校錄取

學術科研成果涵蓋:人工智慧、深度學習、材料科學以及經濟金融等眾多領域

有方歷屆獲獎學員

滑動查看更多

課外科研項目錄取

L同學錄取 MIT PRIMES

H同學錄取 MIT LaunchX

MIT PRIMES 是麻省理工為精英學生打造的頂尖科研項目。在一年的時間中,項目導師首先為學生提供遠程指導,然後在暑期提供實驗室實習機會。參加這一項目可以大大提升學生進入常春藤級別頂尖名校的機會;

MIT Launch X 是一項面向世界各地高中生的創業教育課程:課程為期四周,依託MIT 獨特優勢,為學生提供頂尖創業資源,90%的MIT Launch參與者在高中時就已經嘗試了資助創業,在這其中有50%公司在 Launch X項目結束後一年仍運轉良好。

有方歷屆獲獎學員

滑動查看更多

東潤丘成桐科學獎

計算機科學獎

全球銅獎1位

全球入圍率僅3%

有方歷屆獲獎學員

滑動查看更多

獲獎證書

美國高中生數學建模競賽

2017年 HiMCM 獲獎概況

Outstanding 特等獎(全球前1%)一組

Finalist 特等獎入圍獎(全球前9%)一組

2016年 HiMCM獲獎概況

Outstanding 特等獎(全球前1%)一組

National Finalist 特等獎提名獎(全球前2%)一組

有方歷屆獲獎學員

滑動查看更多

獲獎證書

獲獎證書

期刊證書

期刊證書

期刊證書

>

科研課題報名須知

本項目課題研究僅限 2 個名額

註:本課程採取審核制招生,我們將通過兩輪面試評估課程匹配度,最終確定入選的學生名單。

課題要求:

本課題適合: 9-12 年級學生,有較強的邏輯思維和抽象思維能力:

英文:

具備基本的學術英語閱讀能力;

接觸過英文寫作,有論文寫作經驗者更佳;

數學:

概率統計基礎知識;

線性代數基礎(行列式、矩陣運算等);

多元函數、微分、函數極值;

計算機:

Python編程基礎;

Numpy庫基礎;

物理:

力學

註:針對專業基礎有限的學生,有方另外提供「有方探究項目」和預備課程,幫助學生在進行深度科研活動前,做好相應的準備,詳情請諮詢有方顧問團隊(聯繫方式見文章最後的二維碼)。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Embark有方博雅 的精彩文章:

159 年未曾解決的黎曼猜想,終於要在 2018 年被證明了嗎?

TAG:Embark有方博雅 |