中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

DeepMind推出深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)進(jìn)階課程(附視頻)

2018-11-30    來源:raincent

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用

在 OpenAI 推出強(qiáng)化學(xué)習(xí)課程 Spinning Up 后不久。昨天,DeepMind 與 UCL 合作推出了一門深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)進(jìn)階課程,以在線視頻形式呈現(xiàn)。該課程共有 18 節(jié)課,每節(jié)課都長達(dá) 1 小時(shí) 40 分鐘,內(nèi)容從深度學(xué)習(xí)框架 TensoFlow 的介紹到構(gòu)建游戲智能體,可謂全面。

課程地址:https://www.youtube.com/playlist?list=PLqYmG7hTraZDNJre23vqCGIVpfZ_K2RZs

該課程最初在倫敦大學(xué)學(xué)院(UCL)進(jìn)行,為方便在線觀看進(jìn)行了錄像。多位 DeepMind 的研究人員、UCL 教師參與了課程的設(shè)計(jì)。

 

 

參與課程制作的 DeepMind/UCL 團(tuán)隊(duì)

課程由兩部分組成,一是包含深度神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí),二是利用強(qiáng)化學(xué)習(xí)進(jìn)行預(yù)測(cè)和控制,兩個(gè)部分相互穿插。在探討深度學(xué)習(xí)的過程中,這兩條線交匯在一起,其中的深度神經(jīng)網(wǎng)絡(luò)被訓(xùn)練為強(qiáng)化學(xué)習(xí)背景下的函數(shù)逼近器。

課程中的深度學(xué)習(xí)部分首先介紹了神經(jīng)網(wǎng)絡(luò)及使用 TensorFlow 的監(jiān)督學(xué)習(xí),接下來探討了卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、端到端及基于能量的學(xué)習(xí)、優(yōu)化方法、無監(jiān)督學(xué)習(xí)、注意力及記憶。涉及的應(yīng)用領(lǐng)域包括目標(biāo)識(shí)別和自然語言處理。

 

 

第一課視頻截圖

深度強(qiáng)化學(xué)習(xí)部分介紹了馬爾科夫決策過程、動(dòng)態(tài)規(guī)劃、無模型預(yù)測(cè)與控制、值函數(shù)近似、策略梯度方法、學(xué)習(xí)與規(guī)劃整合、探索/利用困境等。涉及的應(yīng)用領(lǐng)域包括學(xué)習(xí)玩經(jīng)典棋盤游戲或電子游戲等。

第一課視頻:

 

 

https://v.qq.com/x/page/q0800xbw8ft.html

 

 

從第一課來看,本課程將講解 DeepMind 的 AI 方法,深度強(qiáng)化學(xué)習(xí)在雅達(dá)利、AIphaGo 等游戲中的應(yīng)用。

課程目錄

深度學(xué)習(xí) 1:基于機(jī)器學(xué)習(xí)的人工智能簡(jiǎn)介

深度學(xué)習(xí) 2:TensorFlow 簡(jiǎn)介

深度學(xué)習(xí) 3:神經(jīng)網(wǎng)絡(luò)基礎(chǔ)

強(qiáng)化學(xué)習(xí) 1:強(qiáng)化學(xué)習(xí)簡(jiǎn)介

強(qiáng)化學(xué)習(xí) 2:探索和利用

強(qiáng)化學(xué)習(xí) 3:馬爾科夫決策過程及動(dòng)態(tài)規(guī)劃

強(qiáng)化學(xué)習(xí) 4:無模型預(yù)測(cè)與控制

深度學(xué)習(xí) 4:圖像識(shí)別之外、端到端學(xué)習(xí)、嵌入

強(qiáng)化學(xué)習(xí) 5:函數(shù)逼近及深度強(qiáng)化學(xué)習(xí)

強(qiáng)化學(xué)習(xí) 6:策略梯度及 Actor Critic 算法

深度學(xué)習(xí) 5:用于機(jī)器學(xué)習(xí)的優(yōu)化

強(qiáng)化學(xué)習(xí) 7:規(guī)劃與模型

深度學(xué)習(xí) 6:用于自然語言處理的深度學(xué)習(xí)

強(qiáng)化學(xué)習(xí) 8:深度強(qiáng)化學(xué)習(xí)進(jìn)階主題

深度學(xué)習(xí) 7:深度學(xué)習(xí)中的注意力與記憶

強(qiáng)化學(xué)習(xí) 9:深度強(qiáng)化學(xué)習(xí)智能體概覽

深度學(xué)習(xí) 8:無監(jiān)督學(xué)習(xí)和生成模型

強(qiáng)化學(xué)習(xí) 10:經(jīng)典游戲案例學(xué)習(xí)

課程門檻

 

 

當(dāng)然,這樣一門進(jìn)階課程也是有一定門檻的。授課者提到,去年就有很多人抱怨課程負(fù)擔(dān)太重。選這門課程的人需要懂 Python,還要有很多其他知識(shí)儲(chǔ)備。另外,由于授課者都是活躍在學(xué)界的頂級(jí)研究者,課程會(huì)直接延伸到當(dāng)前的研究前沿。

教師寄語:做好準(zhǔn)備,迎接挑戰(zhàn)!(brace yourselves!)

標(biāo)簽: 網(wǎng)絡(luò)

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:這可能是人工智能、機(jī)器學(xué)習(xí)和大數(shù)據(jù)領(lǐng)域覆蓋最全的一份速查表

下一篇:專訪數(shù)學(xué)家Hannah Fry:算法的時(shí)代,人類從未如此重要