中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

臺(tái)大李宏毅教授最新課程,深度強(qiáng)化學(xué)習(xí)有國語版啦!

2018-06-14    來源:

容器云強(qiáng)勢上線!快速搭建集群,上萬Linux鏡像隨意使用

入坑深度學(xué)習(xí)的同學(xué)肯定都聽過臺(tái)灣大學(xué)的李宏毅教授,或者是他那本非常受歡迎的課程——《1天搞懂深度學(xué)習(xí)》。這門課程的講義PPT總共有286頁,深入淺出的介紹了深度學(xué)習(xí)的概念、框架及展望。

 

 

今天要給大家推薦的是李老師最近更新的課程:深度強(qiáng)化學(xué)習(xí)(deep reinforcement learning),目前這門課程在youtobe上更新了4個(gè)視頻,分別是策略梯度算法(Policy Gradient)、近端策略優(yōu)化(Proximal Policy Optimization,PPO)、Q-learning算法基本概念和Q-learning算法高級(jí)技巧。

 

 

 

 

每個(gè)視頻大約40分鐘左右,PPT內(nèi)容為英文,講授語言為中文。課程內(nèi)容主打強(qiáng)化學(xué)習(xí),涉及理論和論文解讀,需要一定的強(qiáng)化學(xué)習(xí)的基礎(chǔ),感興趣的小伙伴可以學(xué)起來啦!

深度強(qiáng)化學(xué)習(xí)youtube鏈接:

https://www.youtube.com/watch?v=z95ZYgPgXOY

深度強(qiáng)化學(xué)習(xí)B站鏈接:

http://www.bilibili.com/video/av24724071

本文對視頻內(nèi)容做了簡單介紹,供大家參考。

策略梯度算法:

策略梯度算法理論
算法實(shí)現(xiàn)
實(shí)用建議

近端策略優(yōu)化:

采樣問題
PPO算法理論
對論文結(jié)果的解讀

Q-learning算法基本概念:

蒙特卡洛方法
Actor-Critic算法
Q-learning理論

Q-learning算法高級(jí)技巧:

Double DQN
Dueling DQN
高級(jí)技巧

目前課程在連載狀態(tài),感興趣的同學(xué)可以關(guān)注李宏毅的youtube主頁:

https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ/videos

此外,李老師在youtube還有《機(jī)器學(xué)習(xí)》和《深度學(xué)習(xí)》兩門課程的視頻講解,這兩門課程也獲得了不錯(cuò)的口碑,課程鏈接如下:

機(jī)器學(xué)習(xí)youtube鏈接:

https://www.youtube.com/watch?v=CXgbekl66jc&list=PLJV_el3uVTsPy9oCRY30oBPNLCo89yu49

機(jī)器學(xué)習(xí)B站鏈接:

http://www.bilibili.com/video/av19144978

深度學(xué)習(xí)youtube鏈接:

https://www.youtube.com/watch?v=KKT2VkTdFyc

深度學(xué)習(xí)B站鏈接:

http://www.bilibili.com/video/av20961661

李宏毅老師簡介:主要研究領(lǐng)域?yàn)闄C(jī)器學(xué)習(xí)(特別是深度學(xué)習(xí))、口語語義理解和語音識(shí)別。

2012年從臺(tái)北 National Taiwan University (NTU) 博士畢業(yè)。

2012年9月—2013年8月,在 Sinica Academia 的 Research Center for Information Technology Innovation 做博士后。

2013年9月—2014年7月,在 MIT Computer Science and ArtificialIntelligence Laboratory (CSAIL) 的 Spoken Language Systems Group 做訪問學(xué)者。

現(xiàn)任 Department of Electrical Engineering of National TaiwanUniversity 副教授。

標(biāo)簽: https

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:中國高校如何領(lǐng)跑“新一代人工智能”?

下一篇:碼農(nóng)福音:一個(gè)專門開發(fā)高性能大數(shù)據(jù)代碼的系統(tǒng)「開源了」