增強學習初探以及最新發展趨勢

活動簡介

增強學習 (Reinforcement Learning) 近年來搭配深度網路,讓電腦在學習打電動、下圍棋、以及操控機器人的應用上獲得超乎預期的成果。

本課程從經典的 Markov Decision Process (MDP) 開始,先介紹傳統增強學習的算法,之後逐步講解著名的 Deep Q-Network (DQN) 以及 Policy Gradient (PG) 演算法。最後分享相關領域最新研究發展以及使用增強學習的小訣竅。

 

 

 

 

議程

9:00-9:30

報到

9:30-10:30

MDP 以及傳統增強學習的算法

10:30-10:50

茶點時間

10:50-12:30

不需環境資訊 (Model-free) 的增強學習 (包含 DQN)

12:30-13:20

午餐

13:20-15:00

直接優化動作政策 (Action Policy) 的 (PG) 演算法

15:00-15:20

茶點時間

15:20-17:00

最新研究發展以及使用增強學習的小訣竅

講者簡介

孫民 (Min Sun)

國立清華大學電機工程學系 / 助理教授

孫民博士目前任教於國立清華大學電機系,他擁有史坦福電機碩士 (導師為吳恩達)、密西根安雅堡電機系統組博士 (先後導師為李飛飛以及Silvio Savarese)、以及西雅圖華盛頓大學計算機工程博士後的經歷。他的研究興趣在電腦視覺、機器學習、以及人機互動領域。近年來基於深度學習在電腦視覺的突破,他致力於開發橫跨人工智慧不同子領域的系統,如自動影片文字描述 (視覺 x 自然語言)、以及與人類行為互動的智慧機器 (視覺 x 控制)。相關資訊請參考 aliensunmin.github.io

報名須知

  • 學員基本要求
    • 此為進階課程,假設學生對深度學習有基礎知識。
    • 有時上課會需要機率統計以及最佳化的知識,課堂會快速提醒一下相關知識或是給相關連結供課後參考。

  • 退票須知
    • 本活動委由 KKTIX 代為處理退票退款事宜。
    • 退票時將酌收 10% 手續費、且活動前十天內(不含活動日)不予退票。
    • 詳情請見 KKTIX 代理退換票辦法

報名活動

  • 日期 2017-12-16(六)
  • 地點 中央研究院人文社會科學館
  • 票價 $1980
2017/11/7 中午12:00 開放報名
2017/11/28 中午12:00 截止報名
立即報名

交通資訊

  • 公車
    • 請搭臺北市公車 205、212(直行/區間)、270、276、306(直行/區間)、620、645(直行/副線)、小 12、藍 25、 679、小 5、小 1 任何一班至中研院站 (前一站為中研新村站)。

  • 捷運
    • 請搭捷運板南線至南港站 2 號出口換乘公車 212(直行/區間)、270 或 藍25 至中研院站。
    • 搭捷運文湖線至南港展覽館站 (5 號出口),走至對面換乘公車 205、276、306(直行/區間) 或 645(直行/副線) 至中研院站。

  • 火車
    • 請搭火車至南港火車站換乘公車 212(直行/區間)、270 或 藍25 至中研院站。

  • 自行開車
    • 請參考下方地圖開車至中央研究院院區 (臺北市研究院路二段 128 號)。
    • 開車請由正門進入院區。
    • 車輛可停人文社會科學館 B2 停車場 (空間可停 100 輛),或停放在中研院區內平面停車格。
    • 週一至週五中研院內停車每小時收費 20 元。
    • 週末中研院內免費停車。

中央研究院位置圖


人文社會科學館位置圖