資料科學課程

探索及應用生成對抗網路已額滿

探索及應用生成對抗網路

生成對抗網路 (Generative Adversarial Network, 簡稱 GAN) 是深度學習在 2017 年的最大焦點之一。 有大量的研究結果及讓人驚訝的應用。 單憑輪廓就能自動畫出生動的小貓、指定屬性就能生出成動漫角色、將圖片中的馬換成斑馬、將視訊中的直播主直接替換成另外一個人、從文字描述畫出圖片、 任意產生中文字型、改變照片中人的性別、膚色等等屬性。可以說不了解 GAN的話,等於錯過了一大半 2017 的深度學習的進展。但是:
  • 很像之前那個照片變梵谷畫風,挺好玩的,但用途似乎有限?
  • 好難訓練,為什麼實際訓練不出來?
  • 品質到什麼程度?有機會實用了嗎?
這些細節需要經過實做嘗試,才能具體掌握。本次課程除了介紹 GAN 外,也會從實際應用以及理論上的範例,探討其中的一些訣竅。
  1. 生成對抗網路簡介 我們會先介紹生成對抗網路的原理。
  2. 生成對抗網路的進展 我們將介紹 WGAN, improved WGAN, DRAGAN,  Pix2pix, CycleGAN 及後續的相關進展。
  3. 從論文到程式碼 凡是我不能創造的東西,我就不瞭解  –  理查·費曼 雖然論文中滿滿讓人讚嘆的原理和巧思,看完感感覺頗有收穫。 但沒真正寫一次,誰也無法確定了解多少。 可是,這麼多 GAN,要花多少時間來一個一個來實作?明明都照著 paper 寫了,為什麼還是黑畫面?
  4. 從程式碼到應用 有了可以跑的 code 後,要如何用在自己想要的資料上? GAN 不是萬靈丹,但在哪些條件下,能讓他發揮出最好的效果? 有什麼潛在的應用呢?
 
課程介紹
Python 爬蟲實戰已額滿

Python 爬蟲實戰

Python 爬蟲實戰資料科學的世界中,資料是一切的基石,而網際網路則蘊藏了豐富的資料等待著挖掘與分析。在這資料科學蔚為風行的時代,網路爬蟲的技術是一項非常實用的技能,若您有朝思暮想的資料在網路上 (例如表特版上被推爆的文章),卻苦無方法可以爬取;又或是想抓取熱門電影的票房、評論資料做分析建模,卻不知如何下手,那麼這堂 Python 爬蟲實戰的課程將會很適合您。本課程利用六個小時的時間,上午將從最基本的 HTML 網頁結構開始,透過範例與實戰練習帶您學會爬取網頁文字資料並解析其結構與內容,再運用簡單的資料視覺化與資料分析,帶您實際走一回資料分析的歷程。而下午會進一步介紹檔案的爬蟲、從爬取網頁到爬取網站、模擬人類行為的爬蟲程式,以及現代複雜的網頁設計中,爬蟲程式有可能遭遇的問題。
課程介紹
手把手打開 Python 資料分析大門已額滿

手把手打開 Python 資料分析大門

資料科學是現在熱門的領域,而 Python 是資料分析的當紅程式語言。然而很多 Python 資料分析主要套件並不全然那麼直覺,使得不少人學了基本語法之後,一直無法進入資料分析的領域。這個讓你掌握 Python 資料分析重要套件,如 NumPy, Matplotlib, Pandas, SciKit Learn 等等主要的功能與概念。
講者以多年教授 Python 的經驗,幫你破除容易卡關的地方。更重要的是,我們學習到的不只是這些套件的語法,而是瞭解整個資料分析的概念。在本課程之後,可以更深入的學習統計分析、機器學習乃至深度學習。
本次演講內容可分為四個部分:
  1. 用 Jupyter Notebook 打造資料分析的試練場 * Jupyter Notebook 互動功能 * NumPy 陣列導向程式設計
  2. 數據清理和視覺化 * Pandas 整理數據資料 * Matplolib 做資料視覺化
  3. 用線性回歸做預測 * 資料科學的基本概念 * 線性回歸實作
  4. 使用 SciKit Learn 做機器學習 * 監督式學習範例 -- SVM * 非監督式學習範例 -- K-Means
 
課程介紹
增強學習初探以及最新發展趨勢已額滿

增強學習初探以及最新發展趨勢

增強學習 (Reinforcement Learning) 近年來搭配深度網路,讓電腦在學習打電動、下圍棋、以及操控機器人的應用上獲得超乎預期的成果。本課程從經典的 Markov Decision Process (MDP) 開始,先介紹傳統增強學習的算法,之後逐步講解著名的 Deep Q-Network (DQN) 以及 Policy Gradient (PG) 演算法。最後分享相關領域最新研究發展以及使用增強學習的小訣竅。    
課程介紹
Emotion-AI: 運用人工智慧實現情緒辨識已額滿

Emotion-AI: 運用人工智慧實現情緒辨識

情緒的知覺與產生是人類的重要演化工具,藉以強化自身以及同物種成員生存的機會 - 對於仰賴社會互動與溝通以促進繁衍與生存的人類尤其重要。人類互動中的情緒訊號與內在情緒狀態會自然的驅動並反應於各種外顯行為中。Affective Computing (情感運算) 被 MIT Media Lab Rosalind Picard's 於 1995 年論文中提出,學術界中也開啟了近二十年相關技術研究以解碼情緒訊號並感知人類內部情感狀態。近年來,運用人工智慧計算聲音特徵與臉部表情為主的情緒辨識已為下一代與人相關的應用 (例如: 人機互動、教育、醫療、娛樂、商業等) 帶來了新的巨大機會。本課程將以運用人工智慧實現情緒辨識為主軸,內容包含簡介情感運算背景及其應用、情緒行為資料庫收集與處理、相關人工智慧技術、現今情緒辨識發展與未來。希望透過本課程提供的知識後,學員能更快速整合相關知識與工具來開發情緒辨識相關應用。本課程分成下列四大部分:
  1. 背景簡介情感運算及其應用 簡述人類內在情緒狀態與外顯行為之間的過往研究,並介紹近年來因情緒辨識技術成熟而產生的相關應用。
  2. 情緒行為資料庫收集與處理 介紹情緒多模態聲音影像資料庫收集的過程,並提供相關經驗與公開情緒資料庫分享。
  3. 情緒辨識人工智慧技術 簡介機器學習相關演算法來實現情緒辨識,並提供相關適用的工具可以加速上手。
  4. 情緒辨識的現在發展與未來 情緒辨識技術最新發展: 跨語言、多人互動、生理與外顯行為,並簡介情感運算與人類科學領域 (醫學、教育等) 之整合。
課程介紹
手把手的深度學習實務已額滿

手把手的深度學習實務

手把手的深度學習實務深度學習 (Deep Learning) 是近年來備受重視的機器學習方法,現今許多語音與影像辨識的研究與應用,都基於深度學習的技術來完成。深度學習的工具不斷推陳出新,若你已經聽過這項技術,卻不知道該從何開始下手,這堂手把手的實務課程將會很適合你。本課程利用六個小時的時間,介紹 Keras 這個熱門的深度學習工具,從最簡單的前饋類神經網路 (Feedforward Neural Network) 開始,用 Keras 加入各種訓練技巧 (Regularization, Early Stopping, Dropout) 以得到好的預測模型。亦介紹深度學習模型的另一個變形:捲積式類神經網路 (Convolutional Neural Network, CNN),以完整的實務操作,讓你邁出成為深度學習訓練大師的第一步。
課程介紹
What’s happening in deep learning已額滿

What’s happening in deep learning

近年深度學習受到極大的重視,整個領域在學界及業界都有蓬勃的發展,這場演講希望能跟聽眾分享近幾年這個領域的一些有趣發展。 首先會從近期的新模型與新方法談起,接著介紹深度學習在視覺、語音識別、自然語言處理領域上的突破,包含研究上與應用上的進展,最後會分享一些目前 TensorFlow 的功能與近況。        
課程介紹
無所不在的自然語言處理—基礎概念、技術與工具介紹已額滿

無所不在的自然語言處理—基礎概念、技術與工具介紹

無所不在的自然語言處理—基礎概念、技術與工具介紹自然語言處理 (Natural Language Processing) 技術專門對付非結構性、沒有整理成欄位值的資料,這也是資料分析時的燙手山芋之一。能夠理解語意,讓機器使用自然語言溝通,就能夠通過人工智慧的終極測試 — 圖靈測試 (Turing Test),可見這個問題的確是個極大的挑戰。即使是自然語言的基礎技術,例如怎麼樣從文章中抽取出重要的資訊?怎麼樣分析句子的結構?怎麼樣找到語言中所表達的語意?怎麼樣處理不同的語言?這些技巧在資料分析時不僅必備,想要做得好更需要訣竅。本課程先從基礎介紹開始,希望能帶大家認識自然語言處理這個在資料分析與資料探勘時非常有用的技術,並燃起對自然語言處理的興趣及熱情。1. 什麼是自然語言處理 從自然語言的基礎定義與各個相關議題談起,在 60 分鐘內畫出自然語言處理技術的重點,包括可以處理的問題,以及目前的技術進展等。2. 中英文文本處理相關工具與資源介紹 知道某些問題可以用自然語言處理的技術來進行,或是拿到資料後的下一步該如何?這裡介紹各式各樣自然語言處理最優的開發工具,包括英文與中文。3. 自然語言處理於網路與社群媒體的挑戰 處理一般的文字資料還不夠,還要考慮從網路收集來的文字資料,既多又免費!但是網路文字有其特殊的問題需要解決,同時網路文字經常可以結合其他元資訊一併處理得到更佳的結果!我們將會介紹跨入網路文字處理時可能遭遇的問題與解決方式,同時說明基本的文字與其他資料的結合方式。4. 自然語言處理發展趨勢與業界應用 在人工智慧的大趨勢下,自然語言處理自然也是很重要的一環,這個技術未來的發展趨勢與應用方向在哪裡呢?我們將會介紹目前產業界對於那些技術有所需求,有哪些潛在的應用,以及未來自然語言處理可以與那些領域結合更加發揮它的力量。
課程介紹
統計學家教你穩紮穩打 R 語言資料分析已額滿

統計學家教你穩紮穩打 R 語言資料分析

資料科學是綜合統計學、資訊科學及領域知識的一門新興學科。因此,要成為一名資料科學家,對統計當然要有基本的認識。舉凡日常的機率統計問題,例如:算機率值,統計參數估計,假設檢定及模型配適等等,除了需要理論証明推導之外,也需以程式做數值的模擬與驗証。而 R 語言正是研究者分析資料及執行統計模擬不可或缺的工具。也因為 R 軟體具有豐富的統計套件,也成為資料科學領域裡最受歡迎的程式語言之一。本課程由統計學家教您用 R 進行資料處理、呈現及統計分析。從第一天 R 的基礎 + 進階 (資料輸出輸入及處理、統計圖形、機率分佈、假設檢定、變異數分析、模擬統計模型與迴歸分析) 到第二天的統計分析方法應用(探索式資料分析、資料探勘案例研究),除了著重在方法理論的講述、假設及觀念的闡釋,同時也強調實際 R 程式撰寫操作,希望藉由本課程之訓練,奠定學員 R 程式撰寫及資料統計分析的基礎,並具有判斷不同狀況該用什麼不同的統計方法的數據能力。  
課程介紹
給工程師的統計學及資料分析 123已額滿

給工程師的統計學及資料分析 123

「統計學」,是一個大家都熟悉卻可能又陌生的名詞。做為傳統上最接近資料科學、藉由分析資料去探索事實真相的一門學問,統計學遍佈在大專院校的各個系所中,在以往是許多學生最大的惡夢之一,現在卻又在大數據的時代,被許多人宣稱統計學已死。到底什麼是統計學?統計學包含資料分析,還是資料分析包含統計學?統計學能做到什麼,又不能做到什麼?會算平均數跟標準差之後,如果懂機率學,還能多做些什麼?這門課程將由臺大資管系孔令傑助理教授主講,用一天的時間對統計學與資料分析做一個入門的介紹。時間雖短,內容雖淺,相信仍可以幫大家釐清一些概念,也讓初學者學到一些可以實戰的技術。更重要的是,這門課希望能給大家在未來繼續學習進階知識的動機與基礎。本課程由四個部分組成:
  1. 總是抽不到大獎的抽樣分佈 課程將從基本的母體與樣本概念以及資料測量尺度出發,接著切入統計學的科學核心基礎:抽樣分佈。在用樣本資料對母體做一些猜想之前,先瞭解一下隨機樣本的機率性質吧!
  2. 假設檢定與一點都不神秘的 p 值 我們將介紹統計學的核心觀念「假設檢定」,也就是如何對未知的母體建立假說、如何以樣本資料同意或推翻假說,以及最重要地,如何估計自己的結論犯錯的機率。我們也會介紹在假設檢定中扮演關鍵角色的「p 值」,它如何被使用、又如何被誤用。
  3. 沒什麼學問的迴歸分析 當你想知道一堆變數如何合起來影響一個變數時,迴歸分析是你最好的朋友 (之一)。我們將介紹迴歸分析的基本原理、模型的解釋力與意涵、如何一股腦地把所有變數都丟進迴歸模型,以及這樣做有什麼好處跟壞處。
  4. 大有學問的迴歸分析 延續上一個模組,我們探討迴歸分析的各種變化,協助你釐清變數間錯綜複雜的關係。雖然不能讓你一秒變專家,但是可以讓你一秒看起來像專家,有時候還可以一秒戳破看起來像專家的人的錯誤。
除了介紹概念,我們也介紹如何在 R 語言中實作課程裡提到的統計方法,並且在現場讓大家動手實作。
課程介紹
今天開始打造人工智慧團隊-給企業主及團隊領導者的經驗談,解析所有你將遇到的已發生,未發生,將發生的問題及陷阱已額滿

今天開始打造人工智慧團隊-給企業主及團隊領導者的經驗談,解析所有你將遇到的已發生,未發生,將發生的問題及陷阱

今天開始打造人工智慧團隊-給企業主及團隊領導者的經驗談,解析所有你將遇到的已發生,未發生,將發生的問題及陷阱最近的科技新聞熱點在人工智慧,街頭巷口人人都在談人工智慧,因為已證明在許多產業應用上的價值,讓許多企業趨之若騖,不論本來談不談/做不做資料科學及大數據研發及導入,今年開始都開始談人工智慧。他們可能說,我們已從大數據階段「進化」到人工智慧,比其它還在做大數據的公司還「先進」,這是種有趣的說法。事實上,大數據、機器學習及人工智慧是不可分割的。大數據是資訊來源,機器學習是資訊的處理方法,藉以淬取出複雜的規則,讓電腦展現出擬似人類智慧的行為,我們稱為人工智慧。換句話說,以今天的技術來說,大數據及機器學習是發展人工智慧的必要條件;在人工智慧技術領先的企業,同時也必然是大數據及機器學習的領先者,沒有人能跳過這兩者而直接開發出先進的人工智慧系統。因此,若想要導入人工智慧,過去欠的技術債,今天必須先還清。企業裡的資料基礎建設 (例如資料倉儲) 建好了嗎?資料管理有個統一的授權模式嗎?或是依舊得讓資料使用者一一去說服企業中分散各處的資料擁有者?資料的收集及產出有融入企業流程中嗎?還是每次得為了特定的專案再花人力時間資源來整理收集?資料應用的導入是預設得進行的常規任務,還是得另外花力氣去說服所有相關單位?分析資料的團隊是管理資料的團隊兼任,還是有個專業的資料分析團隊來進行?同時,所有的資料應用者都熟悉機器學習嗎?還是以傳統繪圖製表的方式在做基礎層次的資料視覺化?更直白的說法是,千萬不要以為公司有資料倉儲,打開電腦就有報表可以看,公司同仁開會討論時都是基於漂亮的即時圖表,就是把大數據應用的很好的公司。事實可能剛好相反,最淺層的資料應用是讓老板每天看圖表;最最深入的資料應用應用是隱形的,看不到圖表。不然你覺得 AlphaGo 是看著一堆圖表學到如何下棋的嗎?透過機器學習從資料淬取規則出來,而那些規則因為過於複雜,所以根本無法完整地視覺化呈現,只能以人工智慧系統來直接應用這些規則,讓系統根據當前的輸入值提供最佳的輸出值。過去幾年,我們在資料的蒐集及解讀上很熱衷,對於機器學習這種以看不見圖表的方式來分析資料及發展人工智慧應用有點後知後覺。十分期待本土各種產業在覺知後的奮起直追,特別在我們有特殊利基點的產業(如製造業、農業、生醫產業等)及社會領域(施政、公用事業、教育等)上,以真正踏實的人工智慧發展來改善社會及產業體質。在此課程中,我將為聽眾闡明資料科學、大數據、人工智慧、機器學習/深度學習等相近但又不同的詞彙,再以各領域的實際案例來分享資料的可能應用及實用價值。同時,我將與聽眾分享其協助多家企業培訓資料科學家及導入資料科學/人工智慧團隊的各種經驗,各種常見的問題以及如何解決這些問題的有效方式。如何選才/育才,才能讓團隊擁有最堅實的戰力以高效率來解決問題。如何選題,才能快速展現團隊的價值等等。最後,我將探討台灣發展人工智慧的挑戰及契機,以及企業應用人工智慧進行競爭力升級的方式及各種關鍵議題。
課程介紹
Python 爬蟲實戰已額滿

Python 爬蟲實戰

Python 爬蟲實戰資料科學的世界中,資料是一切的基石,而網際網路則蘊藏了豐富的資料等待著挖掘與分析。在這資料科學蔚為風行的時代,網路爬蟲的技術是一項非常實用的技能,若您有朝思暮想的資料在網路上 (例如表特版上被推爆的文章),卻苦無方法可以爬取;又或是想抓取熱門電影的票房、評論資料做分析建模,卻不知如何下手,那麼這堂 Python 爬蟲實戰的課程將會很適合您。本課程利用六個小時的時間,上午將從最基本的 HTML 網頁結構開始,透過範例與實戰練習帶您學會爬取網頁文字資料並解析其結構與內容,再運用簡單的資料視覺化與資料分析,帶您實際走一回資料分析的歷程。而下午會進一步介紹檔案的爬蟲、從爬取網頁到爬取網站、模擬人類行為的爬蟲程式,以及現代複雜的網頁設計中,爬蟲程式有可能遭遇的問題。 
課程介紹