資料科學課程

智慧城市中的時空大數據應用已額滿

智慧城市中的時空大數據應用

伴隨著城市化的腳步越來越快與城市人口日漸增加,提供城市居民必要的服務如交通、醫療、能源、環境、教育與公共安全等設施與都市規劃,受到龐大的壓力挑戰,錯誤的政策將導致大量的資源浪費與民怨,城市居民需要生活品質、便利設施、健康環境、便民政策、合理房價與更多社會福利等各種面向的公共需求。 由於資訊技術與行動裝置的快速發展,雲端運算、物聯網、感測網路、行動通訊、社交媒體、地理資訊等技術與服務日漸成熟,城市中由不同平台產生的異質性資料 (如感測網路、社群媒體、交通資訊、人群移動、地理特性與環境監測等資料) 已成為解決城市發展課題的重要手段,分析城市中的時空大數據將有利於開發者提供各種個人化或客製化的智慧型服務,也可輔助政府或企業管理高層做出聰明的決策,在本課程中將介紹如何處理城市的異質性大數據以及善用其開發社群媒體、商業策略、交通、能源、環保、旅遊與都市規劃等相關的智慧應用。
課程介紹
統計學家教你穩紮穩打 R 語言資料分析已額滿

統計學家教你穩紮穩打 R 語言資料分析

統計學家教你穩紮穩打 R 語言資料分析 資料科學是綜合統計學、資訊科學及領域知識的一門新興學科。因此,要成為一名資料科學家,對統計當然要有基本的認識。舉凡日常的機率統計問題,例如:算機率值,統計參數估計,假設檢定及模型配適等等,除了需要理論証明推導之外,也需以程式做數值的模擬與驗証。而 R 語言正是研究者分析資料及執行統計模擬不可或缺的工具。也因為 R 軟體具有豐富的統計套件,也成為資料科學領域裡最受歡迎的程式語言之一。 本課程由統計學家教您用 R 進行資料處理、呈現及統計分析。從第一天 R 的基礎 + 進階 (資料輸出輸入及處理、統計圖形、機率分佈、假設檢定、變異數分析、模擬統計模型與迴歸分析) 到第二天的統計分析方法應用(探索式資料分析、資料探勘案例研究),除了著重在方法理論的講述、假設及觀念的闡釋,同時也強調實際 R 程式撰寫操作,希望藉由本課程之訓練,奠定學員 R 程式撰寫及資料統計分析的基礎,並具有判斷不同狀況該用什麼不同的統計方法的數據能力。  
課程介紹
Machine Learning 機器學習課程已額滿

Machine Learning 機器學習課程

近年來,從機器學習、深度學習到人工智慧,都是透過分析這些巨量的資料,從中萃取出有價值的訊息,進而讓「電腦」對各種狀況作出正確判斷,甚至對一些未來的狀況做出預測。這些技術的高度發展,也帶動了各式各樣的創新應用。從 IBM 的 Watson 在 Jeopardy 搶答賽贏過參賽者、Google Deep Mind 的 AlphaGo 以四勝一負戰勝南韓九段天才棋王李世乭、Amazon 的 Echo 到工業 4.0、智慧城市等等。這些改變,已徹底改變了人類思考、學習與生活方式。 本課程將介紹機器學習的基礎與原理,也將涵蓋各式機器學習演算法的核心技術:數值最佳化方法,同時也提供各種評估指標,以利在演算法中的參數挑選與不同演算法之間的比較。Washington University Prof. Pedro Domingos (The Master Algorithm, 大演算一書的作者),曾將機器學習分成三個主要部分:表現 (Representation)、最佳化 (Optimization)、評估 (Evaluation)。與本課程的安排相符。
課程介紹
使用 R 語言建立自己的演算法交易事業已額滿

使用 R 語言建立自己的演算法交易事業

我們希望藉由近幾年資料科學的興起,推廣正確的金融交易知識,包括金融資料分析與建立自己的演算法交易事業。自己的策略自己做,自己的風險自己控,自己的部位自己顧。在本課程裡,1 就是 1,2 就是 2,40 就是 40 (事實),沒有怪力亂神,沒有定義不清,一切的一切,統計說話,數據說話!本課程與上一課程 (用 R 輕鬆做交易策略分析及自動下單) 部分重覆,本次除針對理論做更深入講解,亦增加股票、期貨、選擇權開發實務分享。
課程介紹
人類行為大數據分析:資料科學如何應用在教育及醫療領域已額滿

人類行為大數據分析:資料科學如何應用在教育及醫療領域

人類本身具有透過觀察另一人的行為以做出高階層判斷,如情緒、個性、喜好、意圖…等訊息的高度整合能力。這種人類的主觀感知機制不僅發生在日常生活中,更早已廣泛在行為科學 (behavior science) 領域中被應用於專業主觀評量與行為分析。近年來,隨著工程訊號處理演算法的進步,學科領域界線的破除,加上大數據資料科學的發展,慢慢匯流出新興跨學科整合式「人類行為訊號處理」:建置高可信度 (reliability)、可複製性 (repeatable) 及可擴展性 (scalable) 的系統將此人類的主觀感知機制自動化。 本課程將以數個教育及醫療應用實例為主軸,包含教育演講自動評分建置、急診檢傷疼痛指數系統開發、至臨床自閉症類群症狀行為診斷分析等等,貫穿並拆解「人類行為訊號處理」四大簡易步驟。希望透過本課程提供的簡易上手指南後,學員可以開始將各自領域手邊目前依人類的「主觀」認知而形成的專業判斷依據納入全新以資料角度而產生的「客觀」人類行為分析之決策工具。
課程介紹
資料探勘速訪已額滿

資料探勘速訪

資料探勘是資料科學中一個基礎的修習科目,這個學問結合了機器學習、人工智慧、資料庫、訊號處理、與統計等不同領域的技術,期待能從雜亂、巨大的資料中抽取出有意義的知識。理論上,透過這個技術,資料科學家可以作出各種應用。然而實際上,由於資料未經處理前,往往混亂、難以著手,如果沒有正確處理資料,往往無法得到有價值的知識。 本課程的目的,在於帶領初學者了解如何從整理混亂的資料、並找到最適合的技術來解決問題,這堂課除了會深入淺出的教授一般教科書有的技術外,並會給與實際應用的例子,讓初學者能練習面對問題的方法,也能運用技巧來分析成品並同時教導如何衡量分析結果,正確嗎?有用嗎?有趣嗎? 本課程由四個部分組成:
  1. 資料面面觀 資料探勘中需要花很多時間整理資料,資料要怎麼整理?能怎麼整理,在開始之前,先了解資料的屬性,才能事半功倍。
  2. 基礎資料探勘技術 這堂課會用飛快的方式簡介各種資料探勘技術、以及了解不同技術的適用範圍,未來遇到問題的時候,才有辦法選對工具。
  3. 眼見為信?鑽石或玻璃? 在這堂課中,我們會簡介如何正確評量資料,怎樣才算正確?或是怎樣評量才適合?Correctness or Interestingness?找到正確的評量方式,才能有令人滿意的結果。
  4. 案例分享 思考 To be or not to be 的時間,在這堂課中,我們會請學員們實際看一份資料,思考要怎樣從這份資料中找出鑽石出來,討論與分享後,將會分享過去學生曾經試過的方法,實際體會資料探勘能成功的訣竅。
課程介紹
給工程師的統計學及資料分析 123已額滿

給工程師的統計學及資料分析 123

「統計學」,是一個大家都熟悉卻可能又陌生的名詞。做為傳統上最接近資料科學、藉由分析資料去探索事實真相的一門學問,統計學遍佈在大專院校的各個系所中,在以往是許多學生最大的惡夢之一,現在卻又在大數據的時代,被許多人宣稱統計學已死。到底什麼是統計學?統計學包含資料分析,還是資料分析包含統計學?統計學能做到什麼,又不能做到什麼?會算平均數跟標準差之後,如果懂機率學,還能多做些什麼? 這門課程將由臺大資管系孔令傑助理教授主講,用一天的時間對統計學與資料分析做一個入門的介紹。時間雖短,內容雖淺,相信仍可以幫大家釐清一些概念,也讓初學者學到一些可以實戰的技術。更重要的是,這門課希望能給大家在未來繼續學習進階知識的動機與基礎。
課程介紹
手把手教你 R 語言資料分析實務已額滿

手把手教你 R 語言資料分析實務

在此課程中將帶領對資料分析感到陌生卻又充滿興趣的您,完整地學會運用 R 語言從最初的蒐集資料、探索性分析解讀資料,並進行文字探勘,發現那些肉眼看不見、隱藏在資料底下的意義。 此課程主要設計給對於 R 語言有基本認識,想要進一步熟悉實作分析的朋友們,希望在課程結束後,您能夠更熟悉 R 語言這個豐富的分析工具。透過蘋果日報慈善捐款的資料集,了解如何從頭解析網頁,撰寫爬蟲自動化收集資訊;取得資料後,能夠靈活處理資料,做清洗、整合及探索;並利用現成的套件進行文字探勘、文本解析;我們將一步步實際走一回資料分析的歷程,處理、觀察、解構資料,試著看看人們在捐款的決策過程中,究竟是什麼因素產生了影響,以及這些結果又是如何從資料中挖掘而出的呢?
課程介紹
電腦視覺一二三已額滿

電腦視覺一二三

電腦視覺旨在發展演算法使得電腦能理解影像的內容,近年來電腦視覺相關的技術已廣泛應用於我們生活中,舉凡物件偵測,識別,追蹤,三維重建,多媒體分析以及檢索,監控系統,醫療影像,以及電視電影中的許多視覺效果都可以看到電腦視覺技術的應用。 這場演講的目的在於介紹電腦視覺中的基本觀念和核心技術,透過大量實際的範例幫助大家快速了解這些技術如何被應用在日常生活中,以期讓聽眾有效率地了解這個領域,最新的發展以及未來展望。    
課程介紹
人工智慧與機器學習在推薦系統上的應用已額滿

人工智慧與機器學習在推薦系統上的應用

本課程特別邀請到臺大資工系林守德教授,利用六小時的課程簡介人工智慧的歷史演進以及其與機器學習的關聯,同時也會介紹在實務上如何訓練好的機器學習模型,及如何應用相關技術建立智慧推薦系統。 本課程由四個部分組成:
  • 人工智慧與機器學習簡介
  • 內容為本推薦系統
  • 協同過濾系統
  • 進階推薦系統
   
課程介紹
星火燎原 - Spark 機器學習初探已額滿

星火燎原 - Spark 機器學習初探

此課程專為 Spark 入門者設計,在六小時帶您從無到有建置 Spark 開發環境,並以實作方式帶領您了解 Spark 機器學習函式庫 (MLlib) 的應用及開發。課程實作將以 Spark 核心之實作語言 - Scala 為主,搭配 Scala IDE eclipse 及相關 Library 建置本機開發環境,透過 IDE 強大的開發及偵錯功能加速開發流程;並介紹如何佈置至 Spark 平台,透過 Spark-submit 執行資料分析工作。
本課程涵蓋機器學習中最常使用之分類、迴歸及分群方法,在本課程中您將會了解到如何操作 Spark 核心資料集 - Resilient Distributed Dataset (RDD) 取得資料的概括統計量 (summary statistics);並了解決策樹演算法 (Decision Tree)、最小平方法 (Linear least squares) 及 K-Means 演算法如何應用於租借量分析預測及網頁分類等情境。
歡迎對 Spark 感興趣,卻不知從何下手;或想快速的對 Spark 機器學習有初步的了解的您參與!
課程介紹
DSC x TAAI 2016 一天搞懂深度學習已額滿

DSC x TAAI 2016 一天搞懂深度學習

深度學習 (Deep Learning) 是機器學習 (Machine Learning) 中近年來備受重視的一支,深度學習根源於類神經網路 (Artificial Neural Network) 模型,目前最好的語音辨識和影像辨識系統都是以深度學習技術來完成,你可能在很多不同的場合聽過各種用深度學習做出的驚人應用 (例如:最近紅遍大街小巷的 AlphaGo),聽完以後覺得心癢癢的,想要趕快使用這項強大的技術,卻不知要從何下手學習,那這門課就是你所需要的。 這門課程將由臺大電機系李宏毅教授利用短短的一天議程簡介深度學習,包含什麼是深度學習、深度學習的各種小技巧、深度學習模型的各種變形及深度學習應用與展望。本課程希望幫助大家不只能了解深度學習,也可以有效率地上手深度學習,用在手邊的問題上。無論是從未嘗試過深度學習的新手,還是已經有一點經驗想更深入學習,都可以在這門課中有所收穫。
課程介紹