文字探勘

文字探勘者的入門心法已額滿

文字探勘者的入門心法

我們都知道資料探勘是資料科學中的基礎科目,這個科目總讓大部分的人有個錯覺:以為學了這門課以後,就可以從雜亂、巨大的資料中抽取出有意義的知識。然而實際上,即使上完了資料探勘課卻仍然發現資料往往混亂、難以著手,無法真正從透過資料探勘技術得到有價值的知識。 為甚麼?大部份的資料探勘或機器學習方法其實都是利用數值資料,文字資料要分析、整理往往要經過許多前處理,才有可能挖掘文字中的深層知識,即使是同一批文字資料,透過不同處理方式能得到的資訊常常差異甚大。本課程的目的在引領資料工作者:分析、整理原始文字資料,針對文字、與待解問題的特性,找到適合的轉換方式,進而可以利用資料探勘技術,找出有價值的知識。
課程介紹
資料探勘速訪已額滿

資料探勘速訪

資料探勘是資料科學中一個基礎的修習科目,這個學問結合了機器學習、人工智慧、資料庫、訊號處理、與統計等不同領域的技術,期待能從雜亂、巨大的資料中抽取出有意義的知識。理論上,透過這個技術,資料科學家可以作出各種應用。然而實際上,由於資料未經處理前,往往混亂、難以著手,如果沒有正確處理資料,往往無法得到有價值的知識。 本課程的目的,在於帶領初學者了解如何從整理混亂的資料、並找到最適合的技術來解決問題,這堂課除了會深入淺出的教授一般教科書有的技術外,並會給與實際應用的例子,讓初學者能練習面對問題的方法,也能運用技巧來分析成品並同時教導如何衡量分析結果,正確嗎?有用嗎?有趣嗎? 本課程由四個部分組成:
  1. 資料面面觀 資料探勘中需要花很多時間整理資料,資料要怎麼整理?能怎麼整理,在開始之前,先了解資料的屬性,才能事半功倍。
  2. 基礎資料探勘技術 這堂課會用飛快的方式簡介各種資料探勘技術、以及了解不同技術的適用範圍,未來遇到問題的時候,才有辦法選對工具。
  3. 眼見為信?鑽石或玻璃? 在這堂課中,我們會簡介如何正確評量資料,怎樣才算正確?或是怎樣評量才適合?Correctness or Interestingness?找到正確的評量方式,才能有令人滿意的結果。
  4. 案例分享 思考 To be or not to be 的時間,在這堂課中,我們會請學員們實際看一份資料,思考要怎樣從這份資料中找出鑽石出來,討論與分享後,將會分享過去學生曾經試過的方法,實際體會資料探勘能成功的訣竅。
課程介紹