name | description | source |
---|---|---|
dataset1 | 餐廳介紹與食記 | Food,EatToDie |
dataset2 | 電影介紹與討論 | movie |
dataset3 | 汽車、機車、腳踏車之討論 | bicycle,biker,car |
dataset4 | 網路購物討論 | e-shopping |
dataset5 | 美妝、親子、求職討論 | BeautySalon,BabyMother,Job |
dataset6 | 新聞資料 | |
dataset7 | 智慧型手機之討論 | HTC,iPhone,SAMSUNG,SonyEricsson |
dataset8 | 政治、手機與平板、科技求職討論 | HatePolitics,MobileComm,Tech_Job |
dataset9 | 智慧型手機之商品資訊 | HTC,iPhone,Galaxy,Xperia |
dataset10 | 博物館展討論 | Museum 下載 |
課程背景:
在數位化的時代中,科技的進步與網路的普及,使得資訊的產出呈現爆炸性的成長。
如何在大量非結構資訊中,找到使用者想要的,並藉由特殊的演算法,可進一步分析出資訊背後所隱藏的知識。
協助人們用更少的時間、處理更多的資訊、得到更高品質的知識,即為知識工程之目的。
而本課程將針對非結構資訊,特別是巨量文字資訊、以及網路資訊,介紹當今最新的技術與產業發展。
課程目標:
授課方式:
評分方式:
週次 | 主題 | 投影片 |
---|---|---|
Week 1 (2012.09.25) | Introduction 知識工程概論與課程介紹,以及學界與業界發展趨勢 | 課程大綱 投影片 |
Week 2 (2012.10.02) | Search Engine(1) 索引結構與檢索模型 | Ch1 |
Week 3 (2012.10.09) | Search Engine(2) 搜尋引擎實作: 資料擷取與索引建置 | 講義 Ch4 |
Week 4 (2012.10.16) | Search Engine(3) 進階檢索模型: 模糊容錯、同音、同義 | Ch6 作業一 |
Week 5 (2012.10.23) | Search Engine(4) 搜尋引擎實作: 分類檢索 | 講義 |
Week 6 (2012.10.30) | Text Processing(1) Term Weighting與TF-IDF模型 | Ch8 |
Week 7 (2012.11.06) | Text Processing(2) 非結構化資料處理實作: 中文NLP工具 | 講義 作業二 |
Week 8 (2012.11.13) | Text Processing(3) 非結構化資料處理實作: 摘要、命名實體、情緒判別 | 講義 |
Week 9 (2012.11.20) | Text Processing(4) Vector Space Model向量空間模型 | Ch9 |
Week 10 (2012.11.27) | Text Mining(1) Classification 知識分類的技術與應用 | Ch13 Ch14 作業二 |
Week 11 (2012.12.04) | Text Mining(2) Classification 知識分類的技術與應用 | Ch15 |
Week 12 (2012.12.11) | Text Mining(3) Clustering 知識分群的技術與應用 | Ch16 Ch17 |
Week 13 (2012.12.18) | Text Mining(4) 分類與分群實作: 分類工具 | 講義 作業三 |
Week 14 (2012.12.25) | Text Mining(5) 分類與分群實作: 標記工具 | Ch19 專題要求 |
Week 15 (2013.01.01) | 放假 | |
Week 16 (2013.01.08) | 專題提案 + Case Study | 作業三 |
Week 17 (2013.01.15) | Web Mining Analysis & Mining 網路資訊分析技術與應用 | Ch20 Ch21 SEO |
Week 18 (2013.01.22) | 專題展示 |
Last update: 2012 Sept.