Information Retrieval 資訊檢索
1. Announcement
- 2008/01/08: 課程講義將陸續於上課前在網站公布下載。
- 2008/10/27: TS50SDK COM Alpha1 (TS50SDKCOM_20090228_1M)
- 2008/11/03: TS50SDK COM
- 2008/11/10: TS50SDK COM
- 2008/11/17: TS50SDK COM
- 2008/11/24: 遠端網頁抓取注意事項 下載
- 2008/12/01: 分組名單 下載
- 2008/12/01: 補充材料 常見Spider列表 使用iMacros抓取網頁 Tutorial
- 2008/12/08: Composer寫作
- 2008/12/15: Composer寫作
- 2008/12/29: 繳交作業: 請將Composer的script, 說明文件(簡單說明內容,安裝,修改步驟,效果等), 並附螢幕截圖, 整包寄給查老師
- 2008/12/29: 中文關鍵詞演算法
2. Class Information
- 課程編號: TT U2010
- 上課時間: 星期二 (15:00~18:00) 大會議室
- 授課教師: 楊立偉 博士 (bug@eland.com.tw)
- 課程助教:
- 參考書目:
- 本課程將以本書做為主要教科書。
Introduction to Information Retrieval, by Christopher D. Manning, etc. Cambridge University Press, 2008.
HTML & PDF edition
- 以下為本學域經典之參考書。
Modern Information Retrieval, by Ricardo Baeza-Yates & Berthier Ribeiro-Neto. Addison Wesley, 1999.
Introduction to Modern Information Retrieval, by Gerard Salton. McGraw-Hill, 1983.
3. Requirement and Grading
課程目標:
- 30% 了解資訊檢索之目的與理論
- 40% 培養資訊檢索系統設計之觀念與能力
- 30% 了解資訊檢索之相關技術、應用、議題與發展
授課方式:
- 主要採用課堂上課,以投影片搭配範例解說。
- 含實作議題討論與問答。
評分方式:
4. Schedule
Week 1 (2008/01/08)
Topic: Introduction, Apache Lucene, Dictionary and Postings.
- 課程大綱
- 資訊檢索導論 slides
- 案例介紹: Apache Lucene
- 基本索引建制: Dictionary and Postings
Week 2 (2008/01/15)
Topic: Tolerant retrieval, Index construction and compression.
- 容錯查詢 - 萬用字元, 拼字校正, 近音查詢
- 索引建置
- 索引壓縮
Week 3 (2008/01/22 → 2007/01/24)
Week 4 (2008/01/29)
Topic: Term weighting, Vector space model, XML retrieval
- 加權得分計算與結果排序
- 向量空間模型
- XML欄位條件與文數字混查
Week 5 (2007/02/05 → 2007/02/01?)
Topic: Evaluation, Query expansion, Chinese Information Retrieval(1)
- 查詢結果評估
- 查詢提示與展開
- 中文資訊檢索議題(1) - 字處理與詞處理
Week 6 (2008/02/12)
Topic: Classification, (Flat,Hierarchical) Clustering, Chinese Information Retrieval(2)
- 分類
- 聚類
- 中文資訊檢索議題(2) - 相似性計算, 分類, 聚類
Week 7 (2008/02/19)
Topic: Web search, crawling ,indexes, and link analysis. Enterprise search.
- Web search的特性
- Web 爬文與連結分析
- 企業搜尋的特性
Week 8 (2008/02/26)
Topic: 專題研究(1)
- Probabilistic information retrieval
- Semantic networks
Week 9 (2008/03/04)
Topic: 專題研究(2)
- Data agent
- Support vector machines, Latent semantic indexing, etc.
Week 10 (2008/03/11)
5. 成績查詢
Last update: 2008-Jan-08 (Archive version)