-----------------------------------------
圖片放大特效
table樣式
--- ## Week 13: 檔案處理(下) - 資料分析小達人! - **生活議題**: 建立成績管理系統,追蹤學習進度 - **課程內容**: - CSV檔案格式介紹與應用 - Pandas基礎操作 (DataFrame, Series) - 資料分析入門技巧 (篩選、排序、統計) - 讀取CSV成績資料與資料清理 - 計算平均、最值與排名統計 - 使用Matplotlib繪製統計圖表與趨勢分析 - **運算思維**: - **模式識別**: 識別資料中的統計模式與趨勢 - **抽象化**: 理解資料分析的基本概念與流程 - **演算法思維**: 設計資料處理與分析的演算法
- [🧠 運算思維總整理](#本週總結-🎉)
## 什麼是 CSV?
💡 **為什麼要用 CSV?**
## 認識 Pandas
## 什麼是 DataFrame?
--- ## 🧠 運算思維總整理  --- ## 🔍 模式識別 **在資料分析中識別模式:** 1. **成績分布模式** - 觀察哪些科目普遍較高/較低 - 找出成績集中的區間 2. **學生表現模式** - 辨識優秀學生的共同特徵 - 發現需要加強的學習領域 3. **相關性模式** - 某科成績好,其他科是否也好? - 找出科目之間的關聯性 💡 **實例:** 透過盒鬚圖發現數學成績變異較大 --- ## 🎯 抽象化思維 **將複雜問題簡化為核心概念:** 1. **資料結構抽象化** - 表格 → DataFrame - 欄位 → Series - 統計 → 函數運算 2. **分析流程抽象化** ``` 原始資料 → 清理 → 計算 → 視覺化 → 結論 ``` 3. **功能模組化** - 讀取模組 - 計算模組 - 繪圖模組 - 查詢模組 💡 **實例:** 將成績管理系統封裝成 GradeAnalyzer 類別 --- ## 🧮 演算法思維 **設計資料處理的步驟:** 1. **排序演算法應用** ```python # 找出前三名的演算法 sorted_students = df.sort_values('總分', ascending=False) top3 = sorted_students.head(3) ``` 2. **篩選演算法設計** ```python # 多條件篩選的邏輯 excellent = df[(df['國文']>=85) & (df['英文']>=85) & (df['數學']>=85)] ``` 3. **統計演算法實作** ```python # 計算排名的演算法 df['排名'] = df['總分'].rank(ascending=False, method='min') ```
3. **NumPy** - 數值運算(下次課程)
🎯 **下週預告:** 進階資料分析與機器學習入門!
--- ## 📋 繳交格式 **繳交內容:** 1. 📄 Python 程式檔(.py) 2. 📊 CSV 資料檔案 3. 📈 生成的圖表檔案(.png) 4. 📝 簡短說明文件(說明程式功能與使用方法) **繳交期限:** 下週上課前 **評分標準:** - 程式正確性(40%) - 功能完整度(30%) - 程式碼品質(20%) - 創意與美觀(10%) 💪 加油!期待看到你的成績分析系統!