Dating-with-Machine-Learning
这个春天一起机器学习 —— Python 数据分析课。
是 Dating-with-python-this-winter 的后续。
机器学习与数据分析
目标
计划总共 14 周,每周两节理论课,
学会机器学习算法基本思想,为模型选择恰当的假设,编写机器学习代码。
前置条件:学过概率统计、线性代数。
课程表
课程文档可以下载文件,用 Typora 在电脑打开。或者上知乎 机器漫游指南。
All Cheat Sheets 是几个著名数据分析框架的“作弊表”,有些代码不会写的可以看看就上手。
课节 | 文档和视频 | 直播时间(20:00) | 课后作业期限(23:59) |
---|---|---|---|
1 | ML1. 机器学习入门 | 知乎| bilibili | 星期三 | 星期五 |
2 | ML2. 模型评估与选择(数据集构建) | 知乎| bilibili | 星期六 | 无 |
3 | ML3. 线性模型基础 | 知乎 | bilibili | 星期三 | 无 |
4 | ML4. 线性回归实验 | ML4. 对数几率回归与广义线性模型 | 知乎| bilibili | 星期一 | 无 |
5 | ML5. 线性模型识别手写数字 | 知乎 | bilibili | 星期三 | 无 |
6 | ML6. 层层递进,决策树模型 | 知乎 | bilibili | 星期三 | 无 |
课程结构
- 机器学习入门
- 模型评价与选择:
- 经验误差与结构误差
- 评价指标
- 比较检验与假设检验
- 学习理论:频率派和贝叶斯派
- 学习理论:PAC 和 VC维
- 数据预处理方法
- 学习模型:
- 最小二乘法线性回归——线性模型
- KNN 算法
- 决策树
- 支持向量机
- 梯度提升与随机森林
- 贝叶斯分类器
- 马尔可夫随机场
参考书目
"Learning from Data"
《统计学习方法》李航
《机器学习》周志华(西瓜书)以及《如何使用本书》
《南瓜书PumpkinBook》 辅助西瓜书
《机器学习实战:基于Scikit-Learn、Keras和 TensorFlow(原书第2版)》