《机器学习》 第 1 章 绪论 读书笔记
西瓜书 周志华 2016 年 12 月第 14 次印刷
1.1 引言
机器学习:利用经验来决策
1.2 基本术语
根据数据是否拥有标记信息分类:
- 监督学习 supervised learning
- 分类 classification
- 回归 regression
- 无监督学习 unsupervised learning
- 聚类 clustering
1.3 假设空间
假设空间指的是所有跟问题相关的假设所组成的空间,学习过程是从假设空间中进行搜索,目标是找到与训练集「匹配」(fit)的假设。
在这么多的假设中,可能存在一些假设,得出的结果和训练集一致,这些假设组成的空间叫做「版本空间」(version space)。
1.4 归纳偏好
对于数据集中没有出现过的情况,算法可能会按照自己的偏好来预测结果,这种情况称为「归纳偏好」。为算法选取偏好时,可以使用「奥卡姆剃刀」原则,即有多个假设与观察一致,则选最简单的那个。但是什么是最简单的也需要仔细思考。
没有免费的午餐定理(No Free Lunch Theorem, NFL)
- 在所有问题出现的机会相同时,所有的算法的期望性能相同。
- 任何一个算法都有表现好的问题,也有表现差的问题。
- 针对具体的学习问题研究算法。脱离具体问题,研究什么算法更好毫无意义。
1.7 阅读材料
其他科学研究中采用的假设选择原则
古希腊哲学家伊壁鸠鲁 「多释原则」:保留与经验观察一致的原则。
《机器学习》 第 1 章 绪论 读书笔记