机器学习的基础概念
- 什么是机器学习
- 通过编程让计算机从数据中学习规律
- 为什么要用机器学习
- 不存在已知算法的复杂问题
- 规则太多而很难调整的问题
- 自适应自学习的系统
- 计算机辅助人类学习
- 机器学习的分类
- 监督/无监督学习
- 批量/在线学习
- 实例/模型学习
- 机器学习所面临的挑战
- 数据缺乏、质量差
- 数据代表性/信息量不足
- 模型简单欠拟合
- 模型复杂过拟合
- 补充概念
- 超参数:学习算法的参数
- 泛化:对新样本的适应能力
- 交叉验证:将训练集分为不同的子集,用不同的组合来进行验证