首页 » 机器学习实战 » 机器学习实战全文在线阅读

《机器学习实战》1.8 本章小结

关灯直达底部

尽管没有引起大多数人的注意,但是机器学习算法已经广泛应用于我们的日常生活之中。每天我们需要处理的数据在不断地增加,能够深入理解数据背后的真实含义,是数据驱动产业必须具备的基本技能。

学习机器学习算法,必须了解数据实例,每个数据实例由多个特征值组成。分类是基本的机器学习任务,它分析未分类数据,以确定如何将其放入已知群组中。为了构建和训练分类器,必须首先输入大量已知分类的数据,我们将这些数据称为训练样本集。

尽管我们构造的鸟类识别专家系统无法像人类专家一样精确地识别不同的鸟类,然而构建接近专家水平的机器系统可以显著地改进我们的生活质量。如果我们可以构造的医生专家系统能够达到人类医生的准确率,则病人可以得到快速的治疗;如果我们可以改进天气预报,则可以减少水资源的短缺,提高食物供给。我们可以列举许许多多这样的例子,机器学习的应用前景几乎是无限的。

第一部分的后续6章主要研究分类问题,它是监督学习算法的一个分支,下一章我们将介绍第一个分类算法——k-近邻算法。