总结
本模块介绍了一些重要的新术语。 让我们回顾一下我们所学到的内容:
机器学习的目标是发现数据中的模式,并使用这些模式进行估计。
机器学习不同于普通软件的开发,因为我们使用的是特殊代码而不是我们自己的直觉来改进软件的性能。
从概念上讲,该学习过程使用了四个组件:
- 数据,这是我们想要学习的信息。
- 模型,它数据进行估计。
- 模型尝试实现的目标。
- 优化器,根据模型性能对模型进行更改的额外代码。
可以将数据视为功能和标签。 特征对应于潜在的模型输入,而标签对应于模型输出或所需的模型输出。
Pandas 和 Plotly 是功能强大的工具,可用于在 Python 中探索数据集。
在获得经过训练的模型后,我们可以将它保存到磁盘供以后使用。