总结
在本模块中,你了解了如何使用 Python 探索、可视化和操作数据。 数据探索是数据科学的核心,也是数据分析和机器学习中的关键要素。
机器学习是处理预测建模的数据科学的一个子集。 换句话说,机器学习使用数据创建预测模型,以便预测未知值。 你可以使用机器学习来预测超市需要订购多少食物,或识别照片中的植物。
机器学习的工作原理是识别描述某物特性的数据值(特征,例如植物的高度和颜色)和我们想要预测的值(标签,例如植物的种类)之间的关系。 这些关系通过训练过程构建到模型中。
挑战:分析飞行数据
如果本模块中的这个练习激发了你尝试自己探索数据的灵感,那么为什么不接受包含美国交通部飞行记录的现实世界数据集的挑战? 你将在 01 - Flights Challenge.ipynb 笔记本中找到此挑战!
注意
此挑战是可选的,完成时间不受本训练模块中的估计时间限制。 你可以想花多少时间就花多少时间!