摘要
在此課程模組中,您已了解如何使用 Python 來探索、視覺化及操作資料。 資料探索是資料科學的核心,而且是資料分析和機器學習中的重要元素。
機器學習是可處理預測性模型的資料科學的子集。 換句話說,機器學習會使用資料來建立預測性模型,以便預測未知的值。 您可以使用機器學習來預測超市需要訂購的食物數量,或識別相片中的植物。
機器學習的運作方式是識別資料值之間的關聯性,這些值會描述某個事物的特性 (其 功能,例如植物的高度和色彩),以及我們想要預測的標籤 (例如植物的物種)。 這些關聯性是透過定型程序內建在模型中。
挑戰:分析航班資料
如果本課程模組中的練習已啟發您嘗試自行探索資料,那麼何不面對真實世界資料集的挑戰,其中包含美國運輸部的航班記錄? 您可以在 01 - 航班挑戰.ipynb 筆記本中找到這項挑戰!
注意
本訓練課程模組的預估時間不包含完成這項選用挑戰的時間。 您在上面花費的時間可以隨您喜好增減!