簡介
回歸是一種簡單、常見且非常有用的資料分析技術,通俗地稱為「調整趨勢線」。回歸可識別一個或多個特徵與單一標籤之間的關聯性強度。 其簡單、可預測的行為、預測能力和高層級的可解譯性,都表示這項技術會在財務、業務、社會科學、流行病學和藥品中使用。
在本課程模組中,我們將深入探討迴歸的運作方式、了解其限制,以及了解如何評估其效能。
案例:獸醫診所超支
在本課程模組中,我們將使用下列範例案例來解釋基礎迴歸的概念。 此案例的設計目的是要提供在分析未來資料時,您如何使用這項技術的範例。
您所經營的雪崩搜救犬慈善機構的狗突然生病。 經過一天的重新訓練和一些社交活動之後,與您一起工作的許多狗都身體不適,主要的症狀是發燒 (體溫升高)。 針對尚未出現症狀的狗,您的小組已收集了前 100 隻生病的狗的基本資訊。 您的工作是識別哪些類型的狗有更高的疾病風險,方便獸醫可以主動檢查這類型的狗。
學習目標
在本單元中,您將:
- 了解迴歸如何運作。
- 使用新的演算法:線性迴歸、多重線性迴歸和多項式迴歸。
- 了解迴歸模型的優點和限制。
- 視覺化線性迴歸中的錯誤和成本函式。
- 了解迴歸的基本評估計量。
必要條件
- 熟悉機器學習模型