機器學習的資料科學基礎

初級
中級
AI 工程師
資料科學家
開發人員
學生
Azure

Microsoft Learn 提供數種互動方式來取得傳統機器學習的簡介。 這些學習路徑可讓您有生產力,而且也是前進到深度學習主題的絕佳基礎。

從最基本的傳統機器學習模型到探索式資料分析和自訂架構,您都能透過輕鬆地將概念內容和互動式 Jupyter 筆記本進行摘要來獲得引導,而不需要離開您的瀏覽器。

根據您的教育背景和興趣選擇您自己的路徑。

✔ 選項1:完整課程:機器學習的資料科學基礎

這是針對大部分人員的建議選項。 與具有自訂流程 (可最大化概念增強) 的其他兩個學習路徑有完全相同的課程模組。 如果您同時想要了解基礎概念,以及如何使用最常見的機器學習工具來建立模型,這是適合您的路徑。 如果您打算超越傳統機器學習,並取得深度學習和神經網路的教育 (我們只在這裡介紹),這也是最好的路徑。

✔ 您目前在此路徑上,請向下捲動以開始。

✔ 選項2:了解機器學習的資料科學學習路徑

如果您想要了解機器學習的運作方式,但是沒有太多數學背景,那麼這個路徑適合您。 對於先前的教育不做任何假設 (除了要有編碼概念的一點熟悉度),並且以程式碼、比喻和視覺效果教導,讓您茅塞頓開。 這是實際操作,但是更著重於了解基礎概念,在可用工具和程式庫的功能上著墨較少。

選項3:建立機器學習模型 學習路徑

如果您已經有一些機器學習的概念,或您有堅強的數學背景,則可能會樂於直接跳到「建立機器學習模型」學習路徑。 這些課程模組會教導一些機器學習概念,但是很快就會移動,讓他們可以使用 scikit-learn-learning、TensorFlow 和 PyTorch 等工具的能力。 如果您只是想要尋求了解 Azure ML 或 Azure Databricks 這類產品機器學習範例的足夠熟悉度,此學習路徑也是最適合您的其中一個路徑。

必要條件

此學習路徑中的課程模組

此進階機器學習概觀適合稍微或完全不熟悉電腦科學與統計資料的人。 您將了解一些基本概念、探索資料,並以互動方式一一解說機器學習生命週期,使用 Python 來訓練、儲存和使用機器學習模型,就像在真實世界中一樣。

監督式學習是一種機器學習形式,讓演算法從資料範例學習。 我們會逐步介紹監督式學習是如何自動產生可對真實世界進行預測的模型。 也會觸及這類模型的測試方式,以及定型模型時可能產生的問題。

機器學習模型的威力來自定型其所用的資料。 透過內容和練習,我們可探索如何了解資料、如何將資料編碼以便電腦能夠正確解讀、如何清除錯誤,以及協助您建立高效能模型的秘訣。

資料探索和分析是資料科學的核心。 資料科學家需要 Python 等程式設計語言的技能,才能探索、視覺化及操作資料。

迴歸是最廣泛使用的機器學習服務技術,通常是基礎科學探索、商務規劃,以及股票市場分析。 這項學習資料會深入探討一些常見的迴歸分析,不僅簡單也更複雜,還提供有關如何評估模型效能的一些見解。

當我們想到機器學習時,往往只會注意到定型流程。 在此流程之前進行少量的準備工作,不僅能加快和改善學習,還能讓我們相信自己的模型能夠應付以往從未見過的資料。

迴歸是一種常用的機器學習,用來預測數值。

分類是指將項目指派至各個類別,或者,也可以將其想成是自動做決策。 在這裡,我們會透過羅吉斯迴歸來介紹分類模型,讓您以此作為踏板來了解更複雜且更令人興奮的分類方法。

您往往可以手動自訂更複雜的模型以改善其效果。 透過練習和說明內容,我們將探討改變更複雜模型的架構,會如何提供更有效的結果。

我們要如何知道模型在分類資料時的表現好壞? 電腦在評估模型效能時所用的方式有時很令人費解,有時則可能過度簡化模型在真實世界中的表現。 為了建置能以令人滿意的方式運作的模型,我們需要找出直覺的評估方式,並了解這些計量會如何讓我們的觀點產生偏差。

接收者運算子特性曲線是一種強大的方法,可用於評估和微調定型的分類模型。 我們透過學習內容和實用練習,來簡介和說明如何使用這些曲線。

分類是一種機器學習,用來將項目依照類別分類。

「群集」是機器學習的一種類型,用來將類似項目分組為群集。

深度學習是一種進階機器學習形式,可模擬人類大腦透過連接神經網路學習的方式。