Einführung
Python ist eine der beliebtesten Programmiersprachen weltweit. Die Data Science-Community setzt Python häufig für Machine Learning und statistische Analysen ein. Einer der Gründe für die Beliebtheit sind die Tausenden verfügbaren Open Source-Bibliotheken wie NumPy, Pandas, Matplotlib und Scikit-learn. Mit diesen Bibliotheken können Programmierer und Wissenschaftler Daten untersuchen, transformieren, analysieren und visualisieren.
Azure Notebooks ist eine cloudbasierte Plattform zum Erstellen und Ausführen von Jupyter-Notebooks. Jupyter ist eine auf IPython basierende Umgebung, die interaktives Programmieren sowie Datenanalysen mit zahlreichen Programmiersprachen, darunter Python, ermöglicht. Azure Notebooks enthält Jupyter als kostenlosen Dienst. So können Sie Python-Code bequem schreiben, ohne dass ein Jupyter-Server installiert und verwaltet werden muss. Darüber hinaus ist der Dienst webbasiert und eignet sich daher hervorragend zum Zusammenarbeiten online.
In diesem Modul erstellen Sie ein Azure-Notebook, importieren ein Dataset, das Daten zur pünktlichen Ankunft von Flügen einer großen US-amerikanischen Fluggesellschaft enthält, und laden dieses Dataset in das Notebook. Anschließend bereinigen Sie das Dataset mit Pandas, erstellen ein Machine Learning-Modell mit Scikit-learn und verwenden Matplotlib, um die Ausgabe des Modells zu visualisieren.
Lernziele
In diesem Modul lernen Sie Folgendes:
- Erstellen eines Jupyter-Notebooks in Azure Notebooks, Importieren von Daten und Anzeigen der im Notebook geladenen Daten
- Bereinigen und Vorbereiten der Daten für das Machine Learning-Modell mit Pandas
- Erstellen eines Machine Learning-Modells mit Scikit-learn
- Visualisieren der Leistung des Modells mit Matplotlib