Úvod
Python je jedním z nejoblíbenějších programovacích jazyků na světě. Komunita odborníků na data ho velmi často používá pro strojové učení a statistickou analýzu. Jedním z důvodů jeho oblíbenosti je dostupnost tisíců open-source knihoven, jako jsou NumPy, Pandas, Matplotlib nebo scikit-learn, které programátorům i výzkumníkům umožňují prozkoumávat, transformovat, analyzovat a vizualizovat data.
Azure Notebooks je cloudová platforma pro vytváření a spouštění poznámkových bloků Jupyter. Jupyter je prostředí založené na jádru IPython, které umožňuje interaktivní programování a analýzu dat pomocí Pythonu a jiných programovacích jazyků. Platforma Azure Notebooks poskytuje prostředí Jupyter jako bezplatnou službu. Umožňuje pohodlně vytvářet kód v Pythonu bez nutnosti instalovat a spravovat server Jupyter. A jako webové řešení je ideální pro online spolupráci.
V tomto modulu vytvoříte poznámkový blok Azure, naimportujete datovou sadu, která obsahuje informace o včasných příletech u významné americké letecké společnosti, a načtete tuto datovou sadu do poznámkového bloku. Potom vyčistíte datovou sadu pomocí Pandasu, vytvoříte model strojového učení pomocí knihovny scikit-learn a výstup modulu vizualizujete pomocí knihovny Matplotlib.
Cíle výuky
V tomto modulu:
- Vytvořit poznámkový blok Jupyter ve službě Azure Notebooks, naimportovat data a zobrazit data načtená do poznámkového bloku
- Vyčistit data a připravit je pro použití v modelu strojového učení pomocí Pandasu
- Vytvořit model strojového učení pomocí knihovny scikit-learn
- Vizualizovat výkon modelu pomocí knihovny Matplotlib