Úvod

Dokončeno

Python je jedním z nejoblíbenějších programovacích jazyků na světě. Komunita odborníků na data ho velmi často používá pro strojové učení a statistickou analýzu. Jedním z důvodů jeho oblíbenosti je dostupnost tisíců open-source knihoven, jako jsou NumPy, Pandas, Matplotlib nebo scikit-learn, které programátorům i výzkumníkům umožňují prozkoumávat, transformovat, analyzovat a vizualizovat data.

Azure Notebooks je cloudová platforma pro vytváření a spouštění poznámkových bloků Jupyter. Jupyter je prostředí založené na jádru IPython, které umožňuje interaktivní programování a analýzu dat pomocí Pythonu a jiných programovacích jazyků. Platforma Azure Notebooks poskytuje prostředí Jupyter jako bezplatnou službu. Umožňuje pohodlně vytvářet kód v Pythonu bez nutnosti instalovat a spravovat server Jupyter. A jako webové řešení je ideální pro online spolupráci.

V tomto modulu vytvoříte poznámkový blok Azure, naimportujete datovou sadu, která obsahuje informace o včasných příletech u významné americké letecké společnosti, a načtete tuto datovou sadu do poznámkového bloku. Potom vyčistíte datovou sadu pomocí Pandasu, vytvoříte model strojového učení pomocí knihovny scikit-learn a výstup modulu vizualizujete pomocí knihovny Matplotlib.

Cíle výuky

V tomto modulu:

  • Vytvořit poznámkový blok Jupyter ve službě Azure Notebooks, naimportovat data a zobrazit data načtená do poznámkového bloku
  • Vyčistit data a připravit je pro použití v modelu strojového učení pomocí Pandasu
  • Vytvořit model strojového učení pomocí knihovny scikit-learn
  • Vizualizovat výkon modelu pomocí knihovny Matplotlib