Cvičení – vytvoření poznámkového bloku Azure a import dat

Dokončeno

Prvním krokem je vytvoření poznámkového bloku Azure. Poznámkové bloky Azure jsou obsažené v projektech, jejichž primárním účelem je seskupovat související poznámkové bloky. V této lekci vytvoříte nový projekt a v něm pak vytvoříte poznámkový blok.

  1. V prohlížeči přejděte na https://notebooks.azure.com.

  2. Přihlaste se pomocí svého účtu Microsoft.

  3. V nabídce nahoře na stránce klikněte na My Projects (Moje projekty).

  4. Nahoře na stránce My Projects klikněte na tlačítko + New Project (+ Nový projekt).

  5. Vytvořte nový projekt s názvem Poznámkové bloky ML nebo podobným názvem. Pokud chcete, můžete zrušit zaškrtnutí políčka Public (Veřejný), ale když projekt nastavíte jako veřejný, bude možné obsažené poznámkové bloky sdílet s ostatními uživateli prostřednictvím odkazů, sociálních médií nebo e-mailu. Pokud si nejste jistí, kterou možnost zvolit, můžete projekt na veřejný nebo soukromý snadno změnit později.

    Vytvoření projektu

    Vytvoření projektu

  6. Klikněte na + New (+ Nový), v nabídce vyberte Notebook (Poznámkový blok) a přidejte poznámkový blok do projektu.

    Přidání poznámkového bloku do projektu

    Přidání poznámkového bloku do projektu

  7. Pojmenujte poznámkový blok například jako Včasné přílety.ipynb a jako jazyk vyberte Python 3.6. Vytvoří se tak poznámkový blok s jádrem Python 3.6 pro spouštění kódu Pythonu. Jednou z předností poznámkových bloků Azure je, že volbou různých jader můžete použít různé jazyky.

    Vytvoření poznámkového bloku

    Vytvoření poznámkového bloku

    Pokud vás zajímá, přípona názvu souboru .ipynb znamená "IPython notebook". Poznámkové bloky Jupyter byly původně označovány jako poznámkové bloky IPython (Interactive Python) a podporovaly pouze Python jako programovací jazyk. Název Jupyter je kombinací slov Julia, Python a R – základních programovacích jazyků, které Jupyter podporuje.

  8. Kliknutím na poznámkový blok ho otevřete pro úpravy.

    Otevření poznámkového bloku

    Otevření poznámkového bloku

Při práci s Azure Notebooks můžete vytvářet další projekty a poznámkové bloky. Poznámkové bloky můžete vytvářet úplně od začátku, nebo můžete nahrát existující poznámkové bloky.

Poznámkové bloky Jupyter jsou vysoce interaktivní. Mohou obsahovat spustitelný kód, a proto poskytují perfektní platformu pro práci s daty a vytváření prediktivních modelů na jejich základě.

  1. Do první buňky v poznámkovém bloku zadejte následující příkaz:

    !curl https://topics.blob.core.windows.net/public/FlightData.csv -o flightdata.csv
    

    Tip

    curl je příkaz Bash. Příkazy Bash můžete v poznámkových blocích Jupyter provést tak, že k nim jako předponu přidáte vykřičník. Tímto příkazem stáhnete soubor CSV ze služby Azure Blob Storage a uložíte ho pod názvem flightdata.csv.

  2. Kliknutím na tlačítko Run (Spustit) spustíte příkaz curl.

    Import datové sady

    Import datové sady

  3. Do druhé buňky v poznámkovém bloku zadejte následující kód Pythonu, aby se načetl soubor flightdata.csv, vytvořil se z něj datový rámec Pandas a zobrazilo se prvních pět řádků.

    import pandas as pd
    
    df = pd.read_csv('flightdata.csv')
    df.head()
    
  4. Spusťte kód kliknutím na tlačítko Run. Zkontrolujte, že jste získali výstup podobný tomu na obrázku níže.

    Načítá se datová sada.

    Načtení datové sady

    Datový rámec, který jste vytvořili, obsahuje informace o včasných příletech u významné americké letecké společnosti. Má více než 11 000 řádků a 26 sloupců. (Výstup říká "5 řádků", protože hlavní funkce datového rámce vrátí pouze prvních pět řádků.) Každý řádek představuje jeden let a obsahuje informace, jako je původ, cíl, naplánovaný čas odletu a informace o tom, jestli let přistál včas nebo pozdě. Později v tomto modulu se na data podíváme podrobněji.

  5. K uložení poznámkového bloku použijte příkaz File ->Save a Checkpoint.

Pomocí vodorovného posuvníku se můžete posouvat doleva a doprava a zobrazit si tak všechny sloupce v datové sadě. Kolik sloupců datová sada obsahuje? Dokážete z názvů sloupců odhadnout, co který sloupec představuje?