Začínáme s Azure Data Lake Analytics s využitím rozhraní Azure CLI
Důležité
Nové účty Azure Data Lake Analytics už není možné vytvářet, pokud vaše předplatné není povolené. Pokud potřebujete povolit předplatné, kontaktujte podporu a poskytněte svůj obchodní scénář.
Pokud už používáte Azure Data Lake Analytics, budete muset do 29. února 2024 vytvořit plán migrace pro Azure Synapse Analytics pro vaši organizaci.
Tento článek popisuje, jak pomocí rozhraní příkazového řádku Azure CLI vytvářet účty Azure Data Lake Analytics, odesílat úlohy USQL a katalogy. Tato úloha načte soubor hodnot oddělených tabulátory (TSV) a převede ho na soubor hodnot oddělených čárkami (CSV).
Požadavky
Než začnete, budete potřebovat tyto položky:
- Předplatné Azure. Viz Získání bezplatné zkušební verze Azure.
- Tento článek vyžaduje, abyste spustili Azure CLI verze 2.0 nebo novější. Pokud potřebujete instalaci nebo upgrade, přečtěte si téma Instalace Azure CLI.
Přihlášení k Azure
Přihlášení k předplatnému Azure:
az login
Budete požádáni o přechod na adresu URL a zadání ověřovacího kódu. Pak postupujte podle pokynů k zadání přihlašovacích údajů.
Po přihlášení zobrazí příkaz login seznam vašich předplatných.
Použití konkrétního předplatného:
az account set --subscription <subscription id>
Vytvoření účtu Data Lake Analytics
Je nutné, abyste před spuštěním jakékoli úlohy měli účet Data Lake Analytics. Pokud chcete vytvořit účet Data Lake Analytics, je nutné zadat následující položky:
- Skupina prostředků Azure. Účet Data Lake Analytics se musí vytvořit v rámci Skupiny prostředků Azure. Azure Resource Manager umožňuje pracovat s prostředky ve vaší aplikaci jako se skupinou. Všechny prostředky pro aplikaci můžete nasadit, aktualizovat nebo odstranit v rámci jediné koordinované operace.
Výpis seznamu stávajících skupin prostředků v rámci vašeho předplatného:
az group list
Pokud chcete vytvořit novou skupinu prostředků:
az group create --name "<Resource Group Name>" --location "<Azure Location>"
- Data Lake Analytics název účtu. Každý účtu Data Lake Analytics má název.
- Umístění: Použijte jedno z datových center Azure, které podporuje Data Lake Analytics.
- Výchozí účet Data Lake Store: Každý účet Data Lake Analytics má výchozí účet Data Lake Store.
Zobrazení seznamu stávajícího účtu Data Lake Store:
az dls account list
Vytvoření nového účtu Data Lake Store:
az dls account create --account "<Data Lake Store Account Name>" --resource-group "<Resource Group Name>"
Pokud chcete vytvořit účet Data Lake Analytics, použijte následující syntaxi:
az dla account create --account "<Data Lake Analytics Account Name>" --resource-group "<Resource Group Name>" --location "<Azure location>" --default-data-lake-store "<Default Data Lake Store Account Name>"
Po vytvoření účtu můžete použít následující příkazy k vypsání seznamu účtů a zobrazení podrobností o účtu:
az dla account list
az dla account show --account "<Data Lake Analytics Account Name>"
Nahrání dat do Data Lake Store
V tomto kurzu zpracujete několik protokolů hledání. Protokol hledání se dá uložit buď do úložiště Data Lake Store, nebo do úložiště objektů Azure Blob.
Azure Portal poskytuje uživatelské rozhraní pro kopírování některých ukázkových datových souborů (včetně souboru protokolu hledání) do výchozího účtu Data Lake Store. Pokud chcete nahrát data do výchozího účtu Data Lake Store, informace najdete v části Příprava zdrojových dat.
K nahrání souborů pomocí Azure CLI použijte následující příkazy:
az dls fs upload --account "<Data Lake Store Account Name>" --source-path "<Source File Path>" --destination-path "<Destination File Path>"
az dls fs list --account "<Data Lake Store Account Name>" --path "<Path>"
Data Lake Analytics má také přístup k úložišti objektů Azure Blob. Pokud chcete nahrát data do úložiště objektů Azure Blob, informace najdete v tématu Použití rozhraní příkazového řádku Azure s Azure Storage.
Odesílání úloh Data Lake Analytics
Úlohy Data Lake Analytics se píšou v jazyce U-SQL. Další informace o U-SQL najdete v tématu Začínáme s jazykem U-SQL a Referenční informace pro jazyk U-SQL.
Postup vytvoření skriptu úlohy Data Lake Analytics
Vytvořte textový soubor s následujícím skriptem U-SQL a uložte ho do pracovní stanice:
@a =
SELECT * FROM
(VALUES
("Contoso", 1500.0),
("Woodgrove", 2700.0)
) AS
D( customer, amount );
OUTPUT @a
TO "/data.csv"
USING Outputters.Csv();
Tento skript U-SQL přečte zdrojový datový soubor pomocí Extractors.Tsv() a potom pomocí Outputters.Csv() vytvoří soubor .csv.
Pokud zdrojový soubor nekopírujete do jiného umístění, tyto dvě cesty neupravujte. Data Lake Analytics vytvoří výstupní složku, pokud neexistuje.
Pro soubory uložené ve výchozích účtech Data Lake Store je jednodušší používat relativní cesty. Můžete také použít absolutní cesty. Příklad:
adl://<Data LakeStorageAccountName>.azuredatalakestore.net:443/Samples/Data/SearchLog.tsv
Pro přístup k souborům v propojených účtech Storage je nutné použít absolutní cesty. V případě souborů uložených v propojeném účtu Azure Storage je syntaxe následující:
wasb://<BlobContainerName>@<StorageAccountName>.blob.core.windows.net/Samples/Data/SearchLog.tsv
Poznámka
Kontejner Azure Blob s veřejnými objekty blob není podporován. Kontejner Azure Blob s veřejnými kontejnery není podporován.
Odesílání úloh
Při odeslání úlohy použijte následující syntaxi.
az dla job submit --account "<Data Lake Analytics Account Name>" --job-name "<Job Name>" --script "<Script Path and Name>"
Příklad:
az dla job submit --account "myadlaaccount" --job-name "myadlajob" --script @"C:\DLA\myscript.txt"
Seznam úloh a zobrazení podrobností o úloze
az dla job list --account "<Data Lake Analytics Account Name>"
az dla job show --account "<Data Lake Analytics Account Name>" --job-identity "<Job Id>"
Zrušení úloh
az dla job cancel --account "<Data Lake Analytics Account Name>" --job-identity "<Job Id>"
Načtení výsledků úlohy
Po dokončení úlohy můžete pomocí následujících příkazů zobrazit výpis výstupních souborů a soubory stáhnout:
az dls fs list --account "<Data Lake Store Account Name>" --source-path "/Output" --destination-path "<Destination>"
az dls fs preview --account "<Data Lake Store Account Name>" --path "/Output/SearchLog-from-Data-Lake.csv"
az dls fs preview --account "<Data Lake Store Account Name>" --path "/Output/SearchLog-from-Data-Lake.csv" --length 128 --offset 0
az dls fs download --account "<Data Lake Store Account Name>" --source-path "/Output/SearchLog-from-Data-Lake.csv" --destination-path "<Destination Path and File Name>"
Příklad:
az dls fs download --account "myadlsaccount" --source-path "/Output/SearchLog-from-Data-Lake.csv" --destination-path "C:\DLA\myfile.csv"
Další kroky
- Referenční dokument Data Lake Analytics Azure CLI najdete v tématu Data Lake Analytics.
- Referenční dokument k Azure CLI pro Data Lake Store najdete v tématu Data Lake Store.
- Pokud chcete zobrazit komplexnější dotaz, přejděte k tématu Analýza webových protokolů pomocí Azure Data Lake Analytics.