Exportovat do Azure Blob Storage
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- přečtěte si informace o přesunu projektů strojového učení z ML Studio (classic) do Azure Machine Learning.
- přečtěte si další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
tento článek popisuje, jak použít možnost exportovat do Azure Blob Storage v modulu export dat v aplikaci Machine Learning Studio (classic).
Poznámka
platí pro: jenom Machine Learning Studio (classic)
podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.
Tato možnost je užitečná, když chcete exportovat data z experimentu strojového učení do Azure Blob Storage. Můžete například chtít sdílet výstupy dat Machine Learning s jinými aplikacemi nebo ukládat mezilehlé nebo vyčištěné datové sady pro použití v jiných experimentech.
K objektům blob Azure se dá dostat odkudkoli a použít buď HTTP, nebo HTTPS. vzhledem k tomu, že Azure Blob Storage je nestrukturované úložiště dat, můžete data exportovat v různých formátech. V současné době jsou podporovány formáty CSV, TSV a ARFF.
Pokud chcete exportovat data do Azure Blob pro použití jinými aplikacemi, použijte modul exportovat data a uložte data do Azure Blob Storage. pak použijte libovolný nástroj, který může číst data z Azure storage (například Excel, nástroje cloudového úložiště nebo jiné cloudové služby) a načíst a používat data.
Poznámka
Datové moduly importu dat a exportu mohou číst a zapisovat data pouze z úložiště Azure vytvořeného pomocí modelu nasazení Classic. jinými slovy, nový typ účtu Azure Blob Storage, který nabízí horkou a studenou úroveň přístupu, zatím není podporován.
Obecně platí, že žádné účty úložiště Azure, které jste mohli vytvořit předtím, než tato možnost služby nastaly, by neměly být ovlivněny.
pokud ale potřebujete vytvořit nový účet pro použití s Machine Learning, doporučujeme pro model nasazenívybrat možnost klasický , nebo pro typ účtu použít správce prostředků a jako druh účtuvybrat možnost obecný účel místo úložiště objektů Blob.
Jak exportovat data do Azure Blob Storage
Služba objektů BLOB v Azure slouží k ukládání velkých objemů dat, včetně binárních dat. Existují dva typy úložiště objektů BLOB: veřejné objekty BLOB a objekty blob, které vyžadují přihlašovací údaje.
Přidejte modul Export data do experimentu. Tento modul můžete najít v kategorii vstup a výstup dat v nástroji Studio (Classic).
Připojení exportovat data do modulu, který vytváří data, která chcete exportovat do Azure Blob Storage.
Otevřete podokno vlastnosti pro Export dat. v poli cíl pro data vyberte Azure Blob Storage.
Pokud víte, že úložiště podporuje přístup přes adresu URL SAS, vyberte v poli typ ověřovánímožnost veřejné (adresa URL SAS) .
Adresa URL SAS je speciální typ adresy URL, který se dá vygenerovat pomocí nástroje Azure Storage a který je dostupný jenom pro omezený čas. Obsahuje všechny informace, které jsou potřeba pro ověřování a stažení.
Do pole identifikátor URIzadejte nebo vložte úplný identifikátor URI, který definuje účet a veřejný objekt BLOB.
V případě privátních účtů vyberte možnost účeta zadejte název účtu a klíč účtu, aby experiment mohl zapisovat do účtu úložiště.
Název účtu: zadejte nebo vložte název účtu, na který chcete data uložit. Pokud je
https://myshared.blob.core.windows.net
například úplná adresa URL účtu úložiště, zadátemyshared
.Klíč účtu: vložte přístupový klíč k úložišti, který je přidružený k účtu.
Cesta k kontejneru, adresáři nebo objektu BLOB: zadejte název objektu blob, do kterého se budou ukládat exportovaná data. Pokud například chcete výsledky experimentu Uložit do nového objektu BLOB s názvem results01.csv v kontejneru předpovědi v účtu s názvem mymldata, bude úplná adresa URL pro objekt BLOB
https://mymldata.blob.core.windows.net/predictions/results01.csv
.Proto v cestě pole k kontejneru, adresáři nebo objektu BLOBurčíte kontejner a název objektu BLOB následujícím způsobem:
predictions/results01.csv
Pokud zadáte název objektu blob, který ještě neexistuje, vytvoří Azure objekt blob za vás.
když zapisujete do existujícího objektu blob, můžete určit, že aktuální obsah objektu blob bude přepsán nastavením vlastnosti Azure Blob Storage režimu zápisu. Ve výchozím nastavení je tato vlastnost nastavena na hodnotu Chyba, což znamená, že při každém nalezení existujícího souboru BLOB se stejným názvem dojde k chybě.
Jako Formát souboru objektu BLOBvyberte formát, ve kterém se mají ukládat data.
CSV: hodnot oddělených čárkami (CSV) je výchozí formát úložiště. Pokud chcete exportovat záhlaví sloupců spolu s daty, vyberte možnost Zapsat řádek záhlaví objektu BLOB. další informace o formátu odděleném čárkami, který se používá v Machine Learning, najdete v tématu převod do sdíleného svazku clusteru.
TSV: formát hodnot oddělených tabulátory (TSV) je kompatibilní s mnoha nástroji pro strojové učení. Pokud chcete exportovat záhlaví sloupců spolu s daty, vyberte možnost Zapsat řádek záhlaví objektu BLOB. další informace o formátu odděleném tabulátorem používaným v Machine Learning najdete v tématu převedení na TSV.
Arff: Tento formát podporuje ukládání souborů ve formátu používaném sadou nástrojů weka. Tento formát není podporovaný u souborů uložených v adrese URL SAS. Další informace o formátu ARFF najdete v tématu převod na arff.
Použít výsledky uložené v mezipaměti: tuto možnost vyberte, pokud chcete zabránit přepsání výsledků do souboru objektů BLOB při každém spuštění experimentu. Pokud v parametrech modulu nejsou žádné další změny, experiment zapíše výsledky pouze při prvním spuštění modulu nebo v případě, že dojde ke změně dat.
Příklady
Příklady použití modulu Export dat najdete v Azure AI Gallery:
Převést datovou sadu na formát VW: v tomto experimentu se k vytváření dat, která můžou používat pro dostupné, používá skript Pythonu spolu s modulem Export dat .
nastavení kanálů prediktivní analýzy pomocí Azure SQL Data Warehouse: tento scénář popisuje přesun dat mezi více komponentami, včetně Machine Learning a SQL Data Warehouse.
vyhodnocování dávky bez kódu: v tomto kurzu se dozvíte, jak můžete použít Azure Logic Apps k automatizaci importu dat používaných experimenty a zápisu výsledků experimentů do úložiště objektů blob.
zprovoznění řešení azure ML s místními SQL Server pomocí Azure data factory: tento článek popisuje složitější datový kanál, který odesílá data zpátky do místní databáze SQL Server pomocí blob storage jako dočasné fáze. Použití místní databáze vyžaduje konfiguraci brány dat, ale tuto část příkladu můžete přeskočit a jenom používat úložiště objektů BLOB.
Technické poznámky
Tato část obsahuje podrobné informace o implementaci, tipy a odpovědi na nejčastější dotazy.
Časté dotazy
Jak se můžu vyhnout psaní dat, pokud se experiment nezměnil
Když se výsledky experimentu změní, exportovat data vždy uloží novou datovou sadu. Pokud však používáte experiment opakovaně bez provedení změn ovlivňujících výstupní data, můžete vybrat možnost použít výsledky v mezipaměti .
Modul kontroluje, zda byl experiment spuštěn dříve pomocí stejných dat a stejné možnosti, a pokud je nalezen předchozí běh, operace zápisu se neopakuje.
Můžu ukládat data na účet v jiné geografické oblasti
Ano, můžete zapisovat data do účtů v různých oblastech. Pokud se ale účet úložiště nachází v jiné oblasti než výpočetní uzel, který se používá pro experimentování se strojovým učením, může být přístup k datům pomalejší. Účtují se taky poplatky za příchozí a odchozí přenos dat v předplatném.
Parametry modulu
Obecné možnosti
Name | Rozsah | Typ | Výchozí | Description |
---|---|---|---|---|
Zdroj dat | Seznam | Zdroj dat nebo jímka | Azure Blob Storage | cílem může být soubor ve službě azure BLOB storage, tabulka Azure, tabulka nebo zobrazení v Azure SQL Database nebo tabulka podregistru. |
Použití výsledků uložených v mezipaměti | TRUE NEBO FALSE | Logická hodnota | FALSE | Modul se spustí pouze v případě, že neexistuje platná mezipaměť. Jinak použijte data uložená v mezipaměti z předchozího spuštění. |
Zadejte prosím typ ověřování. | SAS/účet | AuthenticationType | Účet | Indikuje, jestli se mají pro autorizaci přístupu použít přihlašovací údaje SAS nebo účtu. |
Možnosti veřejného úložiště veřejné nebo SAS
Name | Rozsah | Typ | Výchozí | Description |
---|---|---|---|---|
Identifikátor URI SAS pro objekt BLOB | Libovolný | Řetězec | žádné | Identifikátor URI SAS objektu blob, na který se má zapisovat (povinné) |
Formát souboru pro soubor SAS | ARFF CSV TSV |
LoaderUtils... typu | CSV | Označuje, zda je soubor CSV, TSV nebo ARFF. požadovanou |
Zápis řádku záhlaví SAS | TRUE NEBO FALSE | Logická hodnota | FALSE | Indikuje, jestli se mají do souboru zapsat záhlaví sloupců. |
Účet – možnosti privátního úložiště
Name | Rozsah | Typ | Výchozí | Description |
---|---|---|---|---|
Název účtu Azure | Libovolný | Řetězec | žádné | Název uživatelského účtu Azure |
Klíč účtu Azure | Libovolný | SecureString | žádné | Klíč úložiště Azure |
Cesta k objektu blob, který začíná na kontejneru | Libovolný | Řetězec | žádné | Název souboru objektu BLOB začínající názvem kontejneru |
Azure Blob Storage režim zápisu | Seznam: Chyba, přepsání | výčet: BlobFileWriteMode | Chyba | Zvolit metodu zápisu souborů objektů BLOB |
Formát souboru objektu BLOB | ARFF CSV TSV |
LoaderUtils... typu | CSV | Označuje, zda je soubor BLOB CSV, TSV nebo ARFF. |
Zapsat řádek záhlaví objektu BLOB | TRUE NEBO FALSE | Logická hodnota | FALSE | Určuje, zda má soubor BLOB obsahovat řádek záhlaví. |
Výjimky
Výjimka | Description |
---|---|
Chyba 0027 | K výjimce dojde, pokud musí být dva objekty stejné velikosti, ale nejsou. |
Chyba 0003 | K výjimce dojde v případě, že jeden nebo více vstupů má hodnotu null nebo je prázdné. |
Chyba 0029 | K výjimce dojde, pokud je předán neplatný identifikátor URI. |
Chyba 0030 | v případě, že není možné stáhnout soubor, dojde k výjimce. |
Chyba 0,002 | K výjimce dojde v případě, že jeden nebo více parametrů nelze analyzovat nebo převést ze zadaného typu na typ vyžadovaný cílovou metodou. |
Chyba 0009 | Pokud je název účtu služby Azure Storage nebo název kontejneru nesprávně zadán, dojde k výjimce. |
Chyba 0048 | Pokud není možné otevřít soubor, dojde k výjimce. |
Chyba 0046 | K výjimce dojde, pokud není možné vytvořit adresář v zadané cestě. |
Chyba 0049 | Pokud není možné analyzovat soubor, dojde k výjimce. |
seznam chyb, které jsou specifické pro moduly studia (classic), najdete v článku kódy chyb Machine Learning.
seznam výjimek rozhraní API najdete v tématu Machine Learning REST API chybové kódy.
Viz také
Import dat
Exportovat data
Exportovat do Azure SQL Database
Dotaz export do podregistru
Exportovat do tabulky Azure