OutputTabularDatasetConfig Třída
Představuje, jak zkopírovat výstup spuštění a být povýšen jako tabulkovádataset.
Inicializace OutputTabularDatasetConfig.
- Dědičnost
-
OutputTabularDatasetConfig
Konstruktor
OutputTabularDatasetConfig(**kwargs)
Poznámky
Tento konstruktor byste neměli volat přímo, ale místo toho byste měli vytvořit OutputFileDatasetConfig a poté volat odpovídající metody read_* převést na OutputTabularDatasetConfig.
Způsob, jakým bude výstup zkopírován do cíle pro OutputTabularDatasetConfig je stejný jako OutputFileDatasetConfig. Rozdíl mezi nimi spočívá v tom, že vytvořená datová sada bude tabulkovádataset obsahující všechny zadané transformace.
Metody
as_input |
V dalších krocích kanálu určete, jak se má výstup využívat jako vstup. |
as_mount |
Nastavte režim výstupu na připojení. Pro režim připojení bude výstupním adresářem připojený adresář FUSE. Soubory zapsané do připojeného adresáře se nahrají při zavření souboru. |
as_upload |
Nastavte režim výstupu, který se má nahrát. V režimu nahrávání se soubory zapsané do výstupního adresáře nahrají na konci úlohy. Pokud úloha selže nebo se zruší, výstupní adresář se nenahraje. |
drop_columns |
Vypusťte zadané sloupce z datové sady. |
keep_columns |
Ponechte zadané sloupce a vyhodí všechny ostatní z datové sady. |
random_split |
Rozdělte záznamy v datové sadě na dvě části náhodně a přibližně podle zadaného procenta. Výsledné výstupní konfigurace budou mít změněné názvy, první z nich bude mít k názvu _1 a druhá bude mít k názvu _2. Pokud to způsobí kolizi názvu nebo pokud chcete zadat vlastní název, nastavte jejich názvy ručně. |
as_input
V dalších krocích kanálu určete, jak se má výstup využívat jako vstup.
as_input(name=None)
Parametry
Name | Description |
---|---|
name
Vyžadováno
|
Název vstupu specifického pro spuštění. |
Návraty
Typ | Description |
---|---|
Instance DatasetConsumptionConfig popisující způsob doručení vstupních dat |
as_mount
Nastavte režim výstupu na připojení.
Pro režim připojení bude výstupním adresářem připojený adresář FUSE. Soubory zapsané do připojeného adresáře se nahrají při zavření souboru.
as_mount()
Návraty
Typ | Description |
---|---|
Instance OutputTabularDatasetConfig s režimem nastaveným na připojení. |
as_upload
Nastavte režim výstupu, který se má nahrát.
V režimu nahrávání se soubory zapsané do výstupního adresáře nahrají na konci úlohy. Pokud úloha selže nebo se zruší, výstupní adresář se nenahraje.
as_upload(overwrite=False, source_globs=None)
Parametry
Name | Description |
---|---|
overwrite
Vyžadováno
|
Zda se mají přepsat soubory, které již v cíli existují. |
source_globs
Vyžadováno
|
Vzory globů používané k filtrování souborů, které se budou nahrávat. |
Návraty
Typ | Description |
---|---|
Instance OutputTabularDatasetConfig s režimem nastaveným na nahrání |
drop_columns
Vypusťte zadané sloupce z datové sady.
drop_columns(columns)
Parametry
Name | Description |
---|---|
columns
Vyžadováno
|
Název nebo seznam názvů sloupců, které se mají odstranit. |
Návraty
Typ | Description |
---|---|
Instance OutputTabularDatasetConfig , se kterou mají být sloupce zahoděné. |
keep_columns
Ponechte zadané sloupce a vyhodí všechny ostatní z datové sady.
keep_columns(columns)
Parametry
Name | Description |
---|---|
columns
Vyžadováno
|
Název nebo seznam názvů sloupců, které se mají zachovat. |
Návraty
Typ | Description |
---|---|
Instance OutputTabularDatasetConfig , se kterou se mají zachovat sloupce. |
random_split
Rozdělte záznamy v datové sadě na dvě části náhodně a přibližně podle zadaného procenta.
Výsledné výstupní konfigurace budou mít změněné názvy, první z nich bude mít k názvu _1 a druhá bude mít k názvu _2. Pokud to způsobí kolizi názvu nebo pokud chcete zadat vlastní název, nastavte jejich názvy ručně.
random_split(percentage, seed=None)
Parametry
Name | Description |
---|---|
percentage
Vyžadováno
|
Přibližné procento, podle které chcete datovou sadu rozdělit. Musí to být číslo od 0,0 do 1,0. |
seed
Vyžadováno
|
Volitelné počáteční pole, které se má použít pro náhodný generátor. |
Návraty
Typ | Description |
---|---|
Vrátí kolekci členů dvou outputTabularDatasetConfig objektů představujících dvě datové sady po rozdělení. |