Dela via


OutputTabularDatasetConfig Klass

Representerar hur du kopierar utdata från en körning och höjs upp som en TabularDataset.

Initiera en OutputTabularDatasetConfig.

Arv
OutputTabularDatasetConfig

Konstruktor

OutputTabularDatasetConfig(**kwargs)

Kommentarer

Du bör inte anropa den här konstruktorn direkt, utan i stället skapa en OutputFileDatasetConfig och sedan anropa motsvarande read_*-metoder för att konvertera den till en OutputTabularDatasetConfig.

Hur utdata kopieras till målet för en OutputTabularDatasetConfig är samma som outputFileDatasetConfig. Skillnaden mellan dem är att datauppsättningen som skapas är en TabularDataset som innehåller alla angivna transformeringar.

Metoder

as_input

Ange hur utdata ska användas som indata i efterföljande pipelinesteg.

as_mount

Ange läget för utdata till montering.

För monteringsläge blir utdatakatalogen en FUSE-monterad katalog. Filer som skrivs till den monterade katalogen laddas upp när filen stängs.

as_upload

Ange läget för utdata som ska laddas upp.

För uppladdningsläge laddas filer som skrivs till utdatakatalogen upp i slutet av jobbet. Om jobbet misslyckas eller avbryts laddas inte utdatakatalogen upp.

drop_columns

Ta bort de angivna kolumnerna från datauppsättningen.

keep_columns

Behåll de angivna kolumnerna och ta bort alla andra från datauppsättningen.

random_split

Dela upp poster i datauppsättningen i två delar slumpmässigt och ungefär med den procentandel som anges.

De resulterande utdatakonfigurationerna får sina namn ändrade, den första har _1 tillagd i namnet och den andra har _2 tillagt i namnet. Om det orsakar en namnkonflikt eller om du vill ange ett anpassat namn anger du deras namn manuellt.

as_input

Ange hur utdata ska användas som indata i efterföljande pipelinesteg.

as_input(name=None)

Parametrar

Name Description
name
Obligatorisk
str

Namnet på de indata som är specifika för körningen.

Returer

Typ Description

En DatasetConsumptionConfig instans som beskriver hur du levererar indata.

as_mount

Ange läget för utdata till montering.

För monteringsläge blir utdatakatalogen en FUSE-monterad katalog. Filer som skrivs till den monterade katalogen laddas upp när filen stängs.

as_mount()

Returer

Typ Description

En OutputTabularDatasetConfig instans med läge inställt på montering.

as_upload

Ange läget för utdata som ska laddas upp.

För uppladdningsläge laddas filer som skrivs till utdatakatalogen upp i slutet av jobbet. Om jobbet misslyckas eller avbryts laddas inte utdatakatalogen upp.

as_upload(overwrite=False, source_globs=None)

Parametrar

Name Description
overwrite
Obligatorisk

Om du vill skriva över filer som redan finns i målet.

source_globs
Obligatorisk

Globmönster som används för att filtrera filer som ska laddas upp.

Returer

Typ Description

En OutputTabularDatasetConfig instans med läget inställt på uppladdning.

drop_columns

Ta bort de angivna kolumnerna från datauppsättningen.

drop_columns(columns)

Parametrar

Name Description
columns
Obligatorisk

Namnet eller en lista med namn som kolumnerna ska släppa.

Returer

Typ Description

En OutputTabularDatasetConfig instans som kolumner ska släppa med.

keep_columns

Behåll de angivna kolumnerna och ta bort alla andra från datauppsättningen.

keep_columns(columns)

Parametrar

Name Description
columns
Obligatorisk

Namnet eller en lista med namn som kolumnerna ska behålla.

Returer

Typ Description

En OutputTabularDatasetConfig instans som kolumner ska behållas med.

random_split

Dela upp poster i datauppsättningen i två delar slumpmässigt och ungefär med den procentandel som anges.

De resulterande utdatakonfigurationerna får sina namn ändrade, den första har _1 tillagd i namnet och den andra har _2 tillagt i namnet. Om det orsakar en namnkonflikt eller om du vill ange ett anpassat namn anger du deras namn manuellt.

random_split(percentage, seed=None)

Parametrar

Name Description
percentage
Obligatorisk

Den ungefärliga procentandelen som datauppsättningen ska delas med. Detta måste vara ett tal mellan 0,0 och 1,0.

seed
Obligatorisk
int

Valfritt startvärde som ska användas för slumpgeneratorn.

Returer

Typ Description

Returnerar en tupplar med två OutputTabularDatasetConfig-objekt som representerar de två datauppsättningarna efter delningen.