AbstractDataset Klasa
Podstawowa klasa zestawów danych w usłudze Azure Machine Learning.
Odwołaj się do TabularDatasetFactory klasy i FileDatasetFactory klasy, aby utworzyć wystąpienia zestawu danych.
Konstruktor Class AbstractDataset.
Ten konstruktor nie powinien być wywoływany bezpośrednio. Zestaw danych ma zostać utworzony przy użyciu TabularDatasetFactory klasy i FileDatasetFactory klasy.
- Dziedziczenie
-
builtins.objectAbstractDataset
Konstruktor
AbstractDataset()
Metody
add_tags |
Dodaj pary wartości klucza do słownika tagów tego zestawu danych. |
as_named_input |
Podaj nazwę tego zestawu danych, który będzie używany do pobierania zmaterializowanego zestawu danych w przebiegu. |
get_all |
Pobierz wszystkie zarejestrowane zestawy danych w obszarze roboczym. |
get_by_id |
Pobierz zestaw danych zapisany w obszarze roboczym. |
get_by_name |
Pobierz zarejestrowany zestaw danych z obszaru roboczego według jego nazwy rejestracji. |
get_partition_key_values |
Zwraca unikatowe wartości klucza partition_keys. Sprawdź, czy partition_keys jest prawidłowym podzbiorem pełnego zestawu kluczy partycji, zwróć unikatowe wartości klucza partition_keys, domyślnie, aby zwrócić unikatowe kombinacje klawiszy, wykonując pełny zestaw kluczy partycji tego zestawu danych, jeśli partition_keys jest None
|
register |
Zarejestruj zestaw danych w podanym obszarze roboczym. |
remove_tags |
Usuń określone klucze ze słownika tagów tego zestawu danych. |
unregister_all_versions |
Wyrejestruj wszystkie wersje pod nazwą rejestracji tego zestawu danych z obszaru roboczego. |
update |
Wykonaj aktualizację w miejscu zestawu danych. |
add_tags
Dodaj pary wartości klucza do słownika tagów tego zestawu danych.
add_tags(tags=None)
Parametry
Nazwa | Opis |
---|---|
tags
Wymagane
|
Słownik tagów do dodania. |
Zwraca
Typ | Opis |
---|---|
Zaktualizowany obiekt zestawu danych. |
as_named_input
Podaj nazwę tego zestawu danych, który będzie używany do pobierania zmaterializowanego zestawu danych w przebiegu.
as_named_input(name)
Parametry
Nazwa | Opis |
---|---|
name
Wymagane
|
Nazwa zestawu danych dla przebiegu. |
Zwraca
Typ | Opis |
---|---|
Obiekt konfiguracji opisujący sposób materializacji zestawu danych w przebiegu. |
Uwagi
Nazwa w tym miejscu będzie dotyczyć tylko w ramach przebiegu usługi Azure Machine Learning. Nazwa musi zawierać tylko znaki alfanumeryczne i podkreślenia, aby można je było udostępnić jako zmienną środowiskową. Ta nazwa służy do pobierania zestawu danych w kontekście przebiegu przy użyciu dwóch metod:
Zmienna środowiskowa:
Nazwa będzie nazwą zmiennej środowiskowej, a zmaterializowany zestaw danych zostanie udostępniony jako wartość zmiennej środowiskowej. Jeśli zestaw danych zostanie pobrany lub zainstalowany, wartość będzie ścieżką pobraną/zainstalowaną. Na przykład:
# in your job submission notebook/script:
dataset.as_named_input('foo').as_download('/tmp/dataset')
# in the script that will be executed in the run
import os
path = os.environ['foo'] # path will be /tmp/dataset
Uwaga
Jeśli zestaw danych jest ustawiony na tryb bezpośredni, wartość będzie identyfikatorem zestawu danych. Następnie możesz
pobierz obiekt zestawu danych, wykonując Dataset.get_by_id(os.environ['foo'])
Run.input_datasets:
Jest to słownik, w którym kluczem będzie nazwa zestawu danych określona w tej metodzie, a wartość będzie zmaterializowanym zestawem danych. W przypadku pobranego i zainstalowanego zestawu danych wartość będzie ścieżką pobraną/zainstalowaną. W przypadku trybu bezpośredniego wartość będzie tym samym obiektem zestawu danych określonym w skryscie przesyłania zadania.
# in your job submission notebook/script:
dataset.as_named_input('foo') # direct mode
# in the script that will be executed in the run
run = Run.get_context()
run.input_datasets['foo'] # this returns the dataset object from above.
get_all
Pobierz wszystkie zarejestrowane zestawy danych w obszarze roboczym.
static get_all(workspace)
Parametry
Nazwa | Opis |
---|---|
workspace
Wymagane
|
Istniejący obszar roboczy usługi AzureML, w którym zarejestrowano zestawy danych. |
Zwraca
Typ | Opis |
---|---|
Słownik obiektów TabularDataset i FileDataset kluczy według ich nazwy rejestracji. |
get_by_id
Pobierz zestaw danych zapisany w obszarze roboczym.
static get_by_id(workspace, id, **kwargs)
Parametry
Nazwa | Opis |
---|---|
workspace
Wymagane
|
Istniejący obszar roboczy usługi AzureML, w którym jest zapisywany zestaw danych. |
id
Wymagane
|
Identyfikator zestawu danych. |
Zwraca
Typ | Opis |
---|---|
Obiekt zestawu danych. Jeśli zestaw danych jest zarejestrowany, zostanie również zwrócona jego nazwa rejestracji i wersja. |
get_by_name
Pobierz zarejestrowany zestaw danych z obszaru roboczego według jego nazwy rejestracji.
static get_by_name(workspace, name, version='latest', **kwargs)
Parametry
Nazwa | Opis |
---|---|
workspace
Wymagane
|
Istniejący obszar roboczy usługi AzureML, w którym zarejestrowano zestaw danych. |
name
Wymagane
|
Nazwa rejestracji. |
version
Wymagane
|
Wersja rejestracji. Wartość domyślna to "latest". |
Zwraca
Typ | Opis |
---|---|
Zarejestrowany obiekt zestawu danych. |
get_partition_key_values
Zwraca unikatowe wartości klucza partition_keys.
Sprawdź, czy partition_keys jest prawidłowym podzbiorem pełnego zestawu kluczy partycji, zwróć unikatowe wartości klucza partition_keys, domyślnie, aby zwrócić unikatowe kombinacje klawiszy, wykonując pełny zestaw kluczy partycji tego zestawu danych, jeśli partition_keys jest None
# get all partition key value pairs
partitions = ds.get_partition_key_values()
# Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]
partitions = ds.get_partition_key_values(['country'])
# Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)
Parametry
Nazwa | Opis |
---|---|
partition_keys
Wymagane
|
klucze partycji |
register
Zarejestruj zestaw danych w podanym obszarze roboczym.
register(workspace, name, description=None, tags=None, create_new_version=False)
Parametry
Nazwa | Opis |
---|---|
workspace
Wymagane
|
Obszar roboczy do zarejestrowania zestawu danych. |
name
Wymagane
|
Nazwa rejestrowania zestawu danych za pomocą polecenia . |
description
Wymagane
|
Tekstowy opis zestawu danych. Domyślnie wartość Brak. |
tags
Wymagane
|
Słownik tagów wartości klucza, aby nadać zestaw danych. Domyślnie wartość Brak. |
create_new_version
Wymagane
|
Wartość logiczna do zarejestrowania zestawu danych jako nowej wersji pod określoną nazwą. |
Zwraca
Typ | Opis |
---|---|
Zarejestrowany obiekt zestawu danych. |
remove_tags
Usuń określone klucze ze słownika tagów tego zestawu danych.
remove_tags(tags=None)
Parametry
Nazwa | Opis |
---|---|
tags
Wymagane
|
Lista kluczy do usunięcia. |
Zwraca
Typ | Opis |
---|---|
Zaktualizowany obiekt zestawu danych. |
unregister_all_versions
Wyrejestruj wszystkie wersje pod nazwą rejestracji tego zestawu danych z obszaru roboczego.
unregister_all_versions()
Uwagi
Operacja nie zmienia żadnych danych źródłowych.
update
Wykonaj aktualizację w miejscu zestawu danych.
update(description=None, tags=None)
Parametry
Nazwa | Opis |
---|---|
description
Wymagane
|
Nowy opis do użycia dla zestawu danych. Ten opis zastępuje istniejący opis. Domyślnie jest to istniejący opis. Aby wyczyścić opis, wprowadź pusty ciąg. |
tags
Wymagane
|
Słownik tagów do aktualizowania zestawu danych za pomocą polecenia . Te tagi zastępują istniejące tagi dla zestawu danych. Domyślnie do istniejących tagów. Aby wyczyścić tagi, wprowadź pusty słownik. |
Zwraca
Typ | Opis |
---|---|
Zaktualizowany obiekt zestawu danych. |
Atrybuty
data_changed_time
Zwróć czas zmiany danych źródłowych.
Zwraca
Typ | Opis |
---|---|
Czas, kiedy nastąpiła ostatnia zmiana danych źródłowych. |
Uwagi
Czas zmiany danych jest dostępny dla źródła danych opartego na plikach. Żaden nie zostanie zwrócony, gdy źródło danych nie jest obsługiwane do sprawdzania, kiedy nastąpiła zmiana.
description
id
Zwróć identyfikator zestawu danych.
Zwraca
Typ | Opis |
---|---|
Identyfikator zestawu danych. Jeśli zestaw danych nie zostanie zapisany w żadnym obszarze roboczym, identyfikator będzie mieć wartość Brak. |