Sdílet prostřednictvím


AksWebservice Třída

Představuje model strojového učení nasazený jako koncový bod webové služby na Azure Kubernetes Service.

Nasazená služba se vytvoří z modelu, skriptu a přidružených souborů. Výsledná webová služba je koncový bod HTTP s vyrovnáváním zatížení s rozhraním REST API. Do tohoto rozhraní API můžete odesílat data a přijímat předpovědi vrácené modelem.

AksWebservice nasadí jednu službu do jednoho koncového bodu. Pokud chcete nasadit více služeb do jednoho koncového bodu, použijte třídu .AksEndpoint

Další informace najdete v tématu Nasazení modelu do clusteru Azure Kubernetes Service.

Inicializujte instanci webové služby.

Konstruktor Webservice načte cloudovou reprezentaci objektu webové služby přidruženého k poskytnutému pracovnímu prostoru. Vrátí instanci podřízené třídy odpovídající konkrétnímu typu načteného objektu Webservice.

Dědičnost
AksWebservice

Konstruktor

AksWebservice(workspace, name)

Parametry

Name Description
workspace
Vyžadováno

Objekt pracovního prostoru obsahující objekt webové služby, který se má načíst.

name
Vyžadováno
str

Název objektu webové služby, který se má načíst.

Poznámky

Doporučeným vzorem nasazení je vytvoření objektu konfigurace nasazení pomocí deploy_configuration metody a jeho následné použití s deploy metodou Model třídy, jak je znázorněno níže.


   # Set the web service configuration (using default here)
   aks_config = AksWebservice.deploy_configuration()

   # # Enable token auth and disable (key) auth on the webservice
   # aks_config = AksWebservice.deploy_configuration(token_auth_enabled=True, auth_enabled=False)

Úplná ukázka je k dispozici na webu https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/deployment/production-deploy-to-aks/production-deploy-to-aks.ipynb

Existuje několik způsobů, jak nasadit model jako webovou službu, včetně:

  • deploy Model pro modely již zaregistrované v pracovním prostoru.

  • deploy_from_image metoda metody Webservice.

  • deploy_from_model Webservice pro modely již zaregistrované v pracovním prostoru. Tato metoda vytvoří image.

  • deploy Webservicemetoda , která zaregistruje model a vytvoří image.

Informace o práci s webovými službami najdete v tématu

Část Variables (Proměnné) obsahuje seznam atributů místní reprezentace cloudového objektu AksWebservice. Tyto proměnné by se měly považovat za jen pro čtení. Změna jejich hodnot se neprojeví v odpovídajícím cloudovém objektu.

Proměnné

Name Description
enable_app_insights

Určuje, jestli je pro webovou službu povolené protokolování AppInsights.

autoscaler

Objekt automatického škálování pro webovou službu.

compute_name
str

Název computeTarget, do kterého je webová služba nasazená.

container_resource_requirements

Požadavky na prostředky kontejneru pro webovou službu.

liveness_probe_requirements

Požadavky sondy živosti pro webovou službu

data_collection

Objekt DataCollection pro webovou službu.

max_concurrent_requests_per_container
int

Maximální počet souběžných požadavků na kontejner pro webovou službu.

max_request_wait_time
int

Maximální doba čekání požadavku pro webovou službu v milisekundách

num_replicas
int

Počet replik pro webovou službu. Každá replika odpovídá podu AKS.

scoring_timeout_ms
int

Časový limit skóre pro webovou službu v milisekundách

azureml.core.webservice.AksWebservice.scoring_uri
str

Bodovací koncový bod pro webovou službu

is_default

Pokud je výchozí verzí nadřazeného bodu AksEndpoint webová služba.

traffic_percentile
int

Jaké procento provozu se má směrovat do webové služby v nadřazené sadě AksEndpoint.

version_type

Typ verze webové služby v nadřazené sadě AksEndpoint.

token_auth_enabled

Určuje, jestli je pro webovou službu povolené ověřování tokenů.

environment

Objekt Prostředí, který byl použit k vytvoření webové služby.

azureml.core.webservice.AksWebservice.models

Seznam modelů nasazených do webové služby

deployment_status
str

Stav nasazení webové služby.

namespace
str

Obor názvů AKS webové služby.

azureml.core.webservice.AksWebservice.swagger_uri
str

Koncový bod swaggeru pro webovou službu.

Metody

add_properties

Přidejte páry klíčových hodnot do slovníku vlastností této webové služby.

add_tags

Přidejte páry hodnot klíčů do slovníku značek této webové služby.

Vyvolá .WebserviceException

deploy_configuration

Vytvořte objekt konfigurace pro nasazení do cílového výpočetního objektu AKS.

get_access_token

Načte ověřovací token pro tuto webovou službu.

get_token

ZASTARALÉ. Místo toho použijte get_access_token metodu .

Načte ověřovací token pro tuto webovou službu.

remove_tags

Odeberte zadané klíče ze slovníku značek této webové služby.

run

Zavolejte tuto webovou službu se zadaným vstupem.

serialize

Převeďte tuto webovou službu na serializovaný slovník JSON.

update

Aktualizujte webovou službu pomocí zadaných vlastností.

Hodnoty ponechané jako None zůstanou v této webové službě nezměněné.

add_properties

Přidejte páry klíčových hodnot do slovníku vlastností této webové služby.

add_properties(properties)

Parametry

Name Description
properties
Vyžadováno

Slovník vlastností, které chcete přidat.

add_tags

Přidejte páry hodnot klíčů do slovníku značek této webové služby.

Vyvolá .WebserviceException

add_tags(tags)

Parametry

Name Description
tags
Vyžadováno

Slovník značek, které chcete přidat.

Výjimky

Typ Description

deploy_configuration

Vytvořte objekt konfigurace pro nasazení do cílového výpočetního objektu AKS.

static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None, blobfuse_enabled=None)

Parametry

Name Description
autoscale_enabled

Zda se má povolit automatické škálování pro tuto webovou službu. Výchozí hodnota je True, pokud num_replicas je None.)

Default value: None
autoscale_min_replicas
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 1.

Default value: None
autoscale_max_replicas
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby. Výchozí hodnota je 10.

Default value: None
autoscale_refresh_seconds
int

Jak často se má automatické škálování pokoušet škálovat tuto webovou službu. Výchozí hodnota je 1.

Default value: None
autoscale_target_utilization
int

Cílové využití (v procentech ze 100) by se automatické škálování mělo pokusit zachovat pro tuto webovou službu. Výchozí hodnota je 70.

Default value: None
collect_model_data

Zda se má povolit shromažďování dat modelu pro tuto webovou službu. Výchozí hodnota je False.

Default value: None
auth_enabled

Zda se má povolit ověřování klíčů pro tuto webovou službu. Výchozí hodnota je Pravda.

Default value: None
cpu_cores

Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinná čárka. Výchozí hodnota je 0.1. Odpovídá požadavku jádra podu, nikoli limitu, ve Azure Kubernetes Service.

Default value: None
memory_gb

Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka. Výchozí hodnota je 0,5. Odpovídá požadavku na paměť podu, nikoli limitu, v Azure Kubernetes Service.

Default value: None
enable_app_insights

Jestli chcete povolit protokolování Application Insights pro tuto webovou službu. Výchozí hodnota je False.

Default value: None
scoring_timeout_ms
int

Časový limit, který se má vynutit pro vyhodnocování volání této webové služby. Výchozí hodnota je 60000.

Default value: None
replica_max_concurrent_requests
int

Maximální počet souběžných požadavků na repliku, které jsou pro tuto webovou službu povolené. Výchozí hodnota je 1. Toto nastavení neměňte z výchozí hodnoty 1, pokud vám to nepovolí technická podpora Microsoftu nebo člen týmu Služby Azure Machine Learning.

Default value: None
max_request_wait_time
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách) před vrácením chyby 503. Výchozí hodnota je 500.

Default value: None
num_replicas
int

Počet kontejnerů, které se mají přidělit pro tuto webovou službu. Není výchozí. Pokud tento parametr není nastavený, je automatické škálování ve výchozím nastavení povolené.

Default value: None
primary_key
str

Primární ověřovací klíč, který se má použít pro tuto webovou službu.

Default value: None
secondary_key
str

Sekundární ověřovací klíč, který se má použít pro tuto webovou službu.

Default value: None
tags

Slovník značek klíčových hodnot pro tuto webovou službu.

Default value: None
properties

Slovník vlastností klíčové hodnoty pro tuto webovou službu. Tyto vlastnosti nelze po nasazení změnit, je však možné přidat nové páry hodnot klíčů.

Default value: None
description
str

Popis pro tuto webovou službu.

Default value: None
gpu_cores
int

Počet jader GPU, která se mají přidělit pro tuto webovou službu. Výchozí hodnota je 0.

Default value: None
period_seconds
int

Jak často (v sekundách) se má sonda aktivity provádět. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

Default value: None
initial_delay_seconds
int

Počet sekund po spuštění kontejneru, než se zahájí sondy aktivity. Výchozí hodnota je 310.

Default value: None
timeout_seconds
int

Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity. Výchozí hodnota je 2 sekundy. Minimální hodnota je 1.

Default value: None
success_threshold
int

Minimální po sobě jdoucí úspěch sondy živosti, která se má po neúspěchu považovat za úspěšnou. Výchozí hodnota je 1. Minimální hodnota je 1.

Default value: None
failure_threshold
int

Když se pod spustí a sonda živosti selže, Kubernetes se pokusí o selháníThreshold times, než to vzdát. Výchozí hodnota je 3. Minimální hodnota je 1.

Default value: None
namespace
str

Obor názvů Kubernetes, ve kterém se má tato webová služba nasadit: až 63 alfanumerických znaků s malými písmeny (a-z, 0-9) a spojovníku (-). První a poslední znak nesmí být pomlčky.

Default value: None
token_auth_enabled

Zda se má povolit ověřování tokenů pro tuto webovou službu. Pokud je tato možnost povolená, můžou uživatelé přistupovat k této webové službě načtením přístupového tokenu pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False.

Default value: None
compute_target_name
str

Název cílového výpočetního objektu pro nasazení

Default value: None
cpu_cores_limit

Maximální počet jader procesoru, které může tato webová služba používat. Může být desetinná čárka.

Default value: None
memory_gb_limit

Maximální velikost paměti (v GB), kterou může tato webová služba používat. Může být desetinná čárka.

Default value: None
blobfuse_enabled

Jestli chcete povolit blobfuse pro stahování modelů pro tuto webovou službu. Výchozí hodnota je True.

Default value: None

Návraty

Typ Description

Objekt konfigurace, který se má použít při nasazení služby AksWebservice.

Výjimky

Typ Description

get_access_token

Načte ověřovací token pro tuto webovou službu.

get_access_token()

Návraty

Typ Description

Objekt popisující ověřovací token pro tuto webovou službu.

Výjimky

Typ Description

get_token

ZASTARALÉ. Místo toho použijte get_access_token metodu .

Načte ověřovací token pro tuto webovou službu.

get_token()

Návraty

Typ Description

Ověřovací token pro tuto webovou službu a kdy ji aktualizovat.

Výjimky

Typ Description

remove_tags

Odeberte zadané klíče ze slovníku značek této webové služby.

remove_tags(tags)

Parametry

Name Description
tags
Vyžadováno

Seznam klíčů, které se mají odebrat

run

Zavolejte tuto webovou službu se zadaným vstupem.

run(input_data)

Parametry

Name Description
input_data
Vyžadováno
<xref:varies>

Vstup pro volání webové služby

Návraty

Typ Description

Výsledek volání webové služby

Výjimky

Typ Description

serialize

Převeďte tuto webovou službu na serializovaný slovník JSON.

serialize()

Návraty

Typ Description

Reprezentace JSON této webové služby.

update

Aktualizujte webovou službu pomocí zadaných vlastností.

Hodnoty ponechané jako None zůstanou v této webové službě nezměněné.

update(image=None, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, cpu_cores_limit=None, memory_gb_limit=None, **kwargs)

Parametry

Name Description
image

Nová image pro nasazení do webové služby

Default value: None
autoscale_enabled

Povolit nebo zakázat automatické škálování této webové služby

Default value: None
autoscale_min_replicas
int

Minimální počet kontejnerů, které se mají použít při automatickém škálování této webové služby

Default value: None
autoscale_max_replicas
int

Maximální počet kontejnerů, které se mají použít při automatickém škálování této webové služby

Default value: None
autoscale_refresh_seconds
int

Jak často se má automatické škálování pokoušet o škálování této webové služby

Default value: None
autoscale_target_utilization
int

Cílové využití (v procentech ze 100), které by se automatické škálování mělo pokusit zachovat pro tuto webovou službu

Default value: None
collect_model_data

Povolit nebo zakázat shromažďování dat modelu pro tuto webovou službu

Default value: None
auth_enabled

Zda povolit ověřování pro tuto webovou službu

Default value: None
cpu_cores

Počet jader procesoru, která se mají přidělit pro tuto webovou službu. Může to být desetinná čárka.

Default value: None
memory_gb

Velikost paměti (v GB), která se má přidělit této webové službě. Může to být desetinná čárka.

Default value: None
enable_app_insights

Jestli se má povolit protokolování Application Insights pro tuto webovou službu

Default value: None
scoring_timeout_ms
int

Vypršení časového limitu pro vynucení bodování volání této webové služby

Default value: None
replica_max_concurrent_requests
int

Maximální počet souběžných požadavků na repliku, které mají být pro tuto webovou službu povoleny.

Default value: None
max_request_wait_time
int

Maximální doba, po kterou požadavek zůstane ve frontě (v milisekundách), než se vrátí chyba 503

Default value: None
num_replicas
int

Počet kontejnerů, které mají být přiděleny pro tuto webovou službu

Default value: None
tags

Slovník značek klíčových hodnot pro tuto webovou službu. Nahradí existující značky.

Default value: None
properties

Slovník vlastností hodnoty klíče, které se mají přidat do existujícího slovníku vlastností

Default value: None
description
str

Popis pro tuto webovou službu

Default value: None
models

Seznam objektů modelu, které se mají zabalit s aktualizovanou službou

Default value: None
inference_config

InferenceConfig Objekt slouží k poskytnutí požadovaných vlastností nasazení modelu.

Default value: None
gpu_cores
int

Počet jader GPU, která se mají přidělit pro tuto webovou službu

Default value: None
period_seconds
int

Jak často (v sekundách) se má provádět sonda aktivity. Výchozí hodnota je 10 sekund. Minimální hodnota je 1.

Default value: None
initial_delay_seconds
int

Počet sekund po spuštění kontejneru, než se spustí sondy aktivity.

Default value: None
timeout_seconds
int

Počet sekund, po jejichž uplynutí vyprší časový limit sondy aktivity Výchozí hodnota je 1 sekunda. Minimální hodnota je 1.

Default value: None
success_threshold
int

Minimální počet po sobě jdoucích úspěchů sondy aktivity, které se mají po neúspěchu považovat za úspěšné. Výchozí hodnota je 1. Minimální hodnota je 1.

Default value: None
failure_threshold
int

Když se pod spustí a sonda aktivity selže, Kubernetes se pokusí o selháníThreshold Times předtím, než to vzdá. Výchozí hodnota je 3. Minimální hodnota je 1.

Default value: None
namespace
str

Obor názvů Kubernetes, do kterého se má tato webová služba nasadit: až 63 znaků malých alfanumerických znaků (a-z, 0-9) a spojovníku (-). První a poslední znaky nesmí být pomlčky.

Default value: None
token_auth_enabled

Určuje, jestli se má povolit ověřování tokenů pro tuto webovou službu. Pokud je tato možnost povolená, můžou uživatelé přistupovat k této webové službě načtením přístupových tokenů pomocí svých přihlašovacích údajů Azure Active Directory. Výchozí hodnota je False.

Default value: None
cpu_cores_limit

Maximální počet jader procesoru, které může tato webová služba používat. Může být desetinná čárka.

Default value: None
memory_gb_limit

Maximální velikost paměti (v GB), kterou může tato webová služba používat. Může být desetinná čárka.

Default value: None
kwargs
Vyžadováno
<xref:varies>

zahrnují parametry pro podporu migrace webové služby AKS do online koncového bodu Kubernetes a nasazení. is_migration=Pravda| False, compute_target=.

Výjimky

Typ Description