AksEndpoint 类
注意
这是一个试验性的类,随时可能更改。 有关详细信息,请参阅 https://aka.ms/azuremlexperimental。
表示在 Azure Kubernetes 服务上运行的同一终结点后面的 Web 服务版本的集合。
虽然 AksWebservice 使用一个评分终结点来部署一个服务,但 AksEndpoint 类可让你在同一评分终结点后面部署多个 Web 服务版本。 可以将每个 Web 服务版本配置为提供一定百分比的流量,以便以受控方式部署模型,例如用于 A/B 测试。 AksEndpoint 允许从类似于 AksWebservice 的模型对象进行部署。
初始化 Web 服务实例。
Webservice 构造函数检索与提供的工作区关联的 Webservice 对象的云表示形式。 它将返回与检索到的 Webservice 对象的特定类型对应的子类的实例。
- 继承
-
AksEndpoint
构造函数
AksEndpoint(workspace, name)
参数
名称 | 说明 |
---|---|
workspace
必需
|
包含要检索的 Webservice 对象的工作区对象。 |
name
必需
|
要检索的 Webservice 对象的名称。 |
变量
名称 | 说明 |
---|---|
versions
|
版本名称和版本对象对的字典。 包含部署为此终结点的一部分的所有版本。 |
方法
create_version |
使用提供的属性在终结点中添加新版本。 |
delete_version |
删除终结点中的版本。 |
deploy_configuration |
创建配置对象以部署到 AKS 计算目标。 |
serialize |
将此 Web 服务对象转换为 JSON 序列化字典。 |
update |
使用提供的属性更新终结点。 在此终结点中,保留为 None 的值将保持不变 |
update_version |
使用提供的属性更新终结点中的现有版本。 在此版本中,保留为 None 的值将保持不变。 |
create_version
使用提供的属性在终结点中添加新版本。
create_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
参数
名称 | 说明 |
---|---|
version_name
必需
|
要在终结点中添加的版本的名称。 |
autoscale_enabled
|
是否在终结点中为此版本启用自动缩放。
如果 默认值: None
|
autoscale_min_replicas
|
在终结点中自动缩放此版本时使用的最小容器数。 默认值为 1 默认值: None
|
autoscale_max_replicas
|
在终结点中自动缩放此版本时使用的最大容器数。 默认值为 10 默认值: None
|
autoscale_refresh_seconds
|
自动缩放程序应在终结点中尝试缩放此版本的频率。 默认值为 1 默认值: None
|
autoscale_target_utilization
|
自动缩放程序应尝试在终结点中为此版本维持的目标利用率(低于 100%)。 默认值为 70 默认值: None
|
collect_model_data
|
是否在终结点中为此版本启用模型数据收集。 默认为 False 默认值: None
|
cpu_cores
|
在终结点中为此版本分配的 CPU 核心数。 可以是小数。 默认值为 0.1 默认值: None
|
memory_gb
|
在终结点中为此版本分配的内存量 (GB)。 可以是小数。 默认值为 0.5 默认值: None
|
scoring_timeout_ms
|
对终结点中此版本的评分调用强制实施的超时。 默认值为 60000。 默认值: None
|
replica_max_concurrent_requests
|
允许对终结点中此版本使用的每个副本的最大并发请求数。 默认值为 1。 除非获得 Microsoft 技术支持人员或 Azure 机器学习团队成员的指导,否则不要更改此设置的默认值 1。 默认值: None
|
max_request_wait_time
|
在返回 503 错误之前,请求将在队列中停留的最长时间(以毫秒为单位)。 默认为 500。 默认值: None
|
num_replicas
|
在终结点中为此版本分配的容器数。 无默认值,如果未设置此参数,则默认启用自动缩放程序。 默认值: None
|
tags
|
为此终结点指定的键值标记字典。 默认值: None
|
properties
|
为此终结点指定的键值属性字典。 这些属性在部署后无法更改,但是可以添加新的键值对。 默认值: None
|
description
|
为此终结点指定的说明。 默认值: None
|
models
|
要与已更新的服务一起打包的模型对象的列表。 默认值: None
|
inference_config
|
用于提供所需模型部署属性的 InferenceConfig 对象。 默认值: None
|
gpu_cores
|
在终结点中为此版本分配的 GPU 核心数。 默认值为 0。 默认值: None
|
period_seconds
|
执行运行情况探测的频率(秒)。 默认值为 10 秒。 最小值为 1。 默认值: None
|
initial_delay_seconds
|
启动容器后,启动运行情况探测前的秒数。 默认值为 310。 默认值: None
|
timeout_seconds
|
运行情况探测超时前等待的秒数。默认值为 2 秒。 最小值为 1。 默认值: None
|
success_threshold
|
失败后,运行情况探测被视为成功的最小连续成功次数。 默认值为 1。 最小值为 1。 默认值: None
|
failure_threshold
|
当 Pod 启动而运行情况探测失败时,Kubernetes 将尝试 failureThreshold 次才会放弃。 默认值为 3。 最小值为 1。 默认值: None
|
traffic_percentile
|
版本在终结点中接收的流量。 默认值: None
|
is_default
|
是否将此版本设置为终结点中的默认版本。 默认为 False。 默认值: None
|
is_control_version_type
|
是否将此版本设置为终结点中的控制版本。 默认为 False。 默认值: None
|
cpu_cores_limit
|
允许此 Webservice 使用的最大 CPU 核心数。 可以是小数。 默认值: None
|
memory_gb_limit
|
允许此 Webservice 使用的最大内存量 (GB)。 可以是小数。 默认值: None
|
例外
类型 | 说明 |
---|---|
delete_version
删除终结点中的版本。
delete_version(version_name)
参数
名称 | 说明 |
---|---|
version_name
必需
|
终结点中要删除的版本的名称。 |
例外
类型 | 说明 |
---|---|
deploy_configuration
创建配置对象以部署到 AKS 计算目标。
static deploy_configuration(autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, auth_enabled=None, cpu_cores=None, memory_gb=None, enable_app_insights=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, primary_key=None, secondary_key=None, tags=None, properties=None, description=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, namespace=None, token_auth_enabled=None, version_name=None, traffic_percentile=None, compute_target_name=None, cpu_cores_limit=None, memory_gb_limit=None)
参数
名称 | 说明 |
---|---|
autoscale_enabled
|
是否在终结点中为此版本启用自动缩放。
如果 默认值: None
|
autoscale_min_replicas
|
在终结点中自动缩放此版本时使用的最小容器数。 默认值为 1。 默认值: None
|
autoscale_max_replicas
|
在终结点中自动缩放此版本时使用的最大容器数。 默认值为 10。 默认值: None
|
autoscale_refresh_seconds
|
自动缩放程序应在终结点中尝试缩放此版本的频率。 默认值为 1。 默认值: None
|
autoscale_target_utilization
|
自动缩放程序应尝试在终结点中为此版本维持的目标利用率(低于 100%)。 默认值为 70。 默认值: None
|
collect_model_data
|
是否在终结点中为此版本启用模型数据收集。 默认为 False。 默认值: None
|
auth_enabled
|
是否在终结点中为此版本启用密钥身份验证。 默认值为 true。 默认值: None
|
cpu_cores
|
在终结点中为此版本分配的 CPU 核心数。 可以是小数。 默认值为 0.1 默认值: None
|
memory_gb
|
在终结点中为此版本分配的内存量 (GB)。 可以是小数。 默认值为 0.5 默认值: None
|
enable_app_insights
|
是否在终结点中为此版本启用 ApplicationInsights 日志记录。 默认为 False。 默认值: None
|
scoring_timeout_ms
|
对终结点中此版本的评分调用强制实施的超时。 默认值为 60000 默认值: None
|
replica_max_concurrent_requests
|
允许对终结点中此版本使用的每个副本的最大并发请求数。 默认值为 1。 除非获得 Microsoft 技术支持人员或 Azure 机器学习团队成员的指导,否则不要更改此设置的默认值 1。 默认值: None
|
max_request_wait_time
|
在返回 503 错误之前,请求将在队列中停留的最长时间(以毫秒为单位)。 默认为 500。 默认值: None
|
num_replicas
|
在终结点中为此版本分配的容器数。 无默认值,如果未设置此参数,则默认启用自动缩放程序。 默认值: None
|
primary_key
|
要用于此终结点的主要身份验证密钥。 默认值: None
|
secondary_key
|
要用于此终结点的辅助身份验证密钥。 默认值: None
|
tags
|
为此终结点指定的键值标记字典。 默认值: None
|
properties
|
为此终结点指定的键值属性字典。 这些属性在部署后无法更改,但可以添加新的键值对 默认值: None
|
description
|
为此终结点指定的说明。 默认值: None
|
gpu_cores
|
在终结点中为此版本分配的 GPU 核心数。 默认值为 0。 默认值: None
|
period_seconds
|
执行运行情况探测的频率(秒)。 默认值为 10 秒。 最小值为 1。 默认值: None
|
initial_delay_seconds
|
启动容器后,启动运行情况探测前的秒数。 默认值为 310。 默认值: None
|
timeout_seconds
|
运行情况探测超时前等待的秒数。默认值为 2 秒。 最小值为 1。 默认值: None
|
success_threshold
|
运行情况探测失败后,将其视为成功所需的最小连续成功次数。 默认值为 1。 最小值为 1。 默认值: None
|
failure_threshold
|
当 Pod 启动而运行情况探测失败时,Kubernetes 将尝试 默认值: None
|
namespace
|
要在其中部署此终结点的 Kubernetes 命名空间:最多 63 个小写字母数字(“a”-“z”、“0”-“9”)和连字符(“-”)。 第一个和最后一个字符不能为连字符。 默认值: None
|
token_auth_enabled
|
是否为此终结点启用令牌身份验证。 如果启用此功能,则用户可以通过使用使用其 Azure Active Directory 凭据提取访问令牌来访问此终结点。 默认为 False。 默认值: None
|
version_name
|
终结点中版本的名称。 默认值: None
|
traffic_percentile
|
版本在终结点中接收的流量。 默认值: None
|
compute_target_name
|
要部署到的计算目标的名称 默认值: None
|
cpu_cores_limit
|
允许此 Webservice 使用的最大 CPU 核心数。 可以是小数。 默认值: None
|
memory_gb_limit
|
允许此 Webservice 使用的最大内存量 (GB)。 可以是小数。 默认值: None
|
返回
类型 | 说明 |
---|---|
例外
类型 | 说明 |
---|---|
serialize
将此 Web 服务对象转换为 JSON 序列化字典。
serialize()
返回
类型 | 说明 |
---|---|
此 Web 服务的 JSON 表示形式。 |
例外
类型 | 说明 |
---|---|
update
使用提供的属性更新终结点。
在此终结点中,保留为 None 的值将保持不变
update(auth_enabled=None, token_auth_enabled=None, enable_app_insights=None, description=None, tags=None, properties=None)
参数
名称 | 说明 |
---|---|
auth_enabled
|
是否在终结点中为此版本启用密钥身份验证。 默认值为 true。 默认值: None
|
token_auth_enabled
|
是否为此终结点启用令牌身份验证。 如果启用此功能,则用户可以通过使用使用其 Azure Active Directory 凭据提取访问令牌来访问此终结点。 默认为 False。 默认值: None
|
enable_app_insights
|
是否在终结点中为此版本启用 Application Insights 日志记录。 默认为 False。 默认值: None
|
description
|
为此终结点指定的说明。 默认值: None
|
tags
|
为此终结点指定的键值标记字典。 默认值: None
|
properties
|
为此终结点指定的键值属性字典。 这些属性在部署后无法更改,但是可以添加新的键值对。 默认值: None
|
例外
类型 | 说明 |
---|---|
update_version
使用提供的属性更新终结点中的现有版本。
在此版本中,保留为 None 的值将保持不变。
update_version(version_name, autoscale_enabled=None, autoscale_min_replicas=None, autoscale_max_replicas=None, autoscale_refresh_seconds=None, autoscale_target_utilization=None, collect_model_data=None, cpu_cores=None, memory_gb=None, scoring_timeout_ms=None, replica_max_concurrent_requests=None, max_request_wait_time=None, num_replicas=None, tags=None, properties=None, description=None, models=None, inference_config=None, gpu_cores=None, period_seconds=None, initial_delay_seconds=None, timeout_seconds=None, success_threshold=None, failure_threshold=None, traffic_percentile=None, is_default=None, is_control_version_type=None, cpu_cores_limit=None, memory_gb_limit=None)
参数
名称 | 说明 |
---|---|
version_name
必需
|
终结点中版本的名称。 |
autoscale_enabled
|
是否在终结点中为此版本启用自动缩放。 如果 num_replicas 为 None,则默认值为 True。 默认值: None
|
autoscale_min_replicas
|
在终结点中自动缩放此版本时使用的最小容器数。 默认值为 1。 默认值: None
|
autoscale_max_replicas
|
在终结点中自动缩放此版本时使用的最大容器数。 默认值为 10。 默认值: None
|
autoscale_refresh_seconds
|
自动缩放程序应在终结点中尝试缩放此版本的频率。 默认值为 1 默认值: None
|
autoscale_target_utilization
|
自动缩放程序应尝试在终结点中为此版本维持的目标利用率(低于 100%)。 默认值为 70。 默认值: None
|
collect_model_data
|
是否在终结点中为此版本启用模型数据收集。 默认为 False。 默认值: None
|
cpu_cores
|
在终结点中为此版本分配的 CPU 核心数。 可以是小数。 默认值为 0.1 默认值: None
|
memory_gb
|
在终结点中为此版本分配的内存量 (GB)。 可以是小数。 默认值为 0.5 默认值: None
|
scoring_timeout_ms
|
对终结点中此版本的评分调用强制实施的超时。 默认值为 60000。 默认值: None
|
replica_max_concurrent_requests
|
允许对终结点中此版本使用的每个副本的最大并发请求数。 默认值为 1。 除非获得 Microsoft 技术支持人员或 Azure 机器学习团队成员的指导,否则不要更改此设置的默认值 1。 默认值: None
|
max_request_wait_time
|
在返回 503 错误之前,请求将在队列中停留的最长时间(以毫秒为单位)。 默认为 500。 默认值: None
|
num_replicas
|
在终结点中为此版本分配的容器数。 无默认值,如果未设置此参数,则默认启用自动缩放程序。 默认值: None
|
tags
|
为此终结点指定的键值标记字典。 默认值: None
|
properties
|
为此终结点指定的键值属性字典。 这些属性在部署后无法更改,但是可以添加新的键值对。 默认值: None
|
description
|
为此终结点指定的说明 默认值: None
|
models
|
要与已更新的服务一起打包的模型对象的列表 默认值: None
|
inference_config
|
用于提供所需模型部署属性的 InferenceConfig 对象。 默认值: None
|
gpu_cores
|
在终结点中为此版本分配的 GPU 核心数。 默认值为 0。 默认值: None
|
period_seconds
|
执行运行情况探测的频率(秒)。 默认值为 10 秒。 最小值为 1。 默认值: None
|
initial_delay_seconds
|
启动容器后,启动运行情况探测前的秒数。 默认值为 310。 默认值: None
|
timeout_seconds
|
运行情况探测超时前等待的秒数。默认值为 2 秒。 最小值为 1。 默认值: None
|
success_threshold
|
失败后,运行情况探测被视为成功的最小连续成功次数。 默认值为 1。 最小值为 1。 默认值: None
|
failure_threshold
|
当 Pod 启动而运行情况探测失败时,Kubernetes 将尝试 failureThreshold 次才会放弃。 默认值为 3。 最小值为 1。 默认值: None
|
traffic_percentile
|
版本在终结点中接收的流量。 默认值: None
|
is_default
|
是否将此版本设置为终结点中的默认版本。 默认为 False。 默认值: None
|
is_control_version_type
|
是否将此版本设置为终结点中的控制版本。 默认为 False。 默认值: None
|
cpu_cores_limit
|
允许此 Webservice 使用的最大 CPU 核心数。 可以是小数。 默认值: None
|
memory_gb_limit
|
允许此 Webservice 使用的最大内存量 (GB)。 可以是小数。 默认值: None
|
例外
类型 | 说明 |
---|---|