Utilizzare un modello di Azure Machine Learning distribuito come servizio Web
Quando si distribuisce un modello di Azure Machine Learning come servizio Web, viene creato un endpoint dell'API REST. È possibile inviare dati a questo endpoint e ottenere la previsione restituita dal modello. Questo documento illustra come creare client per il servizio Web usando C#, Go, Java e Python.
Quando si distribuisce un modello nell'ambiente locale, in Istanze di Azure Container o nel servizio Azure Kubernetes, viene creato un servizio Web. L'URI usato per accedere a un servizio Web viene recuperato tramite l'SDK di Azure Machine Learning. Se è abilitata l'autenticazione, è anche possibile usare l’SDK per ottenere le chiavi di autenticazione o i token.
Il flusso di lavoro generale per creare un client che usa un servizio Web di Machine Learning è il seguente:
- Ottenere le informazioni di connessione usando l'SDK.
- Determinare il tipo di dati della richiesta usati dal modello.
- Creare un'applicazione che chiama il servizio Web.
Gli esempi in questo documento vengono creati manualmente senza l'uso delle specifiche OpenAPI (Swagger). Se è stata abilitata una specifica OpenAPI per la distribuzione, è possibile usare strumenti come swagger-codegen per creare librerie client per il servizio.
Alcuni comandi dell'interfaccia della riga di comando (CLI) di Azure in questo articolo usano l'estensione azure-cli-ml
, o v1, per Azure Machine Learning. L'assistenza per l'estensione v1 terminerà il 30 settembre 2025. Sarà possibile installare e usare l'estensione v1 fino a tale data.
Consigliamo di passare all'estensione ml
, o v2, prima del 30 settembre 2025. Per ulteriori informazioni sull'estensione v2, vedere Estensione dell'interfaccia della riga di comando (CLI) di Azure ML e SDK Python v2.
Informazioni di connessione
Usare l'SDK di Azure Machine Learning per ottenere le informazioni sul servizio Web. Si tratta di un SDK per Python. È possibile usare qualsiasi linguaggio per creare un client per il servizio.
La classe azureml.core.Webservice fornisce le informazioni necessarie per creare un client. Per la creazione di un'applicazione client sono utili le proprietà Webservice
: se è abilitata l'autenticazione tramite chiave,True
. In caso contrario,False
: se è abilitata l'autenticazione tramite token,True
. In caso contrario,False
- L'indirizzo dell'API REST.swagger_uri
: indirizzo della specifica OpenAPI. Questo URI è disponibile se è stata abilitata la generazione automatica dello schema. Per altre informazioni, vedere Distribuire modelli con Azure Machine Learning.
Sono disponibili molti modi per recuperare queste informazioni per servizi Web distribuiti:
SI APPLICA A: Python SDK azureml v1
Quando si distribuisce un modello, viene restituito un
oggetto con informazioni sul servizio:service = Model.deploy(ws, "myservice", [model], inference_config, deployment_config) service.wait_for_deployment(show_output = True) print(service.scoring_uri) print(service.swagger_uri)
È possibile usare
per recuperare un elenco dei servizi Web distribuiti per i modelli presenti nella propria area di lavoro. È possibile aggiungere filtri per restringere l'elenco delle informazioni restituite. Per altre informazioni sui dati che è possibile filtrare, vedere la documentazione di riferimento di Webservice.list.services = Webservice.list(ws) print(services[0].scoring_uri) print(services[0].swagger_uri)
Se si conosce il nome del servizio distribuito, è possibile creare una nuova istanza di
e specificare il nome dell'area di lavoro e del servizio come parametri. Il nuovo oggetto contiene informazioni sul servizio distribuito.service = Webservice(workspace=ws, name='myservice') print(service.scoring_uri) print(service.swagger_uri)
La tabella seguente mostra l'aspetto di questi URI:
Tipo di URI | Esempio |
URI di assegnazione dei punteggi |<service-name>/score |
URI Swagger |<service-name>/swagger.json |
L'indirizzo IP sarà diverso per la distribuzione specifica. Ogni cluster del servizio Azure Kubernetes avrà un proprio indirizzo IP condiviso dalle distribuzioni in tale cluster.
Servizio Web protetto
Se il servizio Web distribuito è stato protetto usando un certificato TLS/SSL, è possibile usare HTTPS per connettersi al servizio usando l'URI di assegnazione dei punteggi o swagger. HTTPS consente di proteggere le comunicazioni tra un client e un servizio Web crittografando le comunicazioni tra i due. Per la crittografia viene usato il protocollo TLS (Transport Layer Security). TLS viene talvolta definito Secure Sockets Layer (SSL), che era il predecessore di TLS.
I servizi Web distribuiti da Azure Machine Learning supportano solo TLS versione 1.2. Quando si crea un'applicazione client, assicurarsi che supporti questa versione.
Per altre informazioni, vedere Usare TLS per proteggere un servizio Web tramite Azure Machine Learning.
Autenticazione per i servizi
Azure Machine Learning offre due modi per controllare l'accesso ai servizi Web.
Metodo di autenticazione | ACI | Servizio Azure Kubernetes |
Chiave | Disattivata per impostazione predefinita | Abilitata per impostazione predefinita |
token | Non disponibile | Disattivato per impostazione predefinita |
Quando si invia una richiesta a un servizio protetto con una chiave o un token, usare l'intestazione Autorizzazione per passare la chiave o il token. La chiave o il token devono essere formattati come Bearer <key-or-token>
, dove <key-or-token>
è il valore della chiave o del token.
La differenza principale tra chiavi e token è che le chiavi sono statiche e possono essere rigenerate manualmente, mentre i token devono essere aggiornati alla scadenza. L'autenticazione basata su chiave è supportata per l'istanza di Azure Container e per i servizi Web distribuiti dal servizio Azure Kubernetes e l'autenticazione basata su token è disponibile solo per le distribuzioni del servizio Azure Kubernetes. Per altre informazioni sulla configurazione dell'autenticazione, vedere Configurare l'autenticazione per i modelli distribuiti come servizi Web.
Autenticazione con chiavi
Quando si abilita l'autenticazione per una distribuzione, si creano automaticamente le chiavi di autenticazione.
- L'autenticazione è abilitata per impostazione predefinita quando si esegue la distribuzione nel servizio Azure Kubernetes.
- L'autenticazione è disabilitata per impostazione predefinita quando si esegue la distribuzione in Istanze di Azure Container.
Per controllare l'autenticazione, usare il parametro auth_enabled
quando si crea o si aggiorna una distribuzione.
Se è abilitata l'autenticazione, è possibile usare il metodo get_keys
per recuperare una chiave di autenticazione primaria e una secondaria:
primary, secondary = service.get_keys()
Se è necessario rigenerare una chiave, usare service.regen_key
Autenticazione con token
Quando si abilita l'autenticazione tramite token per un servizio Web, un utente deve fornire un token JWT di Azure Machine Learning al servizio Web per accedervi.
- L'autenticazione tramite token è disabilitata per impostazione predefinita quando si esegue la distribuzione nel servizio Azure Kubernetes.
- L'autenticazione tramite token non è supportata quando si esegue la distribuzione a Istanze di Azure Container.
Per controllare l'autenticazione tramite token, usare il parametro token_auth_enabled
quando si crea o si aggiorna una distribuzione.
Se l'autenticazione tramite token è abilitata, è possibile usare il metodo get_token
per recuperare un token di connessione e la data di scadenza del token:
token, refresh_by = service.get_token()
Se si ha l'interfaccia della riga di comando di Azure e l'estensione di Machine Learning, è possibile usare il comando seguente per ottenere un token:
SI APPLICA A: Estensione ML dell'interfaccia della riga di comando di Azure v1
az ml service get-access-token -n <service-name>
L'unico modo per recuperare il token consiste attualmente nell'usare Azure Machine Learning SDK o l'estensione di Machine Learning dell'interfaccia della riga di comando di Azure.
Al termine della durata del token refresh_by
, sarà necessario richiedere un nuovo token.
Dati richiesta
L'API REST prevede che il corpo della richiesta sia un documento JSON con la struttura seguente:
La struttura dei dati deve corrispondere allo script di punteggio e al modello nelle stime del servizio. Lo script di punteggio può modificare i dati prima di trasferirli al modello.
Dati binari
Per informazioni su come abilitare il supporto per i dati binari nel servizio, vedere Dati binari.
L'abilitazione del supporto per i dati binari viene eseguita nel file score.py usato dal modello distribuito. Dal client usare la funzionalità HTTP del linguaggio di programmazione. Ad esempio, il frammento di codice seguente invia il contenuto di un file JPG a un servizio Web:
import requests
# Load image data
data = open('example.jpg', 'rb').read()
# Post raw data to scoring URI
res = request.post(url='<scoring-uri>', data=data, headers={'Content-Type': 'application/> octet-stream'})
Condivisione di risorse tra le origini (CORS)
Per informazioni sull'abilitazione del supporto CORS nel servizio, vedere CORS (Cross-Origin Resource Sharing).
Chiamare il servizio (C#)
In questo esempio viene illustrato come utilizzare C# per chiamare il servizio Web creato dall’esempio Eseguire il training sul notebook:
using System;
using System.Collections.Generic;
using System.IO;
using System.Net.Http;
using System.Net.Http.Headers;
using Newtonsoft.Json;
namespace MLWebServiceClient
// The data structure expected by the service
internal class InputData
// The service used by this example expects an array containing
// one or more arrays of doubles
internal double[,] data;
class Program
static void Main(string[] args)
// Set the scoring URI and authentication key or token
string scoringUri = "<your web service URI>";
string authKey = "<your key or token>";
// Set the data to be sent to the service.
// In this case, we are sending two sets of data to be scored.
InputData payload = new InputData();
payload.data = new double[,] {
// Create the HTTP client
HttpClient client = new HttpClient();
// Set the auth header. Only needed if the web service requires authentication.
client.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", authKey);
// Make the request
try {
var request = new HttpRequestMessage(HttpMethod.Post, new Uri(scoringUri));
request.Content = new StringContent(JsonConvert.SerializeObject(payload));
request.Content.Headers.ContentType = new MediaTypeHeaderValue("application/json");
var response = client.SendAsync(request).Result;
// Display the response from the web service
catch (Exception e)
I risultati restituiti sono simili al seguente documento JSON:
[217.67978776218715, 224.78937091757172]
Chiamare il servizio (Go)
In questo esempio viene illustrato come utilizzare Go per chiamare il servizio Web creato dall’esempio Eseguire il training sul notebook:
package main
import (
// Features for this model are an array of decimal values
type Features []float64
// The web service input can accept multiple sets of values for scoring
type InputData struct {
Data []Features `json:"data",omitempty`
// Define some example data
var exampleData = []Features{
// Set to the URI for your service
var serviceUri string = "<your web service URI>"
// Set to the authentication key or token (if any) for your service
var authKey string = "<your key or token>"
func main() {
// Create the input data from example data
jsonData := InputData{
Data: exampleData,
// Create JSON from it and create the body for the HTTP request
jsonValue, _ := json.Marshal(jsonData)
body := bytes.NewBuffer(jsonValue)
// Create the HTTP request
client := &http.Client{}
request, err := http.NewRequest("POST", serviceUri, body)
request.Header.Add("Content-Type", "application/json")
// These next two are only needed if using an authentication key
bearer := fmt.Sprintf("Bearer %v", authKey)
request.Header.Add("Authorization", bearer)
// Send the request to the web service
resp, err := client.Do(request)
if err != nil {
fmt.Println("Failure: ", err)
// Display the response received
respBody, _ := ioutil.ReadAll(resp.Body)
I risultati restituiti sono simili al seguente documento JSON:
[217.67978776218715, 224.78937091757172]
Chiamare il servizio (Java)
In questo esempio viene illustrato come utilizzare Java per chiamare il servizio Web creato dall’esempio Eseguire il training sul notebook:
import java.io.IOException;
import org.apache.http.client.fluent.*;
import org.apache.http.entity.ContentType;
import org.json.simple.JSONArray;
import org.json.simple.JSONObject;
public class App {
// Handle making the request
public static void sendRequest(String data) {
// Replace with the scoring_uri of your service
String uri = "<your web service URI>";
// If using authentication, replace with the auth key or token
String key = "<your key or token>";
try {
// Create the request
Content content = Request.Post(uri)
.addHeader("Content-Type", "application/json")
// Only needed if using authentication
.addHeader("Authorization", "Bearer " + key)
// Set the JSON data as the body
.bodyString(data, ContentType.APPLICATION_JSON)
// Make the request and display the response.
catch (IOException e) {
public static void main(String[] args) {
// Create the data to send to the service
JSONObject obj = new JSONObject();
// In this case, it's an array of arrays
JSONArray dataItems = new JSONArray();
// Inner array has 10 elements
JSONArray item1 = new JSONArray();
// Add the first set of data to be scored
// Create and add the second set
JSONArray item2 = new JSONArray();
obj.put("data", dataItems);
// Make the request using the JSON document string
I risultati restituiti sono simili al seguente documento JSON:
[217.67978776218715, 224.78937091757172]
Chiamare il servizio (Python)
In questo esempio viene illustrato come utilizzare Python per chiamare il servizio Web creato dall’esempio Eseguire il training sul notebook:
import requests
import json
# URL for the web service
scoring_uri = '<your web service URI>'
# If the service is authenticated, set the key or token
key = '<your key or token>'
# Two sets of data to score, so we get two results back
data = {"data":
# Convert to JSON string
input_data = json.dumps(data)
# Set the content type
headers = {'Content-Type': 'application/json'}
# If authentication is enabled, set the authorization header
headers['Authorization'] = f'Bearer {key}'
# Make the request and display the response
resp = requests.post(scoring_uri, input_data, headers=headers)
I risultati restituiti sono simili al seguente documento JSON:
[217.67978776218715, 224.78937091757172]
Schema del servizio Web (specifica OpenAPI)
Se è stata usata la generazione automatica dello schema con la distribuzione, è possibile ottenere l'indirizzo della specifica OpenAPI per il servizio usando la proprietà swagger_uri. ad esempio print(service.swagger_uri)
. Usare una richiesta GET o aprire l'URI in un browser per recuperare la specifica.
Il documento JSON seguente è un esempio di schema (specifica OpenAPI) generato per una distribuzione:
"swagger": "2.0",
"info": {
"title": "myservice",
"description": "API specification for Azure Machine Learning myservice",
"version": "1.0"
"schemes": [
"consumes": [
"produces": [
"securityDefinitions": {
"Bearer": {
"type": "apiKey",
"name": "Authorization",
"in": "header",
"description": "For example: Bearer abc123"
"paths": {
"/": {
"get": {
"operationId": "ServiceHealthCheck",
"description": "Simple health check endpoint to ensure the service is up at any given point.",
"responses": {
"200": {
"description": "If service is up and running, this response will be returned with the content 'Healthy'",
"schema": {
"type": "string"
"examples": {
"application/json": "Healthy"
"default": {
"description": "The service failed to execute due to an error.",
"schema": {
"$ref": "#/definitions/ErrorResponse"
"/score": {
"post": {
"operationId": "RunMLService",
"description": "Run web service's model and get the prediction output",
"security": [
"Bearer": []
"parameters": [
"name": "serviceInputPayload",
"in": "body",
"description": "The input payload for executing the real-time machine learning service.",
"schema": {
"$ref": "#/definitions/ServiceInput"
"responses": {
"200": {
"description": "The service processed the input correctly and provided a result prediction, if applicable.",
"schema": {
"$ref": "#/definitions/ServiceOutput"
"default": {
"description": "The service failed to execute due to an error.",
"schema": {
"$ref": "#/definitions/ErrorResponse"
"definitions": {
"ServiceInput": {
"type": "object",
"properties": {
"data": {
"type": "array",
"items": {
"type": "array",
"items": {
"type": "integer",
"format": "int64"
"example": {
"data": [
[ 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 ]
"ServiceOutput": {
"type": "array",
"items": {
"type": "number",
"format": "double"
"example": [
"ErrorResponse": {
"type": "object",
"properties": {
"status_code": {
"type": "integer",
"format": "int32"
"message": {
"type": "string"
Per altre informazioni, vedere Specifica OpenAPI.
Per un'utilità in grado di creare librerie client dalla specifica, vedere swagger-codegen.
È possibile recuperare il documento JSON dello schema dopo la distribuzione del servizio. Usare la proprietà swagger_uri dal servizio Web distribuito (ad esempio, service.swagger_uri
) per ottenere l'URI del file Swagger del servizio Web locale.
Usare il servizio da Power BI
Power BI supporta l'utilizzo dei servizi Web di Azure Machine Learning per arricchire i dati in Power BI con stime.
Per generare un servizio Web supportato per l'utilizzo in Power BI, lo schema deve supportare il formato richiesto da Power BI. Informazioni su come creare uno schema supportato da Power BI.
Dopo aver distribuito il servizio Web, può essere utilizzato dai flussi di dati di Power BI. Informazioni su come usare un servizio Web Azure Machine Learning da Power BI.
Passaggi successivi
