Gdy model działa, będzie gotowy do wdrożenia i wykonać zapytanie o przewidywania z wypowiedzi. Wdrożenie modelu udostępnia go do użycia za pośrednictwem interfejsu API przewidywania.
Po przejrzeniu wydajności modelu i podjęciu decyzji, że można go używać w danym środowisku, musisz przypisać go do wdrożenia, aby móc wykonywać względem niego zapytania. Przypisanie modelu do wdrożenia udostępnia go do użycia za pośrednictwem interfejsu API przewidywania. Zaleca się utworzenie wdrożenia o nazwie production , do którego przypisano najlepszy model utworzony do tej pory i użycie go w systemie. Możesz utworzyć kolejne wdrożenie o nazwie staging , do którego można przypisać model, nad którym pracujesz, aby móc go przetestować. W projekcie można mieć maksymalnie 10 wdrożeń.
Wybierz pozycję Deploying a model (Wdrażanie modelu ) z menu po lewej stronie.
Wybierz pozycję Dodaj wdrożenie , aby uruchomić Kreatora dodawania wdrożenia .
Wybierz pozycję Utwórz nową nazwę wdrożenia, aby utworzyć nowe wdrożenie i przypisać wytrenowany model z listy rozwijanej poniżej. W przeciwnym razie możesz wybrać pozycję Zastąp istniejącą nazwę wdrożenia, aby skutecznie zastąpić model używany przez istniejące wdrożenie.
Uwaga
Zastępowanie istniejącego wdrożenia nie wymaga zmian wywołania interfejsu API przewidywania, ale uzyskane wyniki będą oparte na nowo przypisanym modelu.
Wybierz wytrenowany model z listy rozwijanej Model .
Wybierz pozycję Wdróż , aby uruchomić zadanie wdrożenia.
Po pomyślnym wdrożeniu obok zostanie wyświetlona data wygaśnięcia. Wygaśnięcie wdrożenia jest wtedy, gdy wdrożony model będzie niedostępny do przewidywania, co zwykle występuje dwanaście miesięcy po wygaśnięciu konfiguracji trenowania.
Przesyłanie zadania wdrożenia
Utwórz żądanie PUT przy użyciu następującego adresu URL, nagłówków i treści JSON, aby rozpocząć wdrażanie modelu interpretacji języka konwersacji.
Nazwa projektu. Ta wartość jest uwzględniana w wielkości liter.
myProject
{DEPLOYMENT-NAME}
Nazwa wdrożenia. Ta wartość jest uwzględniana w wielkości liter.
staging
{API-VERSION}
Wersja wywoływanego interfejsu API.
2023-04-01
Nagłówki
Użyj następującego nagłówka, aby uwierzytelnić żądanie.
Key
Wartość
Ocp-Apim-Subscription-Key
Klucz do zasobu. Służy do uwierzytelniania żądań interfejsu API.
Treść żądania
{
"trainedModelLabel": "{MODEL-NAME}",
}
Klucz
Symbol zastępczy
Wartość
Przykład
trainedModelLabel
{MODEL-NAME}
Nazwa modelu, która zostanie przypisana do wdrożenia. Można przypisywać tylko pomyślnie wytrenowane modele. Ta wartość jest uwzględniana w wielkości liter.
myModel
Po wysłaniu żądania interfejsu API otrzymasz odpowiedź wskazującą 202 powodzenie. W nagłówkach odpowiedzi wyodrębnij operation-location wartość. Zostanie on sformatowany w następujący sposób:
Możesz użyć tego adresu URL, aby uzyskać stan zadania wdrożenia.
Pobieranie stanu zadania wdrożenia
Po wysłaniu pomyślnego żądania wdrożenia pełny adres URL żądania sprawdzania stanu zadania (w tym punktu końcowego, nazwy projektu i identyfikatora zadania) jest zawarty w nagłówku operation-location odpowiedzi.
Użyj następującego żądania GET , aby uzyskać stan zadania wdrożenia. Zastąp wartości symboli zastępczych własnymi wartościami.
Aby usunąć wdrożenie z poziomu programu Language Studio, wybierz stronę Wdrażanie modelu . Następnie wybierz wdrożenie, które chcesz usunąć, a następnie wybierz pozycję Usuń wdrożenie w górnym menu.
Utwórz żądanie DELETE przy użyciu następującego adresu URL, nagłówków i treści JSON, aby usunąć wdrożenie interpretacji języka konwersacji.
Aby przypisać zasoby wdrażania w innych regionach w programie Language Studio:
Upewnij się, że masz przypisaną rolę właściciela języka usług Cognitive Services do zasobu użytego do utworzenia projektu.
Przejdź do strony Wdrażanie modelu w programie Language Studio.
Wybierz kartę Regiony .
Wybierz pozycję Dodaj zasób wdrożenia.
Wybierz zasób języka w innym regionie.
Teraz możesz przystąpić do wdrażania projektu w regionach, w których przypisano zasoby.
Programowe przypisywanie zasobów wdrażania wymaga uwierzytelniania entra firmy Microsoft**. Identyfikator Entra firmy Microsoft służy do potwierdzania, że masz dostęp do zasobów, które chcesz przypisać do projektu na potrzeby wdrożenia w wielu regionach. Aby programowo używać uwierzytelniania entra firmy Microsoft podczas wykonywania wywołań interfejsu API REST, zobacz dokumentację uwierzytelniania usług Azure AI.
Przypisywanie zasobu
Prześlij żądanie POST przy użyciu następującego adresu URL, nagłówków i treści JSON, aby przypisać zasoby wdrożenia.
Adres URL żądania
Podczas tworzenia żądania interfejsu API użyj następującego adresu URL. Zastąp poniższe wartości symboli zastępczych własnymi wartościami.
Pełna ścieżka identyfikatora zasobu, którą chcesz przypisać. Znaleziono w witrynie Azure Portal na karcie Właściwości zasobu w polu Identyfikator zasobu .
Niestandardowa poddomena zasobu, który chcesz przypisać. Znaleziono w witrynie Azure Portal na karcie Klucze i punkt końcowy zasobu, część pola Punkt końcowy w adresie URL https://<your-custom-subdomain>.cognitiveservices.azure.com/
contosoresource
region
{REGION-CODE}
Kod regionu określający region zasobu, który chcesz przypisać. Znaleziono w witrynie Azure Portal na karcie Klucze i punkt końcowy zasobu w ramach pola Lokalizacja/region .
eastus
Uzyskiwanie stanu zasobu przypisania
Użyj następującego żądania GET , aby uzyskać stan zadania przypisania zasobu wdrożenia. Zastąp poniższe wartości symboli zastępczych własnymi wartościami.
Nazwa projektu. Ta wartość jest uwzględniana w wielkości liter.
myProject
{JOB-ID}
Identyfikator zadania służącego do uzyskiwania stanu wdrożenia przypisania. Jest to wartość nagłówka operation-location odebrana z interfejsu API w odpowiedzi na żądanie przypisania zasobu wdrożenia.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Wersja wywoływanego interfejsu API.
2022-10-01-preview
Nagłówki
Użyj następującego nagłówka, aby uwierzytelnić żądanie.
Key
Wartość
Ocp-Apim-Subscription-Key
Klucz do zasobu. Służy do uwierzytelniania żądań interfejsu API.
Treść odpowiedzi
Po wysłaniu żądania otrzymasz następującą odpowiedź. Nie sonduj tego punktu końcowego , dopóki parametr stanu nie zmieni się na "powodzenie".
Pełna ścieżka identyfikatora zasobu, którą chcesz cofnąć. Znaleziono w witrynie Azure Portal na karcie Właściwości zasobu jako pole Identyfikator zasobu.
Użyj następującego żądania GET , aby uzyskać stan zadania nieprzypisanych zasobów wdrożenia. Zastąp poniższe wartości symboli zastępczych własnymi wartościami.
Nazwa projektu. Ta wartość jest uwzględniana w wielkości liter.
myProject
{JOB-ID}
Identyfikator zadania służącego do uzyskiwania stanu wdrożenia przypisania. Jest to wartość nagłówka operation-location odebrana z interfejsu API w odpowiedzi na żądanie nieprzypisywania zasobu wdrożenia.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
Wersja wywoływanego interfejsu API.
2022-10-01-preview
Nagłówki
Użyj następującego nagłówka, aby uwierzytelnić żądanie.
Key
Wartość
Ocp-Apim-Subscription-Key
Klucz do zasobu. Służy do uwierzytelniania żądań interfejsu API.
Treść odpowiedzi
Po wysłaniu żądania otrzymasz następującą odpowiedź. Nie sonduj tego punktu końcowego , dopóki parametr stanu nie zmieni się na "powodzenie".