Cykl życia niestandardowego modelu mowy
Możesz użyć niestandardowego modelu mowy przez jakiś czas po wdrożeniu go w niestandardowym punkcie końcowym. Jednak po udostępnieniu nowych modeli podstawowych starsze modele wygasły. Aby korzystać z ulepszonej dokładności i jakości, należy okresowo ponownie utworzyć i wytrenować model niestandardowy z najnowszego modelu podstawowego.
Poniżej przedstawiono niektóre kluczowe terminy związane z cyklem życia modelu:
- Trenowanie: pobieranie modelu podstawowego i dostosowywanie go do domeny/scenariusza przy użyciu danych tekstowych i/lub danych audio. W niektórych kontekstach, takich jak właściwości interfejsu API REST, trenowanie jest również określane jako adaptacja.
- Transkrypcja: używanie modelu i rozpoznawanie mowy (dekodowanie dźwięku do tekstu).
- Punkt końcowy: konkretne wdrożenie modelu podstawowego lub modelu niestandardowego, do którego można uzyskać dostęp tylko.
Uwaga
Punkty końcowe używane przez F0
zasoby usługi Mowa są usuwane po siedmiu dniach.
Oś czasu wygaśnięcia
Poniżej przedstawiono osie czasu dostosowywania modelu i wygaśnięcia transkrypcji:
- Szkolenie jest dostępne przez rok po kwartale podczas tworzenia modelu podstawowego przez firmę Microsoft.
- Transkrypcja z modelem podstawowym jest dostępna przez dwa lata po kwartale utworzenia modelu podstawowego przez firmę Microsoft.
- Transkrypcja z modelem niestandardowym jest dostępna przez dwa lata po kwartale podczas tworzenia modelu niestandardowego.
W tym kontekście kwartały kończą się 15 stycznia, 15 kwietnia, 15 lipca i 15 października.
Co zrobić, gdy model wygaśnie
Gdy model niestandardowy lub model podstawowy wygaśnie, nie jest już dostępny do transkrypcji. Możesz zmienić model używany przez niestandardowy punkt końcowy mowy bez przestoju.
Trasa transkrypcji | Wynik wygasłego modelu | Zalecenie |
---|---|---|
Niestandardowy punkt końcowy | Żądania rozpoznawania mowy wracają do najnowszego modelu podstawowego dla tych samych ustawień regionalnych. Uzyskujesz wyniki, ale rozpoznawanie może nie być dokładnie transkrypcji danych domeny. | Zaktualizuj model punktu końcowego zgodnie z opisem w przewodniku Wdrażanie niestandardowego modelu mowy. |
Transkrypcja wsadowa | Żądania transkrypcji wsadowej dla wygasłych modeli kończą się niepowodzeniem z powodu błędu 4xx. | W każdej Transcriptions_Create treści żądania interfejsu API REST ustaw model właściwość na model podstawowy lub model niestandardowy, który nie wygasł. W przeciwnym razie nie uwzględniaj model właściwości, aby zawsze używać najnowszego modelu podstawowego. |
Pobieranie dat wygaśnięcia modelu podstawowego
Ostatnia data użycia modelu podstawowego do trenowania została wyświetlona podczas tworzenia modelu niestandardowego. Aby uzyskać więcej informacji, zobacz Trenowanie niestandardowego modelu mowy.
Postępuj zgodnie z tymi instrukcjami, aby uzyskać datę wygaśnięcia transkrypcji dla modelu podstawowego:
Zaloguj się do programu Speech Studio.
Wybierz pozycję Mowa> niestandardowa Nazwa >projektu Wdróż modele.
Data wygaśnięcia modelu jest wyświetlana w kolumnie Wygaśnięcie . Ta data to ostatnia data, w której można użyć modelu do transkrypcji.
Aby uzyskać daty wygaśnięcia trenowania i transkrypcji dla modelu podstawowego, użyj spx csr model status
polecenia . Skonstruuj parametry żądania zgodnie z następującymi instrukcjami:
url
Ustaw parametr na identyfikator URI modelu podstawowego, który chcesz uzyskać. Możesz uruchomić polecenie ,spx csr list --base
aby uzyskać dostępne modele podstawowe dla wszystkich ustawień regionalnych.
Oto przykładowe polecenie interfejsu wiersza polecenia usługi Mowa umożliwiające uzyskanie dat wygaśnięcia trenowania i transkrypcji dla modelu podstawowego:
spx csr model status --api-version v3.1 --model https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f
W odpowiedzi zanotuj datę we adaptationDateTime
właściwości . Ta właściwość to ostatnia data użycia modelu podstawowego do trenowania. Zanotuj transcriptionDateTime
również datę we właściwości . Ta data to ostatnia data, w której można użyć modelu podstawowego do transkrypcji.
Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
"datasets": [],
"links": {
"manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-01-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-06T10:52:02Z",
"status": "Succeeded",
"createdDateTime": "2021-10-13T00:00:00Z",
"locale": "en-US",
"displayName": "20210831 + Audio file adaptation",
"description": "en-US base model"
}
Aby uzyskać pomoc dotyczącą interfejsu wiersza polecenia usługi Mowa w modelach, uruchom następujące polecenie:
spx help csr model
Aby uzyskać daty wygaśnięcia trenowania i transkrypcji dla modelu podstawowego, użyj operacji Models_GetBaseModel interfejsu API REST zamiany mowy na tekst. Możesz wysłać żądanie Models_ListBaseModels , aby uzyskać dostępne modele podstawowe dla wszystkich ustawień regionalnych.
Utwórz żądanie HTTP GET przy użyciu identyfikatora URI modelu, jak pokazano w poniższym przykładzie. Zastąp BaseModelId
ciąg swoim identyfikatorem modelu, zastąp ciąg kluczem zasobu usługi Mowa i zastąp YourSubscriptionKey
YourServiceRegion
element regionem zasobu usługi Mowa.
curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
W odpowiedzi zanotuj datę we adaptationDateTime
właściwości . Ta data to ostatnia data, w której można użyć modelu podstawowego do trenowania. Zanotuj transcriptionDateTime
również datę we właściwości . Ta data to ostatnia data, w której można użyć modelu podstawowego do transkrypcji.
Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
"datasets": [],
"links": {
"manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-01-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-06T10:52:02Z",
"status": "Succeeded",
"createdDateTime": "2021-10-13T00:00:00Z",
"locale": "en-US",
"displayName": "20210831 + Audio file adaptation",
"description": "en-US base model"
}
Pobieranie dat wygaśnięcia modelu niestandardowego
Postępuj zgodnie z tymi instrukcjami, aby uzyskać datę wygaśnięcia transkrypcji dla modelu niestandardowego:
Zaloguj się do programu Speech Studio.
Wybierz pozycję Niestandardowa mowa> Nazwa >projektu Train custom models (Trenowanie modeli niestandardowych).
Data wygaśnięcia modelu niestandardowego jest wyświetlana w kolumnie Wygaśnięcie . Ta data to ostatnia data, w której można użyć modelu niestandardowego do transkrypcji. Modele podstawowe nie są wyświetlane na stronie Trenowanie modeli niestandardowych.
Możesz również postępować zgodnie z tymi instrukcjami, aby uzyskać datę wygaśnięcia transkrypcji dla modelu niestandardowego:
Zaloguj się do programu Speech Studio.
Wybierz pozycję Mowa> niestandardowa Nazwa >projektu Wdróż modele.
Data wygaśnięcia modelu jest wyświetlana w kolumnie Wygaśnięcie . Ta data to ostatnia data, w której można użyć modelu do transkrypcji.
Aby uzyskać datę wygaśnięcia transkrypcji dla modelu niestandardowego spx csr model status
, użyj polecenia . Skonstruuj parametry żądania zgodnie z następującymi instrukcjami:
url
Ustaw parametr na identyfikator URI modelu, który chcesz uzyskać. ZastąpYourModelId
ciąg identyfikatorem modelu i zastąp elementYourServiceRegion
regionem zasobu usługi Mowa.
Oto przykładowe polecenie interfejsu wiersza polecenia usługi Mowa umożliwiające uzyskanie daty wygaśnięcia transkrypcji dla modelu niestandardowego:
spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId
W odpowiedzi zanotuj datę we transcriptionDateTime
właściwości . Ta data to ostatnia data, w której można użyć niestandardowego modelu do transkrypcji. Właściwość adaptationDateTime
nie ma zastosowania, ponieważ modele niestandardowe nie są używane do trenowania innych modeli niestandardowych.
Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
"baseModel": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
},
"datasets": [
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
}
],
"links": {
"manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
"copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
},
"project": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-07-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-21T13:21:01Z",
"status": "Succeeded",
"createdDateTime": "2022-05-22T16:37:01Z",
"locale": "en-US",
"displayName": "My Model",
"description": "My Model Description"
}
Aby uzyskać pomoc dotyczącą interfejsu wiersza polecenia usługi Mowa w modelach, uruchom następujące polecenie:
spx help csr model
Aby uzyskać datę wygaśnięcia transkrypcji dla modelu niestandardowego, użyj operacji Models_GetCustomModel interfejsu API REST zamiany mowy na tekst.
Utwórz żądanie HTTP GET przy użyciu identyfikatora URI modelu, jak pokazano w poniższym przykładzie. Zastąp YourModelId
ciąg swoim identyfikatorem modelu, zastąp ciąg kluczem zasobu usługi Mowa i zastąp YourSubscriptionKey
YourServiceRegion
element regionem zasobu usługi Mowa.
curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
W odpowiedzi zanotuj datę we transcriptionDateTime
właściwości . Ta data to ostatnia data, w której można użyć niestandardowego modelu do transkrypcji. Właściwość adaptationDateTime
nie ma zastosowania, ponieważ modele niestandardowe nie są używane do trenowania innych modeli niestandardowych.
Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
"baseModel": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
},
"datasets": [
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
}
],
"links": {
"manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
"copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
},
"project": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
},
"properties": {
"deprecationDates": {
"adaptationDateTime": "2023-01-15T00:00:00Z",
"transcriptionDateTime": "2024-07-15T00:00:00Z"
}
},
"lastActionDateTime": "2022-05-21T13:21:01Z",
"status": "Succeeded",
"createdDateTime": "2022-05-22T16:37:01Z",
"locale": "en-US",
"displayName": "My Model",
"description": "My Model Description"
}