Transcriptions - Transcribe
Synchroniczna transkrypcja pliku audio.
POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15
Parametry identyfikatora URI
Nazwa | W | Wymagane | Typ | Opis |
---|---|---|---|---|
audio
|
formData | True |
file binary |
Zawartość pliku audio do transkrypcji. Plik audio musi być krótszy niż 2 godziny w czasie trwania dźwięku i mniejszy niż 250 MB rozmiaru. |
definition
|
formData |
string |
Metadane żądania transkrypcji. To pole zawiera obiekt serializowany w formacie JSON typu |
|
endpoint
|
path | True |
string |
Obsługiwane punkty końcowe usług Cognitive Services (protokół i nazwa hosta, na przykład: https://westus.api.cognitive.microsoft.com). |
api-version
|
query | True |
string |
Żądana wersja interfejsu API. |
Nagłówek żądania
Media Types: "multipart/form-data"
Nazwa | Wymagane | Typ | Opis |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Tutaj podaj klucz konta usług Cognitive Services. |
Odpowiedzi
Nazwa | Typ | Opis |
---|---|---|
200 OK |
OK |
|
Other Status Codes |
Wystąpił błąd. |
Zabezpieczenia
Ocp-Apim-Subscription-Key
Tutaj podaj klucz konta usług Cognitive Services.
Typ:
apiKey
W:
header
Przykłady
Transcribe an audio file
Przykładowe żądanie
POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15
Przykładowa odpowiedź
{
"durationMilliseconds": 2000,
"combinedPhrases": [
{
"text": "Weather"
}
],
"phrases": [
{
"offsetMilliseconds": 40,
"durationMilliseconds": 320,
"text": "Weather",
"words": [
{
"text": "weather",
"offsetMilliseconds": 40,
"durationMilliseconds": 320
}
],
"locale": "en-US",
"confidence": 0.78983736
}
]
}
Definicje
Nazwa | Opis |
---|---|
Channel |
Pełna transkrypcja na kanał. |
Detailed |
DetailedErrorCode |
Error |
Błąd |
Error |
Kod błędu |
Inner |
InnerError |
Phrase |
Transkrypcja frazy. |
Transcribe |
Wynik operacji transkrypcji. |
Word |
Wyraz z sygnaturą czasową w formularzu wyświetlania. |
ChannelCombinedPhrases
Pełna transkrypcja na kanał.
Nazwa | Typ | Opis |
---|---|---|
channel |
integer |
Indeks kanału oparty na 0. Występuje tylko wtedy, gdy separacja kanałów jest włączona. |
text |
string |
Transkrypcja tekstu. |
DetailedErrorCode
DetailedErrorCode
Nazwa | Typ | Opis |
---|---|---|
AudioLengthLimitExceeded |
string |
Plik audio jest dłuższy niż maksymalny dozwolony czas trwania. |
BadChannelConfiguration |
string |
Istnieje niezgodność między kanałami audio w danych, w konfiguracji lub wymaganiami aplikacji. |
DataImportFailed |
string |
Importowanie danych nie powiodło się. |
DeleteNotAllowed |
string |
Usuń niedozwolone. |
DeployNotAllowed |
string |
Wdrażanie jest niedozwolone. |
DeployingFailedModel |
string |
Wdrażanie modelu nie powiodło się. |
EmptyAudioFile |
string |
Plik dźwiękowy jest pusty. |
EmptyRequest |
string |
Puste żądanie. |
EndpointCannotBeDefault |
string |
Punkt końcowy nie może być domyślny. |
EndpointLoggingNotSupported |
string |
Rejestrowanie punktów końcowych nie jest obsługiwane. |
EndpointNotUpdatable |
string |
Punkt końcowy nie można aktualizować. |
EndpointWithoutLogging |
string |
Punkt końcowy bez rejestrowania. |
ExceededNumberOfRecordingsUris |
string |
Przekroczono liczbę nagrań uris. |
FailedDataset |
string |
Zestaw danych, który zakończył się niepowodzeniem. |
Forbidden |
string |
Zakazany. |
InUseViolation |
string |
Naruszenie użycia. |
InaccessibleCustomerStorage |
string |
Niedostępny magazyn klienta. |
InvalidAdaptationMapping |
string |
Nieprawidłowe mapowanie adaptacji. |
InvalidAudioFormat |
string |
Format audio wejściowego nie jest obsługiwany. |
InvalidBaseModel |
string |
Nieprawidłowy model podstawowy. |
InvalidCallbackUri |
string |
Nieprawidłowy identyfikator URI wywołania zwrotnego. |
InvalidChannelSpecification |
string |
Wybór kanałów w żądaniu transkrypcji nie jest obsługiwany (np. nie wybrano ani 0, ani 1). |
InvalidChannels |
string |
Nieprawidłowe kanały. |
InvalidCollection |
string |
Nieprawidłowa kolekcja. |
InvalidDataset |
string |
Nieprawidłowy zestaw danych. |
InvalidDocument |
string |
Nieprawidłowy dokument. |
InvalidDocumentBatch |
string |
Nieprawidłowa partia dokumentów. |
InvalidLocale |
string |
Nieprawidłowe ustawienia regionalne. |
InvalidLogDate |
string |
Nieprawidłowa data dziennika. |
InvalidLogEndTime |
string |
Nieprawidłowy czas zakończenia dziennika. |
InvalidLogId |
string |
Nieprawidłowy identyfikator dziennika. |
InvalidLogStartTime |
string |
Nieprawidłowy czas rozpoczęcia dziennika. |
InvalidModel |
string |
Nieprawidłowy model. |
InvalidModelUri |
string |
Nieprawidłowy identyfikator URI modelu. |
InvalidParameter |
string |
Nieprawidłowy parametr. |
InvalidParameterValue |
string |
Nieprawidłowa wartość parametru. |
InvalidPayload |
string |
Nieprawidłowy ładunek. |
InvalidPermissions |
string |
Nieprawidłowe uprawnienia. |
InvalidPrerequisite |
string |
Nieprawidłowe wymaganie wstępne. |
InvalidProductId |
string |
Nieprawidłowy identyfikator produktu. |
InvalidProject |
string |
Nieprawidłowy projekt. |
InvalidProjectKind |
string |
Nieprawidłowy rodzaj projektu. |
InvalidRecordingsUri |
string |
Nieprawidłowy identyfikator URI nagrań. |
InvalidRequestBodyFormat |
string |
Nieprawidłowy format treści żądania. |
InvalidSasValidityDuration |
string |
Nieprawidłowy czas ważności sygnatury dostępu współdzielonego. |
InvalidSkipTokenForLogs |
string |
Nieprawidłowy token pomijania dzienników. |
InvalidSourceAzureResourceId |
string |
Nieprawidłowy źródłowy identyfikator zasobu platformy Azure. |
InvalidSubscription |
string |
Nieprawidłowa subskrypcja. |
InvalidTest |
string |
Nieprawidłowy test. |
InvalidTimeToLive |
string |
Nieprawidłowy czas wygaśnięcia. |
InvalidTopForLogs |
string |
Nieprawidłowy górny element dla dzienników. |
InvalidTranscription |
string |
Nieprawidłowa transkrypcja. |
InvalidWebHookEventKind |
string |
Nieprawidłowy rodzaj zdarzenia elementu webhook. |
MissingInputRecords |
string |
Brak rekordów wejściowych. |
ModelCopyAuthorizationExpired |
string |
Wygasła metoda ModelCopyAuthorization. |
ModelDeploymentNotCompleteState |
string |
Wdrożenie modelu nie zostało ukończone. |
ModelDeprecated |
string |
Model jest przestarzały. |
ModelExists |
string |
Model istnieje. |
ModelMismatch |
string |
Niezgodność modelu. |
ModelNotDeployable |
string |
Nie można wdrożyć modelu. |
ModelVersionIncorrect |
string |
Nieprawidłowa wersja modelu. |
MultipleLanguagesIdentified |
string |
Identyfikacja języka rozpoznała wiele języków. Nie można określić języka dominującego. |
NoLanguageIdentified |
string |
Identyfikacja języka nie rozpoznała żadnego języka. |
NoUtf8WithBom |
string |
Brak utf8 z bom. |
OnlyOneOfUrlsOrContainerOrDataset |
string |
Tylko jeden z adresów URL lub kontenera lub zestawu danych. |
ProjectGenderMismatch |
string |
Niezgodność płci projektu. |
QuotaViolation |
string |
Naruszenie limitu przydziału. |
SingleDefaultEndpoint |
string |
Pojedynczy domyślny punkt końcowy. |
SkuLimitsExist |
string |
Istnieją limity jednostek SKU. |
SubscriptionNotFound |
string |
Nie można odnaleźć subskrypcji. |
UnexpectedError |
string |
Nieoczekiwany błąd. |
UnsupportedClassBasedAdaptation |
string |
Nieobsługiwana adaptacja oparta na klasach. |
UnsupportedDelta |
string |
Nieobsługiwana delta. |
UnsupportedDynamicConfiguration |
string |
Nieobsługiwana konfiguracja dynamiczna. |
UnsupportedFilter |
string |
Nieobsługiwany filtr. |
UnsupportedLanguageCode |
string |
Nieobsługiwany kod języka. |
UnsupportedOrderBy |
string |
Nieobsługiwana kolejność według. |
UnsupportedPagination |
string |
Nieobsługiwane stronicowanie. |
UnsupportedTimeRange |
string |
Nieobsługiwany zakres czasu. |
Error
Błąd
Nazwa | Typ | Opis |
---|---|---|
code |
Kod błędu |
|
details |
Error[] |
Dodatkowe szczegóły pomocnicze dotyczące błędów i/lub oczekiwanych zasad. |
innerError |
InnerError |
|
message |
string |
Komunikat o błędzie wysokiego poziomu. |
target |
string |
Źródło błędu. Na przykład będzie to "dokumenty" lub "identyfikator dokumentu" w przypadku nieprawidłowego dokumentu. |
ErrorCode
Kod błędu
Nazwa | Typ | Opis |
---|---|---|
Conflict |
string |
Reprezentowanie kodu błędu powodującego konflikt. |
Forbidden |
string |
Reprezentowanie niedozwolonego kodu błędu. |
InternalCommunicationFailed |
string |
Reprezentowanie wewnętrznego kodu błędu komunikacji nie powiodło się. |
InternalServerError |
string |
Reprezentowanie wewnętrznego kodu błędu serwera. |
InvalidArgument |
string |
Reprezentowanie nieprawidłowego kodu błędu argumentu. |
InvalidRequest |
string |
Reprezentowanie nieprawidłowego kodu błędu żądania. |
NotAllowed |
string |
Reprezentowanie niedozwolonego kodu błędu. |
NotFound |
string |
Reprezentacja kodu błędu, który nie został znaleziony. |
PipelineError |
string |
Reprezentowanie kodu błędu potoku. |
ServiceUnavailable |
string |
Reprezentowanie niedostępnego kodu błędu usługi. |
TooManyRequests |
string |
Reprezentując kod błędu zbyt wielu żądań. |
Unauthorized |
string |
Reprezentowanie nieautoryzowanego kodu błędu. |
UnprocessableEntity |
string |
Reprezentowanie nieprzetworzonego kodu błędu jednostki. |
UnsupportedMediaType |
string |
Reprezentowanie nieobsługiwanego kodu błędu typu nośnika. |
InnerError
InnerError
Nazwa | Typ | Opis |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Dodatkowe szczegóły pomocnicze dotyczące błędów i/lub oczekiwanych zasad. |
innerError |
InnerError |
|
message |
string |
Komunikat o błędzie wysokiego poziomu. |
target |
string |
Źródło błędu. Na przykład będzie to "dokumenty" lub "identyfikator dokumentu" w przypadku nieprawidłowego dokumentu. |
Phrase
Transkrypcja frazy.
Nazwa | Typ | Opis |
---|---|---|
channel |
integer |
Indeks kanału oparty na 0. Występuje tylko wtedy, gdy separacja kanałów jest włączona. |
confidence |
number |
Wartość ufności dla frazy. |
durationMilliseconds |
integer |
Czas trwania frazy w milisekundach. |
locale |
string |
Ustawienia regionalne frazy. |
offsetMilliseconds |
integer |
Przesunięcie początkowe frazy w milisekundach. |
speaker |
integer |
Unikatowa liczba całkowita przypisana do każdego głośnika wykrytego w dźwięku bez określonej kolejności. Występuje tylko wtedy, gdy włączono diaryzacja osoby mówiącej. |
text |
string |
Transkrypcja tekstu frazy. |
words |
Word[] |
Wyrazy tworzące frazę. Występuje tylko wtedy, gdy znaczniki czasu na poziomie wyrazów są włączone. |
TranscribeResult
Wynik operacji transkrypcji.
Nazwa | Typ | Opis |
---|---|---|
combinedPhrases |
Pełna transkrypcja dla każdego kanału. |
|
durationMilliseconds |
integer |
Czas trwania dźwięku w milisekundach. |
phrases |
Phrase[] |
Wyniki transkrypcji podzielone na frazy. |
Word
Wyraz z sygnaturą czasową w formularzu wyświetlania.
Nazwa | Typ | Opis |
---|---|---|
durationMilliseconds |
integer |
Czas trwania słowa w milisekundach. |
offsetMilliseconds |
integer |
Przesunięcie początkowe wyrazu w milisekundach. |
text |
string |
Rozpoznane słowo, w tym interpunkcja. |