Delen via


Audio en transcripties vastleggen voor spraakherkenning

U kunt logboekregistratie inschakelen voor zowel audio-invoer als herkende spraak wanneer u spraak naar tekst of spraakomzetting gebruikt. Voor spraakomzetting worden alleen de audio en transcriptie van de oorspronkelijke audio vastgelegd. De vertalingen worden niet geregistreerd. In dit artikel wordt beschreven hoe u de audio- en transcriptielogboeken inschakelt, opent en verwijdert.

Audio- en transcriptielogboeken kunnen worden gebruikt als invoer voor aangepaste spraakmodeltraining . Mogelijk hebt u andere gebruiksvoorbeelden.

Waarschuwing

Niet afhankelijk van audio- en transcriptielogboeken wanneer de exacte opname van invoeraudio is vereist. In de perioden van piekbelasting geeft de service prioriteit aan hardwarebronnen voor transcriptietaken. Dit kan ertoe leiden dat kleine delen van de audio niet worden geregistreerd. Dergelijke gelegenheden zijn zeldzaam, maar toch mogelijk.

Logboekregistratie wordt asynchroon uitgevoerd voor zowel basis- als aangepaste modeleindpunten. De Speech-service slaat audio- en transcriptielogboeken op in de interne opslag en niet lokaal geschreven. De logboeken worden 30 dagen bewaard. Na deze periode worden de logboeken automatisch verwijderd. U kunt echter op elk gewenst moment specifieke logboeken of een reeks beschikbare logboeken verwijderen .

U kunt ook audio- en transcriptielogboeken opslaan in een Azure Storage-account dat u bezit en bepaalt in plaats van spraakservice-premises met behulp van BYOS-technologie (Bring-Your-Own Storage). Zie meer informatie over het gebruik van spraakresource met BYOS-functionaliteit in dit artikel.

Logboekregistratie van audio en transcriptie inschakelen

Logboekregistratie is standaard uitgeschakeld. Logboekregistratie kan per herkenningssessie of per aangepast modeleindpunt worden ingeschakeld.

Logboekregistratie inschakelen voor één herkenningssessie

U kunt logboekregistratie inschakelen voor één herkenningssessie, ongeacht of u het standaardbasismodel of het aangepaste modeleindpunt gebruikt.

Waarschuwing

Voor aangepaste modeleindpunten krijgt de instelling voor logboekregistratie van uw geïmplementeerde eindpunt prioriteit boven de instelling op sessieniveau (SDK of REST API). Als logboekregistratie is ingeschakeld voor het eindpunt van het aangepaste model, wordt de instelling op sessieniveau (of deze is ingesteld op waar of onwaar) genegeerd. Als logboekregistratie niet is ingeschakeld voor het aangepaste modeleindpunt, bepaalt de instelling op sessieniveau of logboekregistratie actief is.

Logboekregistratie inschakelen voor spraak-naar-tekst met de Speech SDK

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode EnableAudioLogging() van het SpeechConfig-klasse-exemplaar uit.

speechConfig.EnableAudioLogging();

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SpeechServiceConnection_EnableAudioLogging eigenschap op:

string isAudioLoggingEnabled = speechConfig.GetProperty(PropertyId.SpeechServiceConnection_EnableAudioLogging);

Elke SpeechRecognizer waarvoor dit speechConfig wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode EnableAudioLogging van het SpeechConfig-klasse-exemplaar uit.

speechConfig->EnableAudioLogging();

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SpeechServiceConnection_EnableAudioLogging eigenschap op:

string isAudioLoggingEnabled = speechConfig->GetProperty(PropertyId::SpeechServiceConnection_EnableAudioLogging);

Elke SpeechRecognizer waarvoor dit speechConfig wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode enableAudioLogging() van het SpeechConfig-klasse-exemplaar uit.

speechConfig.enableAudioLogging();

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SpeechServiceConnection_EnableAudioLogging eigenschap op:

String isAudioLoggingEnabled = speechConfig.getProperty(PropertyId.SpeechServiceConnection_EnableAudioLogging);

Elke SpeechRecognizer waarvoor dit speechConfig wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode enableAudioLogging() van het SpeechConfig-klasse-exemplaar uit.

speechConfig.enableAudioLogging();

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SpeechServiceConnection_EnableAudioLogging eigenschap op:

var SpeechSDK;
SpeechSDK = speechSdk;
// <...>
string isAudioLoggingEnabled = speechConfig.getProperty(SpeechSDK.PropertyId.SpeechServiceConnection_EnableAudioLogging);

Elke SpeechRecognizer waarvoor dit speechConfig wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode enable_audio_logging van het SpeechConfig-klasse-exemplaar uit.

speech_config.enable_audio_logging()

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SpeechServiceConnection_EnableAudioLogging eigenschap op:

import azure.cognitiveservices.speech as speechsdk
# <...>
is_audio_logging_enabled = speech_config.get_property(property_id=speechsdk.PropertyId.SpeechServiceConnection_EnableAudioLogging)

Elke SpeechRecognizer waarvoor dit speech_config wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode enableAudioLogging uit van het SPXSpeechConfiguration-klasse-exemplaar .

[speechConfig enableAudioLogging];

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SPXSpeechServiceConnectionEnableAudioLogging eigenschap op:

NSString *isAudioLoggingEnabled = [speechConfig getPropertyById:SPXSpeechServiceConnectionEnableAudioLogging];

Elke SpeechRecognizer waarvoor dit speechConfig wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Logboekregistratie inschakelen voor spraakomzetting met de Speech SDK

Voor spraakomzetting worden alleen de audio en transcriptie van de oorspronkelijke audio vastgelegd. De vertalingen worden niet geregistreerd.

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode EnableAudioLogging() van het SpeechTranslationConfig-klasse-exemplaar uit.

speechTranslationConfig.EnableAudioLogging();

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SpeechServiceConnection_EnableAudioLogging eigenschap op:

string isAudioLoggingEnabled = speechTranslationConfig.GetProperty(PropertyId.SpeechServiceConnection_EnableAudioLogging);

Elke TranslationRecognizer waarvoor dit speechTranslationConfig wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode EnableAudioLogging van het SpeechTranslationConfig-klasse-exemplaar uit.

speechTranslationConfig->EnableAudioLogging();

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SpeechServiceConnection_EnableAudioLogging eigenschap op:

string isAudioLoggingEnabled = speechTranslationConfig->GetProperty(PropertyId::SpeechServiceConnection_EnableAudioLogging);

Elke TranslationRecognizer waarvoor dit speechTranslationConfig wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode enableAudioLogging() van het SpeechTranslationConfig-klasse-exemplaar uit.

speechTranslationConfig.enableAudioLogging();

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SpeechServiceConnection_EnableAudioLogging eigenschap op:

String isAudioLoggingEnabled = speechTranslationConfig.getProperty(PropertyId.SpeechServiceConnection_EnableAudioLogging);

Elke TranslationRecognizer waarvoor dit speechTranslationConfig wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode enableAudioLogging() van het SpeechTranslationConfig-klasse-exemplaar uit.

speechTranslationConfig.enableAudioLogging();

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SpeechServiceConnection_EnableAudioLogging eigenschap op:

var SpeechSDK;
SpeechSDK = speechSdk;
// <...>
string isAudioLoggingEnabled = speechTranslationConfig.getProperty(SpeechSDK.PropertyId.SpeechServiceConnection_EnableAudioLogging);

Elke TranslationRecognizer waarvoor dit speechTranslationConfig wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Als u audio- en transcriptielogboekregistratie wilt inschakelen met de Speech SDK, voert u de methode enable_audio_logging van het SpeechTranslationConfig-klasse-exemplaar uit.

speech_translation_config.enable_audio_logging()

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SpeechServiceConnection_EnableAudioLogging eigenschap op:

import azure.cognitiveservices.speech as speechsdk
# <...>
is_audio_logging_enabled = speech_translation_config.get_property(property_id=speechsdk.PropertyId.SpeechServiceConnection_EnableAudioLogging)

Elke TranslationRecognizer waarvoor dit speech_translation_config wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Als u audio- en transcriptielogboekregistratie met de Speech SDK wilt inschakelen, voert u de methode enableAudioLogging uit van het SPXSpeechTranslationConfiguration-klasse-exemplaar .

[speechTranslationConfig enableAudioLogging];

Als u wilt controleren of logboekregistratie is ingeschakeld, haalt u de waarde van de SPXSpeechServiceConnectionEnableAudioLogging eigenschap op:

NSString *isAudioLoggingEnabled = [speechTranslationConfig getPropertyById:SPXSpeechServiceConnectionEnableAudioLogging];

Elke TranslationRecognizer waarvoor dit speechTranslationConfig wordt gebruikt, heeft logboekregistratie voor audio en transcriptie ingeschakeld.

Logboekregistratie inschakelen voor spraak naar tekst REST API voor korte audio

Als u Speech to text REST API gebruikt voor korte audio en logboekregistratie van audio en transcriptie wilt inschakelen, moet u de queryparameter en -waarde storeAudio=true gebruiken als onderdeel van uw REST-aanvraag. Een voorbeeldaanvraag ziet er als volgt uit:

https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?language=en-US&storeAudio=true

Logboekregistratie voor audio en transcriptie inschakelen voor een aangepast modeleindpunt

Deze methode is alleen van toepassing op aangepaste spraakeindpunten .

Logboekregistratie kan worden ingeschakeld of uitgeschakeld in de instellingen van het permanente aangepaste modeleindpunt. Wanneer logboekregistratie is ingeschakeld (ingeschakeld) voor een aangepast modeleindpunt, hoeft u logboekregistratie niet in te schakelen op het niveau van de herkenningssessie met de SDK of REST API. Zelfs wanneer logboekregistratie niet is ingeschakeld voor een aangepast modeleindpunt, kunt u logboekregistratie tijdelijk inschakelen op het niveau van de herkenningssessie met de SDK of REST API.

Waarschuwing

Voor aangepaste modeleindpunten krijgt de instelling voor logboekregistratie van uw geïmplementeerde eindpunt prioriteit boven de instelling op sessieniveau (SDK of REST API). Als logboekregistratie is ingeschakeld voor het eindpunt van het aangepaste model, wordt de instelling op sessieniveau (of deze is ingesteld op waar of onwaar) genegeerd. Als logboekregistratie niet is ingeschakeld voor het aangepaste modeleindpunt, bepaalt de instelling op sessieniveau of logboekregistratie actief is.

U kunt logboekregistratie voor audio en transcriptie inschakelen voor een aangepast modeleindpunt:

Logboekregistratie uitschakelen voor een aangepast modeleindpunt

Als u de logboekregistratie van audio en transcriptie voor een aangepast modeleindpunt wilt uitschakelen, moet u de instelling voor permanente eindpuntregistratie bijwerken met behulp van de Speech-naar-tekst-REST API. Er is geen manier om logboekregistratie uit te schakelen voor een bestaand aangepast modeleindpunt met behulp van Speech Studio.

Als u logboekregistratie voor een aangepast eindpunt wilt uitschakelen, gebruikt u de Endpoints_Update bewerking van de REST API voor spraak naar tekst. Bouw de aanvraagbody volgens de volgende instructies:

  • Stel de contentLoggingEnabled eigenschap in properties. Stel deze eigenschap in om true logboekregistratie van het verkeer van het eindpunt in te schakelen. Stel deze eigenschap in om logboekregistratie van het verkeer van het eindpunt uit te false schakelen.

Maak een HTTP PATCH-aanvraag met behulp van de URI, zoals wordt weergegeven in het volgende voorbeeld. Vervang YourSubscriptionKey door uw Spraak-resourcesleutel, vervang door YourServiceRegion uw Spraak-resourceregio, vervang door YourEndpointId uw eindpunt-id en stel de eigenschappen van de aanvraagbody in zoals eerder beschreven.

curl -v -X PATCH -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
  "properties": {
    "contentLoggingEnabled": false
  },
}'  "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/YourEndpointId"

U ontvangt een antwoordtekst in de volgende indeling:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
  },
  "links": {
    "logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
    "restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
    "webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
  },
  "properties": {
    "loggingEnabled": false
  },
  "lastActionDateTime": "2024-07-15T16:30:12Z",
  "status": "Succeeded",
  "createdDateTime": "2024-07-15T16:29:36Z",
  "locale": "en-US",
  "displayName": "My Endpoint",
  "description": "My Endpoint Description"
}

De hoofdtekst van het antwoord moet de nieuwe instelling weerspiegelen. De naam van de eigenschap logboekregistratie in het antwoord (loggingEnabled) verschilt van de naam van de eigenschap voor logboekregistratie die u in de aanvraag (contentLoggingEnabled) hebt ingesteld.

Audio- en transcriptielogboeken ophalen

U hebt toegang tot audio- en transcriptielogboeken met behulp van speech-naar-tekst-REST API. Voor aangepaste modeleindpunten kunt u ook Speech Studio gebruiken. Zie de details in de volgende secties.

Notitie

Logboekregistratiegegevens worden 30 dagen bewaard. Na deze periode worden de logboeken automatisch verwijderd. U kunt echter op elk gewenst moment specifieke logboeken of een reeks beschikbare logboeken verwijderen .

Audio- en transcriptielogboeken ophalen met Speech Studio

Deze methode is alleen van toepassing op aangepaste modeleindpunten .

De eindpuntlogboeken downloaden:

  1. Meld u aan bij Speech Studio.
  2. Selecteer Aangepaste spraak> Uw projectnaam >Modellen implementeren.
  3. Selecteer de koppeling op eindpuntnaam.
  4. Selecteer Onder Logboekregistratie van inhoud het logboek Downloaden.

Met deze methode kunt u alle beschikbare logboeksets tegelijk downloaden. U kunt geselecteerde logboeksets niet downloaden in Speech Studio.

Audio- en transcriptielogboeken ophalen met speech-naar-tekst-REST API

U kunt alle of een subset van beschikbare logboeksets downloaden.

Deze methode is van toepassing op basis- en aangepaste modeleindpunten . Audio- en transcriptielogboeken weergeven en downloaden:

  • Basismodellen: gebruik de Endpoints_ListBaseModelLogs bewerking van de REST API voor spraak naar tekst. Met deze bewerking wordt de lijst met audio- en transcriptielogboeken opgevraagd die worden opgeslagen wanneer u het standaardbasismodel van een bepaalde taal gebruikt.
  • Aangepaste modeleindpunten: gebruik de Endpoints_ListLogs bewerking van de REST API voor spraak-naar-tekst. Met deze bewerking wordt de lijst met audio- en transcriptielogboeken opgeslagen voor een bepaald eindpunt.

Logboek-id's ophalen met speech-naar-tekst-REST API

In sommige scenario's moet u mogelijk id's van de beschikbare logboeken ophalen. U kunt bijvoorbeeld een specifiek logboek verwijderen, zoals verderop in dit artikel wordt beschreven.

Ga als volgende te werk om id's van de beschikbare logboeken op te halen:

  • Basismodellen: gebruik de Endpoints_ListBaseModelLogs bewerking van de REST API voor spraak naar tekst. Met deze bewerking wordt de lijst met audio- en transcriptielogboeken opgevraagd die worden opgeslagen wanneer u het standaardbasismodel van een bepaalde taal gebruikt.
  • Aangepaste modeleindpunten: gebruik de Endpoints_ListLogs bewerking van de REST API voor spraak-naar-tekst. Met deze bewerking wordt de lijst met audio- en transcriptielogboeken opgeslagen voor een bepaald eindpunt.

Hier volgt een voorbeeld van Endpoints_ListLogs. Ter vereenvoudiging wordt slechts één logboekset weergegeven:

{
  "values": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/files/logs/2023-03-13_163715__0420c53d-e6ac-4857-bce0-f39c3f9f5ff9_v2_json",
      "name": "163715__0420c53d-e6ac-4857-bce0-f39c3f9f5ff9.v2.json",
      "kind": "Transcription",
      "properties": {
        "size": 79920
      },
      "createdDateTime": "2024-07-15T16:29:36Z",
      "links": {
        "contentUrl": "<Link to download log file>"
      }
    },
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/files/logs/2023-03-13_163715__0420c53d-e6ac-4857-bce0-f39c3f9f5ff9_wav",
      "name": "163715__0420c53d-e6ac-4857-bce0-f39c3f9f5ff9.wav",
      "kind": "Audio",
      "properties": {
        "size": 932966
      },
      "createdDateTime": "2024-07-15T16:29:36Z",
      "links": {
        "contentUrl": "<Link to download log file>"
      }
    }
  ]
}

De locaties van elk audio- en transcriptielogboekbestand worden geretourneerd in de hoofdtekst van het antwoord. Zie de bijbehorende kind eigenschap om te bepalen of het bestand de audio ("kind": "Audio") of de transcriptie ("kind": "Transcription") bevat.

De logboek-id voor elk logboekbestand is het laatste deel van de URL in de "self" elementwaarde. De logboek-id in het volgende voorbeeld is 2023-03-13_163715__0420c53d-e6ac-4857-bce0-f39c3f9f5ff9_v2_json.

"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx/files/logs/2023-03-13_163715__0420c53d-e6ac-4857-bce0-f39c3f9f5ff9_v2_json"

Audio- en transcriptielogboeken verwijderen

Logboekregistratiegegevens worden 30 dagen bewaard. Na deze periode worden de logboeken automatisch verwijderd. U kunt echter op elk gewenst moment specifieke logboeken of een reeks beschikbare logboeken verwijderen.

Voor elk basis- of aangepast modeleindpunt kunt u alle beschikbare logboeken, logboeken voor een bepaald tijdsbestek of een bepaald logboek verwijderen op basis van de bijbehorende logboek-id. Het verwijderingsproces wordt asynchroon uitgevoerd en kan minuten, uren, één dag of langer duren, afhankelijk van het aantal logboekbestanden.

Als u audio- en transcriptielogboeken wilt verwijderen, moet u de Speech to Text REST API gebruiken. Er is geen manier om logboeken te verwijderen met behulp van Speech Studio.

Alle logboeken of logboeken voor een bepaald tijdsbestek verwijderen

Alle logboeken of logboeken voor een bepaald tijdsbestek verwijderen:

Stel desgewenst de endDate verwijdering van de audiologboeken in (specifieke dag, UTC). Verwachte notatie: "jjjj-mm-dd". Bijvoorbeeld: '2023-03-15' resulteert in het verwijderen van alle logboeken op 15 maart 2023 en eerder.

Specifiek logboek verwijderen

Ga als volgt te werk om een specifiek logboek op id te verwijderen:

Zie een vorige sectie Logboek-id's ophalen met Rest API voor spraak-naar-tekst voor meer informatie over het ophalen van logboek-id's.

Omdat audio- en transcriptielogboeken afzonderlijke id's (zoals id's 2023-03-13_163715__0420c53d-e6ac-4857-bce0-f39c3f9f5ff9_v2_json en 2023-03-13_163715__0420c53d-e6ac-4857-bce0-f39c3f9f5ff9_wav uit een vorig voorbeeld in dit artikel) hebben, moet u zowel de audio- als transcriptielogboeken verwijderen door id-aanvragen .

Volgende stappen