ActivationSignalDetectionTrainingDataFormat Enumeration
Definition
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Gibt die Vom ActivationSignalDetector unterstützten Aktivierungssignaltrainingsdatenformate für die digitale Assistent an.
public enum class ActivationSignalDetectionTrainingDataFormat
/// [Windows.Foundation.Metadata.ContractVersion(Windows.Foundation.UniversalApiContract, 655360)]
enum class ActivationSignalDetectionTrainingDataFormat
[Windows.Foundation.Metadata.ContractVersion(typeof(Windows.Foundation.UniversalApiContract), 655360)]
public enum ActivationSignalDetectionTrainingDataFormat
var value = Windows.ApplicationModel.ConversationalAgent.ActivationSignalDetectionTrainingDataFormat.voice8kHz8BitMono
Public Enum ActivationSignalDetectionTrainingDataFormat
- Vererbung
-
ActivationSignalDetectionTrainingDataFormat
- Attribute
Windows-Anforderungen
Gerätefamilie |
Windows 10, version 2004 (eingeführt in 10.0.19041.0)
|
API contract |
Windows.Foundation.UniversalApiContract (eingeführt in v10.0)
|
Felder
Audio44kHz16BitMono | 6 | Trainingsdaten sind generische Audiodaten in 16-Bit 44kHz Mono. |
Audio44kHz8BitMono | 5 | Trainingsdaten sind generische Audiodaten in 8-Bit 44kHz Mono. |
Audio48kHz16BitMono | 8 | Trainingsdaten sind generische Audiodaten in 16-Bit-Mono mit 48 kHz. |
Audio48kHz8BitMono | 7 | Trainingsdaten sind generische Audiodaten in 8-Bit-Mono mit 48 kHz. |
AudioOEMDefined | 9 | Trainingsdaten sind generische Audiodaten in einem format, das von einem Hardwareanbieter angegeben wird. |
OtherOEMDefined | 10 | Trainingsdaten haben ein format, das von einem Hardwareanbieter angegeben wird. |
Voice16kHz16BitMono | 3 | Trainingsdaten sind Sprachaudio in 16-Bit-Mono mit 16 kHz. |
Voice16kHz8BitMono | 2 | Trainingsdaten sind Sprachaudio in 8-Bit-Mono mit 16 kHz. |
Voice8kHz16BitMono | 1 | Trainingsdaten sind Sprachaudio in 16-Bit-Mono mit 8 kHz. |
Voice8kHz8BitMono | 0 | Trainingsdaten sind Sprachaudio in 8 Bit 8kHz Mono. |
VoiceOEMDefined | 4 | Trainingsdaten sind Sprachaudio, die von einem OEM definiert werden. |
Hinweise
Digitale Assistent-Anwendungen können Schlüsselwort (keyword) Detektoren trainieren, um die Stimme eines einzelnen Benutzers genauer zu erkennen, indem sie algorithmische Anpassungen auf den Detektor basierend auf Sprachdaten anwenden (der Detektor bietet diese Anpassungen). Beispielsweise trainieren Sie einen gesprochenen Schlüsselwort (keyword)-Detektor, um die Schlüsselwort (keyword) nur dann zu erkennen, wenn sie von einer bestimmten Person gesprochen wird.
Dies wird durch eine Reihe von AktivierungSignalDetectionConfiguration-Trainingsschritten erreicht, bei denen jeder Schritt ein logisches Fragment von Spracheingabedaten verwendet.