Présentation
Les capacités vocales de l’IA nous permettent de gérer des systèmes pour les secteurs de l’habitat et de l’automobile avec des instructions vocales, d’obtenir des réponses formulées par des ordinateurs à des questions parlées, de générer des sous-titres à partir de sources audio, etc.
Pour permettre ce type d’interaction, le système d’IA doit prendre en charge au moins deux fonctionnalités :
- Reconnaissance vocale : capacité à détecter et à interpréter des entrées parlées
- Synthèse vocale : capacité à générer une sortie parlée
Azure AI Speech fournit des fonctionnalités de reconnaissance vocale, de synthèse vocale et de traduction vocale en utilisant la reconnaissance et la synthèse vocales. Vous pouvez utiliser des modèles de service Speech prédéfinis et personnalisés pour diverses tâches comme la transcription de l’audio en texte avec une précision élevée, l’identification des orateurs dans les conversations et la création de voix personnalisées. Vous découvrirez ensuite comment fonctionnent les fonctionnalités d’AI Speech.