Prise en charge linguistique dans Azure AI Video Indexer
Cet article explique les options de langue de Video Indexer et fournit une liste de prise en charge linguistique pour chacune d’elles. Il inclut la prise en charge des langues pour les fonctionnalités de Video Indexer, la traduction, l’identification de la langue, la personnalisation et les paramètres linguistiques du site web Video Indexer.
Langues prises en charge par scénario
Cette section explique les options de langue Video Indexer et présente une table des langues prises en charge pour chacune d’elles.
Important
Toutes les langues répertoriées prennent en charge la traduction lors de l’indexation via l’API.
Explications sur les colonnes
Langue source prise en charge : langue parlée dans le fichier multimédia prise en charge pour la transcription, la traduction et la recherche.
Identification de la langue : indique si la langue peut être détectée automatiquement par Video Indexer lorsque l’identification de langue est utilisée pour l’indexation. Pour plus d’informations, consultez Utiliser Azure AI Video Indexer pour identifier automatiquement les langues parlées et la section Identification de la langue.
Personnalisation (modèle de langage) : indique si la langue peut être utilisée lors de la personnalisation des modèles de langage dans Video Indexer. Pour plus d’informations, consultez Personnaliser un modèle de langage dans Azure AI Video Indexer.
Prononciation (modèle de langage) : indique si la langue peut être utilisée pour créer un jeu de données de prononciation dans le cadre d’un modèle vocal personnalisé. Pour plus d’informations, consultez Personnaliser un modèle speech avec Azure AI Video Indexer.
Traduction de site web : indique si la langue est prise en charge pour la traduction lors de l’utilisation du site web Azure AI Video Indexer. Sélectionnez la langue traduite dans le menu déroulant de la langue.
Les insights suivants sont traduits :
- Transcription
- Mots clés
- Rubriques
- Étiquettes
- Modèles de cadres (uniquement en hébreu pour le moment)
Toutes les autres informations s’affichent en anglais lors de l’utilisation de la traduction.
Langue du site web : indique si la langue peut être sélectionnée pour une utilisation sur le site web Azure AI Video Indexer. Sélectionnez l’icône Paramètres, puis sélectionnez la langue dans la liste déroulante Paramètres de langue.
Langage | Code | Supporté langue source |
Langue identification |
Personnalisation (modèle de langage) |
Prononciation (modèle de langage) |
Site internet Traduction |
Site internet Langue |
---|---|---|---|---|---|---|---|
Afrikaans | af-ZA | ✔ | |||||
Arabe (Israël) | ar-IL | ✔ | ✔ | ||||
Arabe (Irak) | ar-IQ | ✔ | ✔ | ||||
Arabe (Jordanie) | AR-JO | ✔ | ✔ | ✔ | |||
Arabe (Koweït) | ar-KW | ✔ | ✔ | ✔ | |||
Arabe (Liban) | ar-LB | ✔ | ✔ | ||||
Arabe (Oman) | ar-OM | ✔ | ✔ | ✔ | |||
Arabe (Autorité palestinienne) | ar-PS | ✔ | ✔ | ||||
Arabe (Qatar) | ar-QA | ✔ | ✔ | ✔ | |||
Arabe (Arabie saoudite) | ar-SA | ✔ | ✔ | ✔ | |||
Arabe (Émirats arabes unis) | ar-AE | ✔ | ✔ | ✔ | |||
Arabe (Égypte) | ar-EG | ✔ | ✔ | ✔ | ✔ | ||
Arabe standard moderne (Bahreïn) | ar-BH | ✔ | ✔ | ✔ | |||
Arabe (République arabe syrienne) | ar-SY | ✔ | ✔ | ✔ | |||
Arménien | hy-AM | ✔ | |||||
Bangla | bn-BD | ✔ | |||||
Bosniaque | bs-Latn | ✔ | |||||
Bulgare | bg-BG | ✔ | ✔ | ✔ | |||
Catalan | ca-ES | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinois (cantonais traditionnel) | zh-HK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Chinois (simplifié) | zh-Hans | ✔ | ✔ | ✔ | ✔ | ||
Chinois (simplifié) | zh-CK | ✔ | ✔ | ✔ | ✔ | ||
Chinois (traditionnel) | zh-Hant | ✔ | |||||
Croate | hr-HR | ✔ | ✔ | ✔ | ✔ | ||
Tchèque | cs-CZ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Danois | da-DK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Néerlandais | nl-NL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Anglais (Australie) | en-AU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Anglais (Royaume-Uni) | en-GB | ✔ | ✔ | ✔ | ✔ | ✔ | |
Anglais (États-Unis) | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Estonien | Et-EE | ✔ | ✔ | ✔ | ✔ | ✔ | |
Fidjien | en-FJ | ✔ | |||||
Filipino | fil-PH | ✔ | |||||
Finnois | fi-FI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Français | fr-FR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Français (Canada) | fr-CA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Allemand | de-DE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Grec | el-GR | ✔ | ✔ | ✔ | |||
Goudjrati | gu-IN | ✔ | ✔ | ✔ | |||
Haïtien | fr-HT | ✔ | |||||
Hébreu | he-IL | ✔ | ✔ | ✔ | ✔ | ||
Hindi | hi-IN | ✔ | ✔ | ✔ | ✔ | ✔ | |
Hongrois | hu-HU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Islandais | is-IS | ✔ | |||||
Indonésien | id-ID | ✔ | ✔ | ✔ | |||
Irlandais | ga-IE | ✔ | ✔ | ✔ | ✔ | ||
Italien | it-IT | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Japonais | ja-JP | ✔ | ✔ | ✔ | ✔ | ✔ | |
Kannada | kn-IN | ✔ | ✔ | ||||
Kiswahili | sw-KE | ✔ | |||||
Coréen | ko-KR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Letton | lv-LV | ✔ | ✔ | ✔ | ✔ | ✔ | |
Lituanien | lt-LT | ✔ | ✔ | ✔ | |||
Malgache | mg-MG | ✔ | |||||
Malais | ms-MY | ✔ | ✔ | ||||
Malayalam | ml-IN | ✔ | ✔ | ||||
Maltais | mt-MT | ✔ | |||||
Norvégien | nb-NO | ✔ | ✔ | ✔ | ✔ | ||
Persan | fa-IR | ✔ | ✔ | ✔ | |||
Polonais | pl-PL | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugais | pt-br | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Portugais (Portugal) | pt-PT | ✔ | ✔ | ✔ | ✔ | ✔ | |
Roumain | ro-RO | ✔ | ✔ | ✔ | ✔ | ✔ | |
Russe | ru-RU | ✔ | ✔ | ✔ | ✔ | ✔ | |
Samoan | en-WS | ||||||
Serbe (cyrillique) | sr-Cyrl-RS | ✔ | |||||
Serbe (latin) | sr-Latn-RS | ✔ | |||||
Slovaque | sk-SK | ✔ | ✔ | ✔ | ✔ | ✔ | |
Slovène | sl-SI | ✔ | ✔ | ✔ | ✔ | ✔ | |
Espagnol | es-ES | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Espagnol (Mexique) | es-MX | ✔ | ✔ | ✔ | ✔ | ✔ | |
Suédois | sv-SE | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
Tamoul | ta-IN | ✔ | ✔ | ✔ | |||
Télougou | te-IN | ✔ | ✔ | ||||
Thaï | th-TH | ✔ | ✔ | ✔ | ✔ | ||
Tonga | to-TO | ✔ | |||||
Turc | tr-TR | ✔ | ✔ | ✔ | ✔ | ✔ | |
Ukrainien | uk-UA | ✔ | ✔ | ✔ | |||
Ourdou | ur-PK | ✔ | |||||
Vietnamien | vi-VN | ✔ | ✔ | ✔ |
Obtenir les langues prises en charge via l’API
Utilisez l’appel d’API Obtenir les langues prises en charge pour extraire une liste complète des langues prises en charge par zone. Pour plus d’informations, consultez Obtenir les langues prises en charge.
L’API retourne une liste de langues prises en charge avec les valeurs suivantes :
{
"name": "Language",
"languageCode": "Code",
"isRightToLeft": true/false,
"isSourceLanguage": true/false,
"isAutoDetect": true/false
}
Langue source prise en charge :
Si
isSourceLanguage
la valeur est false, la langue est prise en charge uniquement pour la traduction. SiisSourceLanguage
la valeur est true, la langue est prise en charge comme source de transcription, de traduction et de recherche.Identification de la langue (détection automatique) :
Si
isAutoDetect
la valeur est true, la langue est prise en charge pour l’identification linguistique (LID) et l’identification multi-langues (MLID).
Identification linguistique
Lorsque vous chargez un fichier multimédia dans Video Indexer, vous pouvez spécifier la langue source du fichier multimédia. Si vous indexez un fichier via le site web Video Indexer, vous pouvez le faire en sélectionnant une langue pendant le chargement du fichier. Si vous soumettez la tâche d’indexation via l’API, elle est effectuée à l’aide du paramètre de langage. La langue sélectionnée est ensuite utilisée pour générer la transcription du fichier.
Si vous n’êtes pas sûr de la langue source du fichier multimédia ou qu’il peut contenir plusieurs langues, Video Indexer peut détecter les langues parlées. Si vous sélectionnez Détection automatique d’une langue unique (LID) ou multi-langues (MLID) pour la langue source du fichier multimédia, la langue ou les langues détectées sont utilisées pour transcrire le fichier multimédia. Pour en savoir plus sur LID et MLID, consultez Utiliser Azure AI Video Indexer pour identifier automatiquement les langues parlées, voir Identifier automatiquement la langue parlée avec le modèle d’identification de langue et identifier et transcrire automatiquement du contenu multilingue
Il existe une limite de 10 langues autorisées pour l’identification pendant l’indexation d’un fichier multimédia pour LID et MLID. Voici les 9 langues par défaut de l’identification linguistique (LID) et de l’identification multi-langues (MILD) :
- Allemand (de-DE)
- Anglais États-Unis (en-US)
- Espagnol (es-ES)
- Français (fr-FR)
- Italien (it-IT)
- Japonais (ja-JP)
- Portugais (pt-BR)
- Russe (ru-RU)
- Chinois (simplifié) (zh-Hans)
Comment modifier la liste des langues par défaut
Si vous devez utiliser des langues pour l’identification qui ne sont pas utilisées par défaut, vous pouvez personnaliser la liste sur 10 langues qui prennent en charge la personnalisation via le site web ou l’API :
Utiliser le site web pour modifier la liste
Sélectionnez l’onglet ID de langue sous Personnalisation du modèle. La liste des langues est spécifique au compte Video Indexer que vous utilisez et pour l’utilisateur connecté. La liste par défaut des langues est enregistrée par utilisateur sur son appareil local, par appareil et par navigateur. Par conséquent, chaque utilisateur peut configurer sa propre liste de langues identifiée par défaut.
Utilisez Ajouter une langue pour rechercher et ajouter d’autres langues. Si 10 langues sont déjà sélectionnées, vous devez d’abord supprimer l’une des langues détectées existantes avant d’en ajouter une nouvelle.
Utiliser l’API pour modifier la liste
Lorsque vous chargez un fichier, le modèle de langue Video Indexer fait référence à 9 langues par défaut. S’il existe une correspondance, le modèle génère la transcription du fichier avec la langue détectée.
Utilisez le paramètre de langage pour spécifier multi
des paramètres (MLID) ou auto
(LID). Utilisez le customLanguages
paramètre pour spécifier jusqu’à 10 langues. (Le paramètre est utilisé uniquement lorsque le paramètre de langue est défini multi
sur ou auto
.) Pour en savoir plus sur l’utilisation de l’API, consultez Utiliser l’API Azure AI Video Indexer.