Le guide de configuration de l’indexation

Article
11/04/2024

Vous pouvez utiliser les paramètres d’indexation par défaut ou les ajuster. Vous pouvez choisir la langue, l’indexation, les modèles personnalisés et les paramètres de streaming qui ont des implications sur les insights générés, les coûts et les performances.

Cet article explique chacune des options. Les mêmes options s’appliquent lors de l’utilisation du site web Azure AI Video Indexer que pour l’utilisation de l’API (consultez le guide de l’API). Lors de l’indexation de grands volumes, suivez le guide à l’échelle.

Paramètres par défaut

Par défaut, Azure AI Video Indexer est configuré comme suit :

Langue source : Anglais
Confidentialité : privé
Paramètre audio et vidéo : standard
Qualité de la diffusion en continu : débit binaire unique

Langue source de la vidéo

Si vous connaissez la langue parlée dans la vidéo, sélectionnez la langue dans la liste des langues sources de la vidéo. Si vous avez des doutes sur la langue de la vidéo, choisissez Détecter automatiquement une seule langue. Azure AI Video Indexer utilise l’identification de langue (LID) pour détecter la langue des vidéos et générer des transcriptions et des insights avec la langue détectée.

Si la vidéo contient plusieurs langues et que vous ne savez pas quelles langues, sélectionnez Détecter automatiquement plusieurs langues. Dans ce cas, la détection multi-langage (MLID) est appliquée lors du chargement et de l’indexation de votre vidéo.

Bien que la détection automatique soit une excellente option lorsque la langue de vos vidéos varie, il existe deux points à prendre en compte lors de l’utilisation de LID ou MLID :

LID/MLID ne prend pas en charge toutes les langues prises en charge par Azure AI Video Indexer.
La transcription est d’une qualité supérieure lorsque vous préélectionnez la langue appropriée de la vidéo.

En savoir plus sur la prise en charge des langues et les langues prises en charge.

Confidentialité

Cette option vous permet de déterminer si les insights ne doivent être accessibles qu’aux utilisateurs de votre compte Azure AI Video Indexer ou à toute personne disposant d’un lien.

Options d’indexation

Chacune des options d’indexation audio et vidéo peut être facturée différemment lorsque vous utilisez les paramètres d’indexation par défaut. Pour plus d’informations, consultez la tarification d’Azure AI Video Indexer.

Voici les options de type d’indexation avec les détails de leurs insights fournis. Pour modifier le type d’indexation, sélectionnez Paramètres avancés.

Remarque

La reconnaissance optique de caractères (OCR) est utilisée avec plusieurs types d’insights.

Paramètres avancés

Audio uniquement

De base : Indexe et extrait des insights à l’aide de l’audio uniquement (en ignorant la vidéo) et fournit les insights suivants : transcription, traduction, mise en forme des légendes et sous-titres de sortie (sous-titres).
Standard : Indexe et extrait des insights à l’aide de l’audio uniquement (ignorant la vidéo) et fournit les insights suivants : transcription, traduction, mise en forme des légendes de sortie et sous-titres (sous-titres), détection automatique des langues, émotions, mots clés, entités nommées (marques, emplacements, personnes), sentiments, orateurs, extraction de rubriques et con mode tente ration textuelle.
Avancé : Indexe et extrait des insights à l’aide de l’audio uniquement (en ignorant la vidéo) et fournit les insights suivants : transcription, traduction, mise en forme des légendes et sous-titres de sortie (sous-titres), détection automatique des langues, détection d’événements audio, émotions, mots clés, entités nommées (marques, emplacements, personnes), sentiments, intervenants, extraction de rubriques et con mode tente ration textuelle.

Vidéo uniquement

De base : Indexe et extrait des insights à l’aide de la vidéo uniquement (ignorant l’audio) et fournit les insights suivants : étiquettes, détection d’objets, OCR, scènes (images clés et captures) et détection de trames noires.
Standard : Indexe et extrait des insights à l’aide de vidéos uniquement (ignorant l’audio) et fournit les insights suivants : étiquettes (OCR), entités nommées (OCR - marques, emplacements, personnes), OCR, personnes, scènes (images clés et images), images noires, con mode tente ration visuelle et extraction de rubriques (OCR).
Avancé : Indexe et extrait des insights à l’aide de la vidéo uniquement (en ignorant l’audio) et fournit les insights suivants : étiquettes (OCR), personne mise en correspondance, entités nommées (OCR - marques, emplacements, personnes), OCR, personnes observées, scènes (images clés et captures), détection de carte de clapper, détection de modèles numériques, aperçu des vêtements, détection d’ardoise textuel, détection de logo textuel, images noires, con mode tente ration et extraction de rubriques (OCR).

Audio et vidéo

De base : Indexe et extrait des insights à l’aide de l’audio et de la vidéo et fournit les insights suivants : transcription, traduction, mise en forme des légendes et sous-titres de sortie (sous-titres), détection d’objets, OCR, scènes (images clés et images) et images noires.
Standard : Indexe et extrait des insights à l’aide de l’audio et de la vidéo et fournit les insights suivants : transcription, traduction, mise en forme des légendes et sous-titres de sortie (sous-titres), détection automatique de la langue, émotions, mots clés, entités nommées (marques, emplacements, personnes), OCR, scènes (images clés et captures), images noires, con mode tente ration, personnes, sentiments, orateurs, extraction de rubriques et con textuelsmode tente ration.
Avancé : Indexe et extrait des insights à l’aide de l’audio et de la vidéo et fournit les insights suivants : transcription, traduction, mise en forme des légendes et sous-titres de sortie (sous-titres), détection automatique de la langue, con textuel mode tente ration, détection d’événements audio, émotions, mots clés, personne mise en correspondance, entités nommées (marques, emplacements, personnes), OCR, personnes observées, détection de carte de clapper, détection de modèles numériques, vêtements recommandés insight, détection d’ardoise sans texte, sentiments, haut-parleurs, scènes (images clés et captures), détection de logo textuel, cadres noirs, con mode tente ration visuelle et extraction de rubriques.

Options de qualité de diffusion en continu

Il existe deux options pour la diffusion en continu de vidéos indexées :

Vitesse de transmission unique : si la hauteur vidéo est supérieure ou égale à 720p HD, Azure AI Video Indexer l’encode avec une résolution de 1280 x 720. Dans le cas contraire, la vidéo est encodée en 640 x 468.
Aucune diffusion en continu : les insights sont générés, mais aucune opération de diffusion en continu n’est effectuée et la vidéo n’est pas disponible sur le site web Azure AI Video Indexer. Lorsque l’option Aucune diffusion en continu est sélectionnée, vous n’êtes pas facturé pour l’encodage.

Exclure des modèles

Vous pouvez exclure des modèles lors de l’indexation via le site web VI et l’API. Lorsque vous chargez une vidéo pour indexer à l’aide du site web, sélectionnez Présélections d’indexation des paramètres>avancés, puis sélectionnez les modèles IA à exclure des résultats d’indexation. Cela peut permettre l’indexation plus efficace et les résultats VI contenant uniquement les insights qui vous intéressent.

Personnalisation de modèles de contenu

Azure AI Video Indexer vous permet de personnaliser certains de ses modèles à adapter à votre cas d’usage spécifique. Ces modèles incluent les marques, la langue, la personne et la parole.

Insights et stockage multimédia

Stockage Insight

Toutes les informations et métadonnées d’indexation sont conservées dans les comptes de stockage gérés par VI et vous n’êtes pas facturé pour ce stockage.

Stockage multimédia

Votre compte VI est connecté à un compte Stockage Azure. Vous contrôlez et payez l’utilisation de ce compte de stockage. Les fichiers suivants sont stockés dans ce compte lorsqu’une vidéo est indexée :

Fichier source. Il est conservé dans le cas où vous souhaitez réindexer la vidéo à l’avenir.
Un nouveau fichier encodé lorsque la qualité de diffusion en continu est définie sur un débit binaire unique.

Suppression d’un média

Le média indexé et tous ses fichiers et insights associés peuvent être supprimés de trois façons :

Supprimez les fichiers avec le portail Video Indexer.
Utilisez la requête Supprimer la vidéo ou supprimer le fichier source vidéo.
Si vous n’avez pas besoin de conserver le fichier multimédia d’origine dans le stockage, lors de l’utilisation de l’API, définissez le retentionPeriod paramètre sur entre 1 et 7. La vidéo indexée et tout ce qui y est lié, le fichier source, insights, etc. sont supprimés 1 à 7 jours après l’indexation.

Partager via