O guia de configuração de indexação

Artigo
11/04/2024

Você pode usar as configurações de indexação padrão ou ajustá-las. Você pode escolher configurações de idioma, indexação, modelos personalizados e streaming que tenham implicações sobre as informações geradas, o custo e o desempenho.

Este artigo explica cada uma das opções. As mesmas opções se aplicam ao usar o site do Azure AI Video Indexer como para usar a API (consulte o guia da API). Ao indexar grandes volumes, siga o guia em escala.

Configurações padrão

Por padrão, o Azure AI Video Indexer é configurado como:

Língua de partida: Inglês
Privacidade: privada
Configuração de áudio e vídeo: padrão
Qualidade de streaming: taxa de bits única

Idioma de origem do vídeo

Se você estiver ciente do idioma falado no vídeo, selecione o idioma na lista de idiomas de origem do vídeo. Se não tiver certeza do idioma do vídeo, escolha Detetar automaticamente um único idioma. O Azure AI Video Indexer usa a identificação de idioma (LID) para detetar o idioma dos vídeos e gerar transcrição e insights com o idioma detetado.

Se o vídeo contiver vários idiomas e você não tiver certeza de quais, selecione Detetar automaticamente vários idiomas. Nesse caso, a deteção de vários idiomas (MLID) é aplicada ao carregar e indexar seu vídeo.

Embora a deteção automática seja uma ótima opção quando o idioma em seus vídeos varia, há dois pontos a considerar ao usar LID ou MLID:

O LID/MLID não suporta todos os idiomas suportados pelo Azure AI Video Indexer.
A transcrição é de maior qualidade quando você pré-seleciona o idioma apropriado do vídeo.

Saiba mais sobre o suporte a idiomas e idiomas suportados.

Privacidade

Esta opção permite determinar se as informações só devem ser acessíveis a utilizadores na sua conta do Azure AI Video Indexer ou a qualquer pessoa com uma ligação.

Opções de indexação

Cada uma das opções de indexação de áudio e vídeo pode ter preços diferentes quando você usa as configurações de indexação padrão. Consulte Preços do Azure AI Video Indexer para obter detalhes.

A seguir estão as opções de tipo de indexação com detalhes de seus insights fornecidos. Para modificar o tipo de indexação, selecione Configurações avançadas.

Nota

O Reconhecimento Ótico de Caracteres (OCR) é usado com vários tipos de insights.

Definições avançadas

Apenas áudio

Básico: indexa e extrai insights usando apenas áudio (ignorando vídeo) e fornece os seguintes insights: transcrição, tradução, formatação de legendas de saída e legendas (closed captions).
Padrão: indexa e extrai insights usando apenas áudio (ignorando vídeo) e fornece os seguintes insights: transcrição, tradução, formatação de legendas e legendas de saída (closed captions), deteção automática de idioma, emoções, palavras-chave, entidades nomeadas (marcas, locais, pessoas), sentimentos, palestrantes, extração de tópicos e moderação de conteúdo textual.
Avançado: indexa e extrai insights usando apenas áudio (ignorando vídeo) e fornece os seguintes insights: transcrição, tradução, formatação de legendas e legendas de saída (closed captions), deteção automática de idioma, deteção de eventos de áudio, emoções, palavras-chave, entidades nomeadas (marcas, locais, pessoas), sentimentos, palestrantes, extração de tópicos e moderação de conteúdo textual.

Apenas vídeo

Básico: indexa e extrai insights usando apenas vídeo (ignorando áudio) e fornece os seguintes insights: rótulos, deteção de objetos, OCR, cenas (quadros-chave e fotos) e deteção de quadros pretos.
Padrão: indexa e extrai insights usando apenas vídeo (ignorando áudio) e fornece os seguintes insights: rótulos (OCR), entidades nomeadas (OCR - marcas, locais, pessoas), OCR, pessoas, cenas (quadros-chave e fotos), quadros pretos, moderação de conteúdo visual e extração de tópicos (OCR).
Avançado: indexa e extrai insights usando apenas vídeo (ignorando áudio) e fornece os seguintes insights: rótulos (OCR), pessoa correspondente, entidades nomeadas (OCR - marcas, locais, pessoas), OCR, pessoas observadas, pessoas, cenas (quadros-chave e fotos), deteção de quadro de clapper, deteção de padrão digital, visão de roupas em destaque, deteção de ardósia sem texto, deteção de logotipo textual, molduras pretas, moderação de conteúdo visual e extração de tópicos (OCR).

Áudio e Vídeo

Básico: indexa e extrai insights usando áudio e vídeo e fornece os seguintes insights: transcrição, tradução, formatação de legendas de saída e legendas (closed captions), deteção de objetos, OCR, cenas (quadros-chave e fotos) e quadros pretos.
Padrão: indexa e extrai insights usando áudio e vídeo e fornece os seguintes insights: transcrição, tradução, formatação de legendas de saída e legendas (closed captions), deteção automática de idioma, emoções, palavras-chave, entidades nomeadas (marcas, locais, pessoas), OCR, cenas (quadros-chave e fotos), quadros pretos, moderação de conteúdo visual, pessoas, sentimentos, palestrantes, extração de tópicos e moderação de conteúdo textual.
Avançado: indexa e extrai insights usando áudio e vídeo e fornece os seguintes insights: transcrição, tradução, formatação de legendas de saída e legendas (closed captions), deteção automática de idioma, moderação de conteúdo textual, deteção de eventos de áudio, emoções, palavras-chave, pessoa correspondente, entidades nomeadas (marcas, locais, pessoas), OCR, pessoas observadas, pessoas, deteção de placa de clapper, deteção de padrão digital, visão de roupas em destaque, Deteção de ardósia sem texto, sentimentos, alto-falantes, cenas (quadros-chave e fotos), deteção de logotipo textual, quadros pretos, moderação de conteúdo visual e extração de tópicos.

Opções de qualidade de streaming

Existem duas opções para streaming de vídeos indexados:

Taxa de bits única: se a altura do vídeo for maior ou igual a 720p HD, o Azure AI Video Indexer codifica-o com uma resolução de 1280 x 720. Caso contrário, é codificado como 640 x 468.
Sem streaming: as informações são geradas, mas nenhuma operação de streaming é executada e o vídeo não está disponível no site do Azure AI Video Indexer. Quando Nenhum streaming é selecionado, você não é cobrado pela codificação.

Excluir modelos

Você pode excluir modelos ao indexar através do site VI e da API. Ao carregar um vídeo para indexação usando o site, selecione Configurações>avançadas Predefinições de indexação e, em seguida, selecione os modelos de IA a serem excluídos dos resultados da indexação. Isso pode permitir uma indexação mais eficiente e resultados VI contendo apenas os insights em que você está interessado.

Personalizar modelos de conteúdo

O Azure AI Video Indexer permite que você personalize alguns de seus modelos para serem adaptados ao seu caso de uso específico. Esses modelos incluem marcas, linguagem, pessoa e fala.

Informações e armazenamento de mídia

Armazenamento de insights

Todas as informações e metadados de indexação são mantidos em contas de armazenamento gerenciadas pelo VI e você não é cobrado por esse armazenamento.

Armazenamento de mídia

Sua conta VI está conectada a uma conta de Armazenamento do Azure. Você controla e paga pelo uso desta conta de armazenamento. Os seguintes ficheiros são armazenados nesta conta quando um vídeo é indexado:

O arquivo de origem. Ele é mantido para o caso de você querer reindexar o vídeo no futuro.
Um novo arquivo codificado quando a qualidade do streaming é definida como taxa de bits única.

Exclusão de mídia

A mídia indexada e todos os seus arquivos e insights associados podem ser excluídos de três maneiras:

Exclua os arquivos com o portal Video Indexer.
Use a solicitação Excluir vídeo ou Excluir arquivo de origem de vídeo.
Se você não precisar manter o arquivo de mídia original no armazenamento, ao usar a API, defina o parâmetro entre 1 e retentionPeriod 7. O vídeo indexado e tudo relacionado a ele, o arquivo de origem, insights, etc. são excluídos 1-7 dias após a indexação.

Partilhar via