Quais são as novidades da Visão de IA do Azure
Conheça as novidades da Visão de IA do Azure. Veja esta página para se manter atualizado sobre os novos recursos, os aprimoramentos, as correções e as atualizações da documentação.
Janeiro de 2025
Desativação da API de pré-visualização da Análise de Imagem 4.0
Em 31 de março de 2025, as APIs de pré-visualização da Análise de Imagem 4.0 serão desativadas. Antes dessa data, você precisará migrar suas cargas de trabalho da Análise de Imagem do Azure para a API da Análise de Imagem 4.0 em GA .
Recomendamos que você faça a transição mais cedo para ter acesso a melhorias como inserção multimodal, OCR síncrono, detecção de pessoas, marcação de imagem, corte inteligente, legenda, legenda densa e detecção de objetos de imagem. Essas APIs de pré-visualização da Análise de Imagem 4.0 serão desativadas em 31 de março de 2025:
2022-07-31-preview
2022-10-12-preview
2023-02-01-preview
2023-04-01-preview
2023-07-01-preview
v4.0-preview.1
Os seguintes recursos não estarão mais disponíveis após a desativação das versões prévias da API e serão removidos da experiência do Studio a partir de 10 de janeiro de 2025:
- Personalização de modelo
- Remoção de Plano de Fundo
- Reconhecimento de produto
Para manter uma operação suave de seus modelos, faça a transição para a Visão Personalizada da IA do Azure, que agora está em disponibilidade geral. A Visão Personalizada oferece funcionalidades semelhantes às dessas características que estão sendo desativadas.
Agosto de 2024
Novos atributos de Detecção Facial detectáveis
Os atributos de óculos, oclusão, desfoque e exposição estão disponíveis no modelo de Detecção 03 mais recente. Consulte Especificar um modelo de detecção facial para mais detalhes.
Maio de 2024
Novo SDK de Detecção Facial 1.0.0-beta.1 (alterações significativas)
O SDK de Detecção Facial foi reescrito na versão 1.0.0-beta.1 para atender melhor às diretrizes e aos princípios de design dos SDKs do Azure. C#, Python, Java e JavaScript são as linguagens com suporte. Siga o Início Rápido para começar.
Fevereiro de 2024
Disponibilidade geral (GA) de incorporações multimodal: novo modelo multilíngue
A API de incorporações multimodal foi atualizada e agora está em disponibilidade geral. A nova API 2024-02-01
inclui um novo modelo que dá suporte à pesquisa de texto em 102 idiomas. O modelo original, somente em inglês, ainda está disponível, mas não pode ser usado em conjunto com o novo modelo no mesmo índice de pesquisa. Se você vetorizou texto e imagens usando o modelo somente inglês, esses vetores não são compatíveis com vetores de texto e imagem multilíngues.
Acesse a página de idiomas com suporte para ver a lista de idiomas compatíveis.
Janeiro de 2024
Novo SDK de Análise de Imagem 1.0.0-beta.1 (alterações interruptivas)
O SDK de Análise de Imagem foi regravado na versão 1.0.0-beta.1 para se alinhar melhor com outros SDKs do Azure. Todas as APIs foram alteradas. Consulte os inícios rápidos, amostras e guias de instruções atualizados para obter informações sobre como usar o novo SDK.
Principais alterações:
- O SDK agora chama a API REST de Pesquisa Visual Computacional (2023-10-01) geralmente disponível, em vez da versão prévia da API REST da Pesquisa Visual Computacional (2023-04-01-preview).
- Foi adicionado o suporte a JavaScript.
- Não há mais suporte para C++.
- A Análise de Imagem com um modelo personalizado e a Segmentação de Imagem (remoção de tela de fundo) não têm mais suporte no SDK, pois a API REST da Pesquisa Visual Computacional (2023-10-01) ainda não dá suporte a elas. Para usar qualquer recurso, chame a API REST da Pesquisa Visual Computacional (2023-04-01-preview) diretamente (usando as operações
Analyze
eSegment
, respectivamente).
novembrod e 2023
Análise de Imagem 4.0 GA
A API REST da Análise de Imagem 4.0 agora está em Disponibilidade Geral. Siga o guia de início rápido da Análise de Imagem 4.0 para começar.
Os outros recursos da Análise de Imagem, como personalização de modelos, remoção de plano de fundo e inserções multimodais, permanecem em visualização pública.
SDK do lado do cliente de Detecção Facial para detecção de atividade
A SDK de atividade de Detecção Facial oferece suporte à detecção de atividade nos dispositivo de borda e móvel do usuário. Isso está disponível em Java/Kotlin para Android e em Swift/Objective-C para iOS.
Nossa serviço de detecção de atividade atende à conformidade do iBeta Nível 1 e 2 ISO/IEC 30107-3.
Setembro de 2023
Substituição das versões desatualizadas da API de Pesquisa Visual Computacional
A API de Pesquisa Visual Computacional versões 1.0, 2.0, 3.0 e 3.1 será desativada em 13 de setembro de 2026. Os desenvolvedores não poderão fazer chamadas à API para essas APIs após essa data. Recomendamos que todos os clientes afetados migrem suas cargas de trabalho para a API de Pesquisa Visual Computacional 3.2 em disponibilidade geral, seguindo este Início Rápido o mais rápido possível. Os clientes também devem considerar a migração para a API de Análise de Imagem 4.0 (versão prévia), que tem nossos recursos mais recentes e mais abrangentes de Análise de Imagem.
Acesse nosso Q&A para tirar dúvidas.
Maio de 2023
Reconhecimento de Produto da Análise de Imagem 4.0 (versão prévia pública)
As APIs de Reconhecimento de Produto permitem analisar fotos de prateleiras em uma loja de varejo. Você pode detectar a presença e a ausência de produtos, e obter as coordenadas da caixa delimitadora. Use junto com a personalização do modelo para treinar um modelo para identificar seus produtos específicos. Você também pode comparar os resultados do Reconhecimento de Produtos com o documento de planograma da sua loja. Reconhecimento de Produto.
Abril de 2022
Tokens de acesso limitado por Detecção Facial
Os fornecedores independentes de software (ISVs) podem gerenciar o uso da API de Detecção Facial por seus clientes, emitindo tokens de acesso que concedem acesso aos recursos da Detecção Facial que normalmente são bloqueados. Isso permite que as empresas cliente usem a API de Detecção Facial sem precisar passar pelo processo formal de aprovação. Usar tokens de acesso limitado.
Março de 2023
Versão prévia pública do SDK de Análise de Imagem da Visão de IA do Azure 4.0
O modelo de base Florence agora está integrado à Visão de IA do Azure. Os serviços aprimorados de Visão permitem que os desenvolvedores criem aplicativos de Visão de IA do Azure responsáveis e prontos para o mercado em vários setores. Os clientes agora podem digitalizar, analisar e conectar perfeitamente seus dados a interações de linguagem natural, revelando informações poderosas de seu conteúdo de imagem e vídeo para oferecer suporte à acessibilidade, impulsionar a aquisição por meio de SEO, proteger os usuários de conteúdo nocivo, aumentar a segurança e melhorar os tempos de resposta a incidentes. Para obter mais informações, confira Anunciando o modelo de base Florence da Microsoft.
SDK da Análise de Imagem 4.0 (versão prévia pública)
O Image Analysis 4.0 agora está disponível por meio de SDKs da biblioteca de clientes em C#, C++ e Python. Essa atualização também inclui legendagem de imagem e legendagem densa com tecnologia Florence em desempenho de paridade humana.
Legendagem da Análise do Image Analysis V4.0 e Legendagem Densa (versão prévia pública):
"Legenda" substitui "Descrição" na V4.0 como a funcionalidade avançada de legendagem de imagens, rica em detalhes e compreensão semática. O recurso Dense Captions fornece mais detalhes gerando descrições de uma só frase de até dez regiões da imagem, além de descrever toda a imagem. As Legendas Densas também retornam coordenadas de caixas delimitadoras das regiões descritas na imagem. Há também um novo parâmetro de neutro de gênero para permitir que os clientes escolham se desejam habilitar a inferência probabilística de gênero para aplicativos de textos alternativos e Seeing AI. Forneça automaticamente legendas avançadas, textos alternativos acessíveis, otimização do mecanismo de pesquisa e curadoria inteligentes de fotos para oferecer suporte ao conteúdo digital. Legendas de imagem.
Resumo de vídeo e localizador de quadros (visualização pública):
Pesquise e interaja com o conteúdo do vídeo da mesma maneira intuitiva que você pensa e escreve. Localize o conteúdo relevante sem a necessidade de mais metadados. Disponível somente no Vision Studio.
Personalização de modelo do Image Analysis 4.0 (visualização pública)
Agora você pode criar e treinar seus próprios modelos personalizados de classificação de imagem e detecção de objetos, usando o Vision Studio ou as APIs REST v4.0.
APIs de incorporações multimodais (visualização pública)
As APIs de incorporações multimodais, parte da API de Análise de Imagem 4.0, permitem a vetorização de imagens e consultas de texto. Elas permitem converter imagens e texto em coordenadas em um espaço vetorial multidimensional. Agora você pode pesquisar com linguagem natural e encontrar imagens relevantes usando a pesquisa de similaridade vetorial.
APIs de remoção de plano de plano (visualização pública)
Como parte da API do Image Analysis 4.0, a API de remoção de plano de fundo permite que você remova o plano de fundo de uma imagem. Essa operação pode gerar uma imagem do objeto detectado em primeiro plano com um plano de fundo transparente ou uma imagem fosca alfa em escala de cinza mostrando a opacidade do objeto detectado em primeiro plano.
Substituição de versões prévias da Visão de IA do Azure 3.0 e 3.1
As versões prévias das APIs de Visão de IA do Azure 3.0 e 3.1 estão programadas para serem desativadas em 30 de setembro de 2023. Os clientes não poderão fazer nenhuma chamada para essas APIs depois desta data. Os clientes são incentivados a migrar suas cargas de trabalho para a API 3.2 com disponibilidade geral (GA). Tenha em mente as seguintes alterações ao migrar das versões prévias para a API 3.2:
- As chamadas à API da Análise de Imagem e Leitura usam um parâmetro opcional model-version que você pode usar para especificar qual modelo de IA usar. Por padrão, elas usam o modelo mais recente.
- As chamadas à API Análise de Imagem e Leitura também retornam um campo
model-version
em respostas de API bem-sucedidas. Esse campo relata qual modelo foi usado. - A API de Visão de IA do Azure 3.2 usa um formato de relatório de erros diferente. Confira a documentação de referência da API para saber como ajustar qualquer código de tratamento de erros.
Outubro de 2022
Análise de Imagem da Visão de IA do Azure 4.0 (versão prévia pública)
O Image Analysis 4.0 foi lançado em versão prévia pública. A nova API inclui legenda de imagem, marcação de imagem, detecção de pessoas e detecção de objetos, cortes inteligentes e funcionalidade de Leitura de OCR, disponíveis na mesma operação de Análise de Imagem. O OCR é otimizado para imagens gerais (que não sejam documentos) em uma API síncrona com desempenho aprimorado, facilitando a incorporações de experiências com OCR em fluxos de trabalho.
Setembro de 2022
Substituição de versões prévias da Leitura da Visão de IA do Azure 3.0/3.1
As versões prévias da API de Leitura da Visão de IA do Azure 3.0 e 3.1 estão programadas para serem desativadas em 31 de janeiro de 2023. Os clientes são incentivados a consultar os Guias de Instruções e Inícios Rápidos para começar a usar a versão de GA (disponibilidade geral) da API de Leitura. As versões em disponibilidade geral mais recentes fornecem os seguintes benefícios:
- Modelo de OCR mais recente em disponibilidade geral em 2022
- Expansão significativa da cobertura de idiomas em OCR, incluindo suporte a texto manuscrito
- Qualidade do OCR aprimorada
Junho de 2022
Lançamento do Vision Studio
O Vision Studio é uma ferramenta de interface do usuário que permite explorar, criar e integrar recursos da Visão de IA do Azure em seus aplicativos.
O Vision Studio fornece uma plataforma para experimentar vários recursos de serviço e ver o que eles retornam de maneira visual. Usando o Studio, você pode começar sem a necessidade de escrever código e, em seguida, usar as bibliotecas de cliente disponíveis e APIs REST em seu aplicativo.
IA responsável para Detecção Facial
Nota de transparência de rosto
- A nota de transparência fornece diretrizes para ajudar nossos clientes a aprimorar a precisão e a imparcialidade dos próprios sistemas, incorporando uma revisão humana significativa para detectar e resolver casos de identificação incorreta ou outras falhas, fornecendo suporte a pessoas que acreditam que seus resultados estavam incorretos e identificando e abordando flutuações de precisão devido a variações nas condições operacionais.
Desativação de atributos confidenciais
- Desativamos funcionalidades de análise facial que tinham o objetivo de inferir estados emocionais e atributos de identidade, como gênero, idade, sorriso, pelos faciais, cabelo e maquiagem.
- As funcionalidades de detecção facial (incluindo detecção de desfoque, exposição, óculos, posição da cabeça, pontos de referência, ruído, oclusão, caixa delimitadora facial) permanecerão em disponibilidade geral e não exigirão um aplicativo.
Pacote Fairlearn e o Painel de Imparcialidade da Microsoft
- O pacote Fairlearn de código aberto e o Painel de Imparcialidade da Microsoft visam dar suporte aos clientes para medirem a imparcialidade dos algoritmos de verificação facial da Microsoft nos próprios dados, permitindo que, antes de implantarem a própria tecnologia, eles identifiquem e resolvam possíveis problemas de imparcialidade que poderiam afetar diferentes grupos demográficos.
Política de Acesso Limitado
- Como parte do alinhamento da Detecção Facial com o Responsible AI Standard atualizado, uma nova política de Acesso Limitado foi implementada para a API de Detecção Facial e a Visão de IA do Azure. Os clientes existentes têm um ano para aplicar e receber aprovação para acesso contínuo aos serviços de reconhecimento facial com base nos casos de uso fornecidos por eles. Veja detalhes sobre o Acesso Limitado para a Detecção Facial aqui e para a Visão de IA do Azure aqui.
Substituição da versão prévia da Visão de IA do Azure 3.2
As versões prévias da API 3.2 estão programadas para serem desativadas em dezembro de 2022. Com isso, os clientes são incentivados a usar a versão de GA (disponibilidade geral) da API. Lembre-se das seguintes alterações ao migrar das versões prévias 3.2:
- As chamadas à API Análise de Imagem e Leitura agora usam um parâmetro opcional model-version que você pode usar para especificar qual modelo de IA usar. Por padrão, elas usam o modelo mais recente.
- As chamadas à API Análise de Imagem e Leitura também retornam um campo
model-version
em respostas de API bem-sucedidas. Esse campo relata qual modelo foi usado. - As APIs de Análise de Imagem agora usam um formato diferente de relatório de erros. Confira a documentação de referência da API para saber como ajustar qualquer código de tratamento de erros.
Maio de 2022
O modelo de API OCR (Leitura) tem disponibilidade geral (GA)
O modelo mais recente da API de OCR (Leitura) da Visão de IA do Azure, com 164 idiomas com suporte, agora está em disponibilidade geral como um serviço de nuvem e contêiner.
- O suporte a OCR para texto impresso é expandido para 164 idiomas, incluindo russo, árabe, hindi e outros idiomas que usam os scripts cirílico, árabe e devanágari.
- O suporte a OCR para texto manuscrito é expandido para 9 idiomas com inglês, chinês simplificado, francês, alemão, italiano, japonês, coreano, português e espanhol.
- Suporte aprimorado para caracteres únicos, datas manuscritas, valores, nomes, outras entidades comumente encontradas em recibos e faturas.
- Processamento aprimorado de documentos PDF digitais.
- O limite de tamanho do arquivo de entrada aumentou 10 vezes para 500 MB.
- Melhorias de desempenho e latência.
- Disponível como serviço de nuvem e contêiner do Docker.
Confira o guia de instruções de OCR para saber como usar o modelo de GA (disponibilidade geral).
Fevereiro de 2022
A versão prévia pública da API do OCR (Leitura) dá suporte a 164 idiomas
A API de OCR (Leitura) da Visão de IA do Azure expande os idiomas com suporte para 164 em sua versão prévia mais recente:
- O suporte a OCR para texto impresso é expandido para 42 novos idiomas, incluindo árabe, híndi e outros idiomas que usam os scripts árabe e devanágari.
- O suporte a OCR para texto manuscrito é expandido para japonês e coreano, além de inglês, chinês simplificado, francês, alemão, italiano, português e espanhol.
- Aprimoramentos, incluindo melhor suporte para extrair datas, valores, nomes e caixas de caractere único manuscritas.
- Melhorias gerais de desempenho e qualidade de IA
Confira o guia de Como usar o OCR para saber como usar os novos recursos em versão prévia.
Novo atributo de qualidade em Detection_01 e Detection_03
- Para ajudar os integradores de sistema e seus clientes a capturar imagens de alta qualidade, necessárias para saídas de alta qualidade do API de Detecção Facial, estamos introduzindo um novo atributo de qualidade QualityForRecognition para ajudar a decidir se uma imagem tem qualidade suficiente para tentar o reconhecimento facial. O valor é uma classificação informal de baixa, média ou alta. O novo atributo só está disponível ao usar combinações de modelos de detecção
detection_01
oudetection_03
, e modelos de reconhecimentorecognition_03
ourecognition_04
. Apenas imagens com qualidade "alta" são recomendadas para o registro de pessoas, e as imagens com qualidade igual ou superior à "média" são recomendadas para cenários de identificação. Para saber mais sobre o novo atributo de qualidade, consulte Detecção facial e atributos e veja como usá-la neste Guia de início rápido.
Setembro de 2021
A Versão Prévia Pública da API do OCR (Leitura) dá suporte a 122 idiomas
A API de OCR (Leitura) da Visão de IA do Azure expande os idiomas com suporte para 122 com sua última visualização:
- Suporte de OCR para texto impresso em 49 novos idiomas, incluindo russo, búlgaro e outros idiomas em alfabeto cirílico, além de mais idiomas em alfabeto latino.
- Suporte de OCR para texto manuscrito em 6 novos idiomas que incluem inglês, chinês simplificado, francês, alemão, italiano, português e espanhol.
- Aprimoramentos para processamento de PDFs digitais e texto MRZ (Machine Readable Zone - Zona Legível por Computador) em documentos de identidade.
- Melhorias gerais de desempenho e qualidade de IA
Confira o guia de Como usar o OCR para saber como usar os novos recursos em versão prévia.
Agosto de 2021
Expansão de idioma de marcação de imagem
A versão mais recente (v3.2) do marcador de Imagem agora é compatível com marcas em 50 idiomas. Confira a página de idiomas compatíveis para saber mais.
Julho de 2021
Novos aprimoramentos de HeadPose e Landmarks para Detection_03
- O modelo Detection_03 foi atualizado para dar suporte a pontos de referência faciais.
- O recurso de pontos de referência Detection_03 é muito mais preciso, especialmente nos pontos de referência históricos cruciais para o acompanhamento do olhar.
Maio de 2021
Atualização do contêiner de Análise Espacial
Uma nova versão do contêiner de Análise Espacial foi lançada, com um novo conjunto de recursos. O contêiner do Docker permite que você analise vídeos de streaming em tempo real para entender as relações espaciais existentes entre as pessoas e a movimentação delas em ambientes físicos.
Agora as operações de análise espacial podem ser configuradas para detectar a orientação que uma pessoa está vendo.
- Um classificador de orientação pode ser habilitado para as operações
personcrossingline
epersoncrossingpolygon
configurando o parâmetroenable_orientation
. É definido como off por padrão.
- Um classificador de orientação pode ser habilitado para as operações
Agora as operações de análise espacial também oferecem configuração para detectar a velocidade de uma pessoa durante a movimentação/execução
- A velocidade pode ser detectada para as operações
personcrossingline
epersoncrossingpolygon
ativando o classificadorenable_speed
, que está desativado por padrão. A saída é refletida nas saídasspeed
,avgSpeed
eminSpeed
.
- A velocidade pode ser detectada para as operações
Abril de 2021
GA da Visão de IA do Azure v3.2
A API da Visão de IA do Azure v3.2 já está em disponibilidade geral com as seguintes atualizações:
- Modelo de marcação de imagem aprimorado: analisa o conteúdo visual e gera marcas relevantes com base nos objetos, nas ações e no conteúdo exibido na imagem. Esse modelo está disponível por meio da API de Marcação de Imagem. Confira o guia de instruções e a visão geral da Análise de Imagem para saber mais.
- Modelo de moderação de conteúdo atualizado: detecta a presença de conteúdo para adulto e fornece sinalizadores para filtrar imagens com conteúdo visual adulto, erótico e de carnificina. Esse modelo está disponível por meio da API de Análise. Confira o guia de instruções e a visão geral da Análise de Imagem para saber mais.
- OCR (Leitura) disponível para 73 idiomas incluindo idiomas latinos, chinês simplificado e tradicional, japonês e coreano.
- OCR (Leitura) também está disponível como um Contêiner sem distribuição para implantação local.
Estrutura de dados do PersonDirectory (versão prévia)
- Para executar operações de reconhecimento facial como Identificar e Localizar Semelhante, os clientes da API de Detecção Facial precisam criar uma lista sortida de objetos Person. O novo PersonDirectory é uma estrutura de dados que contém IDs exclusivas, cadeias de caracteres de nome opcionais e cadeias de caracteres de metadados de usuário opcionais para cada identidade Person adicionada ao diretório. Atualmente, a API de Detecção Facial oferece a estrutura LargePersonGroup, que tem funcionalidade semelhante, mas é limitada a 1 milhão de identidades. A estrutura PersonDirectory pode escalar verticalmente para até 75 milhões de identidades.
- Outra grande diferença entre PersonDirectory e as estruturas de dados anteriores é que você não precisará mais fazer chamadas de treinamento depois de adicionar faces a um objeto Person: o processo de atualização ocorre automaticamente. Para obter mais detalhes, confira Usar a estrutura PersonDirectory.
Março de 2021
Atualização da Versão Prévia Pública da Visão de IA do Azure 3.2
A versão prévia pública da API da Visão de IA do Azure v3.2 foi atualizada. A versão prévia tem todos os recursos da Visão de IA do Azure, juntamente com APIs de Leitura e Análise atualizadas.
Fevereiro de 2021
Versão Prévia Pública da API de Leitura v3.2 com suporte de OCR para 73 idiomas
A versão prévia pública da API de Leitura da Visão de IA do Azure v3.2, disponível como serviço de nuvem e contêiner do Docker, inclui estas atualizações:
- OCR para 73 idiomas incluindo idiomas latinos, chinês simplificado e tradicional, japonês e coreano.
- Ordem natural de leitura da saída da linha de texto (somente para idiomas latinos)
- Classificação de estilo manuscrito para linhas de texto juntamente com uma pontuação de confiança (somente em idiomas latinos).
- Extraia o texto somente das páginas selecionadas de um documento de várias páginas.
- Disponível como um Contêiner sem distribuição para implantação local.
Confira o guia de instruções da API de Leitura para saber mais.
Novo modelo de detecção de API de Detecção Facial
- O novo modelo de detecção 03 é o modelo de detecção mais preciso disponível no momento. Se você é um novo cliente, recomendamos usar esse modelo. A detecção 03 melhora o recall e a precisão em rostos menores encontrados nas imagens (64 x 64 pixels). Outros aprimoramentos incluem uma redução geral em falsos positivos e uma detecção aprimorada em orientações de face giradas. A combinação da detecção 03 com o novo modelo de reconhecimento 04 também proporciona precisão de reconhecimento aprimorada. Consulte Especificar um modelo de detecção facial para mais detalhes.
Novos atributos de Detecção Facial detectáveis
- O atributo
faceMask
está disponível com o modelo de detecção 03 mais recente, juntamente com o atributo"noseAndMouthCovered"
adicionado que detecta se a máscara facial está sendo usada conforme o esperado, cobrindo o nariz e a boca. Para usar a funcionalidade de detecção de máscara mais recente, os usuários precisam especificar o modelo de detecção na solicitação de API: atribuir a versão do modelo com o parâmetro detectionModel paradetection_03
. Consulte Especificar um modelo de detecção facial para mais detalhes.
Novo modelo de reconhecimento de API de Detecção Facial
- O novo modelo de reconhecimento 04 é o modelo de reconhecimento mais preciso disponível no momento. Se você é um novo cliente, recomendamos usar esse modelo para verificação e identificação. Ele melhora a precisão do Reconhecimento 03, incluindo o reconhecimento aprimorado para usuários registrados com cobertura facial (máscaras cirúrgicas, máscaras N95, máscaras de tecido). Recomendamos o registro de imagens de usuários usando coberturas faciais, pois isso reduzirá a qualidade do reconhecimento. Agora, os clientes podem criar experiências de usuário seguras e diretas que detectam se um usuário registrado está usando uma cobertura facial com o modelo de detecção 03 mais recente e reconhecem quem está com o modelo de reconhecimento 04 mais recente. Consulte Especificar um modelo de reconhecimento facial para mais detalhes.
Janeiro de 2021
Atualização do contêiner de Análise Espacial
Uma nova versão do contêiner de Análise Espacial foi lançada, com um novo conjunto de recursos. O contêiner do Docker permite que você analise vídeos de streaming em tempo real para entender as relações espaciais existentes entre as pessoas e a movimentação delas em ambientes físicos.
- Agora, as operações de Análise Espacial podem ser configuradas para detectar se uma pessoa está usando uma proteção para o rosto, como uma máscara.
- Foi habilitado um classificador de máscara para as operações
personcount
,personcrossingline
epersoncrossingpolygon
configurando o parâmetroENABLE_FACE_MASK_CLASSIFIER
. - Os atributos
face_mask
eface_noMask
serão retornados como metadados com a pontuação de confiança para cada pessoa detectada no fluxo de vídeo
- Foi habilitado um classificador de máscara para as operações
- A operação personcrossingpolygon foi estendida para permitir o cálculo do tempo de duração da pesquisa que uma pessoa gasta em uma zona. Você pode definir o parâmetro
type
na configuração de zona da operação parazonedwelltime
e um novo evento do tipo personZoneDwellTimeEvent incluirá o campodurationMs
populado com o número de milissegundos que a pessoa gastou na zona. - Alteração interruptiva: O evento personZoneEvent foi renomeado para personZoneEnterExitEvent. Esse evento é gerado pela operação personcrossingpolygon quando uma pessoa entra ou sai da zona e fornece informações direcionais com o lado numerado da zona que foi cruzada.
- A URL de vídeo pode ser fornecida como "Parâmetro Privado/ofuscado" em todas as operações. A ofuscação é opcional agora e só funcionará se
KEY
eIV
forem fornecidas como variáveis de ambiente. - A calibragem é habilitada por padrão para todas as operações. Defina o
do_calibration: false
para desabilitá-lo. - Adição de suporte para recalibragem automática (desabilitada por padrão) por meio do parâmetro
enable_recalibration
. Veja Operações de Análise Espacial para obter detalhes - Parâmetros de calibragem de câmera para o
DETECTOR_NODE_CONFIG
. Veja Operações de Análise Espacial para obter detalhes.
Mitigar a latência
- A equipe de Detecção Facial publicou um novo artigo detalhando possíveis causas de latência ao usar o serviço e as estratégias de mitigação possíveis. Consulte Mitigar a latência ao usar o serviço de Detecção Facial.
Dezembro de 2020
Configuração do cliente para o armazenamento de Face ID
- Embora o serviço de Detecção Facial não armazene imagens de clientes, os recursos faciais extraídos serão armazenados no servidor. A Face ID é um identificador do recurso facial e será usada em Rosto – Identificar, Rosto – Verificar e Rosto – Encontrar Semelhante. Os recursos faciais armazenados expirarão e serão excluídos 24 horas após a chamada de detecção original. Agora, os clientes podem determinar o período de tempo em que essas Face IDs são armazenadas em cache. O valor máximo ainda é de até 24 horas, mas um valor mínimo de 60 segundos agora pode ser definido. Os novos intervalos de tempo para as Face IDs que estão sendo armazenadas em cache são qualquer valor entre 60 segundos e 24 horas. Mais detalhes podem ser encontrados na referência de API Rosto – Detectar (o parâmetro faceIdTimeToLive).
Novembro de 2020
Aplicativo de registro de Detecção Facial de exemplo
- A equipe publicou um exemplo de aplicativo de registro de Detecção Facial para demonstrar as melhores práticas para estabelecer um consentimento significativo e criar sistemas de reconhecimento facial de alta precisão por meio de registros de alta qualidade. O exemplo de software livre pode ser encontrado no guia Criar um aplicativo de registro e no GitHub, pronto para os desenvolvedores implantarem ou personalizarem.
Outubro de 2020
GA da API da Visão de IA do Azure v3.1
A API da Visão de IA do Azure em disponibilidade geral foi atualizada para a v3.1.
Setembro de 2020
Versão prévia do contêiner de Análise Espacial
O contêiner de Análise Espacial já está em versão prévia. O recurso de Análise Espacial da Visão de IA do Azure permite que você analise vídeos de streaming em tempo real para entender as relações espaciais existentes entre as pessoas e o movimento delas nos ambientes físicos. A Análise Espacial é um contêiner do Docker que pode ser usado no local.
A API de Leitura v3.1 Visualização Pública adiciona o OCR para japonês
A versão prévia pública da API de Leitura da Visão de IA do Azure v3.1 adiciona os seguintes recursos:
OCR para o idioma japonês
Para cada linha de texto, indique se a aparência está em estilo manuscrito ou impresso, juntamente com uma pontuação de confiança (somente para idiomas latinos).
Para um documento de várias páginas, extraia o texto somente da página ou do intervalo de páginas selecionado.
Esta versão prévia da API de Leitura é compatível com os idiomas inglês, holandês, francês, alemão, italiano, japonês, português, chinês simplificado e espanhol.
Confira o guia de instruções da API de Leitura para saber mais.
Agosto de 2020
Criptografia de dados inativos gerenciada pelo cliente
- O serviço de Detecção Facial criptografa automaticamente seus dados ao mantê-los na nuvem. A criptografia do serviço de Detecção Facial protege seus dados para ajudar você a atender aos compromissos de conformidade e segurança de sua organização. Por padrão, sua assinatura usa chaves de criptografia gerenciadas pela Microsoft. Também há uma opção para gerenciar sua assinatura com suas próprias chaves chamada CMK (chaves gerenciadas pelo cliente). Mais detalhes podem ser encontrados em Chaves gerenciadas pelo cliente.
Julho de 2020
Visualização Pública da API de Leitura v3.1 com OCR para chinês simplificado
A versão prévia pública da API de Leitura da Visão de IA do Azure v3.1 adiciona suporte ao chinês simplificado.
- Esta versão prévia da API de Leitura dá suporte aos idiomas inglês, holandês, francês, alemão, italiano, português, chinês simplificado e espanhol.
Confira o guia de instruções da API de Leitura para saber mais.
Maio de 2020
A API da Visão de IA do Azure v3.0 entrou em disponibilidade geral com atualizações para a API de Leitura:
- Suporte para inglês, holandês, francês, alemão, italiano, português e espanhol
- Precisão aprimorada
- Pontuação de confiança para cada palavra extraída
- Novo formato de saída
Confira a Visão geral do OCR para saber mais.
Abril de 2020
Novo modelo de reconhecimento de API de Detecção Facial
- O novo modelo de reconhecimento 03 é o modelo mais preciso disponível no momento. Se você é um novo cliente, recomendamos usar esse modelo. O reconhecimento 03 fornece precisão aprimorada para comparações de semelhanças e comparações de correspondência de pessoas. Mais detalhes podem ser encontrados em Especificar um modelo de reconhecimento facial.
Março de 2020
- Agora o TLS 1.2 é obrigatório para todas as solicitações HTTP a este serviço. Para obter mais informações, consulte a segurança dos serviços de IA do Azure.
Janeiro de 2020
Versão prévia pública da API de Leitura 3.0
Agora você pode usar a versão 3.0 da API de Leitura para extrair texto impresso ou manuscrito de imagens. Em comparação com as versões anteriores, a 3.0 oferece:
- Precisão aprimorada
- Novo formato de saída
- Pontuação de confiança para cada palavra extraída
- Suporte para os idiomas espanhol e inglês com o parâmetro de idioma
Siga um início rápido de extração de texto para começar a usar a API 3.0.
Junho de 2019
Novo modelo de detecção de API de Detecção Facial
- O novo modelo de detecção 02 apresenta precisão aprimorada em imagens com rostos pequenos, obstruídos, borrados e de perfil. Use-o por meio de Rosto – Detectar, FaceList – Adicionar Rosto, LargeFaceList – Adicionar Rosto, Pessoa de PersonGroup – Adicionar Rosto e Pessoa de LargePersonGroup – Adicionar Rosto especificando o novo nome do modelo de detecção facial
detection_02
no parâmetrodetectionModel
. Mais detalhes em Como especificar um modelo de detecção.
Abril de 2019
Precisão de atributo aprimorada
- Precisão geral aprimorada dos atributos
age
eheadPose
. O atributoheadPose
também é atualizado com o valorpitch
habilitado agora. Use esses atributos especificando-os no parâmetroreturnFaceAttributes
do parâmetroreturnFaceAttributes
de Rosto – Detectar.
Velocidades de processamento aprimoradas
- Velocidades aprimoradas das operações Rosto – Detectar, FaceList – Adicionar Rosto, LargeFaceList – Adicionar Rosto, Pessoa de PersonGroup – Adicionar Rosto e Pessoa de LargePersonGroup – Adicionar Rosto.
Março de 2019
Novo modelo de reconhecimento de API de Detecção Facial
- O modelo de reconhecimento 02 está com a precisão aprimorada. Use-o por meio de Rosto – Detectar, FaceList – Criar, LargeFaceList – Criar, PersonGroup – Criar e LargePersonGroup – Criar especificando o novo nome do modelo de reconhecimento facial
recognition_02
no parâmetrorecognitionModel
. Mais detalhes em Como especificar um modelo de reconhecimento.
Janeiro de 2019
Recurso Instantâneo de Detecção Facial
- Esse recurso permite que o serviço dê suporte à migração de dados entre assinaturas: Instantâneo.
Importante
A partir de 30 de junho de 2023, a API de Instantâneo de Detecção Facial está desativada.
Outubro de 2018
Mensagens de API
- Descrição refinada para
status
,createdDateTime
,lastActionDateTime
elastSuccessfulTrainingDateTime
emstatus
,createdDateTime
elastActionDateTime
.
Maio de 2018
Precisão de atributo aprimorada
- Atributo
gender
aprimorado significativamente e também atributosage
,glasses
,facialHair
,hair
,makeup
aprimorados. Use-os por meio do parâmetro Detecção Facial – DetectarreturnFaceAttributes
.
Limite de tamanho do arquivo aprimorado
- Limite de tamanho do arquivo de imagem de entrada maior, passando 4 MB para 6 MB em Face – Detectar, FaceList – Adicionar Face, LargeFaceList – Adicionar Face, Pessoa de PersonGroup – Adicionar Face e Pessoa de LargePersonGroup – Adicionar Face.
Março de 2018
Nova estrutura de dados
- LargeFaceList e LargePersonGroup. Mais detalhes sobre Como escalar para lidar com mais usuários inscritos.
- Parâmetro Detecção Facial – Identificar
maxNumOfCandidatesReturned
aumentado de [1, 5] para [1, 100] e o padrão para 10.
Maio de 2017
Novos atributos de Detecção Facial detectáveis
- Adicionados os atributos
hair
,makeup
,accessory
,occlusion
,blur
,exposure
enoise
no parâmetro Detecção Facial – DetectarreturnFaceAttributes
. - Suporte para dez mil pessoas em um PersonGroup e Face – Identificar.
- Paginação compatível em PersonGroup pessoa – Lista com parâmetros opcionais:
start
etop
. - Simultaneidade compatível na adição/exclusão de faces com relação a diferentes FaceLists e diferentes pessoas em PersonGroup.
Março de 2017
Novo atributo de Detecção Facial detectável
- Adicionado o atributo
emotion
no parâmetro Detecção Facial – DetectarreturnFaceAttributes
.
Problemas corrigidos
- O rosto não era detectado com o retângulo retornado de Rosto – Detectar como
targetFace
em FaceList – Adicionar Rosto e Pessoa de PersonGroup – Adicionar Rosto. - O tamanho facial detectável é definido para garantir que fique estritamente entre 36 x 36 e 4.096 x 4.096 pixels.
Novembro de 2016
Nova camada de assinatura
- Adicionada assinatura Armazenamento Facial Padrão para armazenar faces persistentes adicionais ao usar Pessoa de PersonGroup – Adicionar Face ou FaceList – Adicionar Face para correspondência de similaridade ou identificação. As imagens armazenadas são cobradas a US$ 0,5 por mil faces, e essa taxa é dividida proporcionalmente por dia. As assinaturas da camada gratuita continuam limitadas a mil pessoas no total.
Outubro de 2016
Mensagens de API
- Alterada a mensagem de erro de mais de um rosto em
targetFace
, passando de 'Existem mais de um rosto na imagem' para 'Existe mais de um rosto na imagem' emtargetFace
e Pessoa de PersonGroup – Adicionar Rosto.
Julho de 2016
Novos recursos
- Face compatível para autenticação de objeto em Face – Verificar.
- Adicionado o parâmetro
mode
opcional possibilitando a seleção de dois modos de trabalho:matchPerson
ematchFace
, emmode
e o padrão ématchPerson
. - Adicionado o parâmetro
confidenceThreshold
opcional para o usuário definir o limite de se uma face pertence a um objeto de Pessoa emconfidenceThreshold
. - Adicionados os parâmetros
start
etop
opcionais emstart
para permitir que o usuário especifique o ponto inicial e o número total de PersonGroups para a lista.
Alterações à V1.0 da V0
- Atualizado o ponto de extremidade da raiz do serviço de
https://westus.api.cognitive.microsoft.com/face/v0/
parahttps://westus.api.cognitive.microsoft.com/face/v1.0/
. Alterações aplicadas a: Face – Detectar, Face – Identificar, Face – Localizar Semelhante e Face – Agrupar. - Atualizado o tamanho mínimo face detectável para 36 x 36 pixels. Faces menores que 36 x 36 pixels não serão detectadas.
- Preteridos os dados de PersonGroup e Pessoa de Detecção Facial V0. Esses dados não podem ser acessados com o serviço Detecção Facial V1.0.
- Preterido o ponto de extremidade V0 da API de Detecção Facial em 30 de junho de 2016.
Atualizações dos serviços de IA do Azure
Comunicados de atualização do Azure para os serviços de IA do Azure