Partilhar via


API ref para reconhecimento de texto (OCR) apoiado por IA no SDK de aplicativos Windows

Importante

Esta funcionalidade ainda não está disponível. Espera-se que ele seja lançado num próximo lançamento do canal experimental do SDK de Aplicativo Windows.

O SDK de Aplicativos Windows canal experimental inclui APIs e recursos em estágios iniciais de desenvolvimento. Todas as APIs no canal experimental estão sujeitas a extensas revisões e alterações disruptivas e podem ser removidas de versões futuras a qualquer momento. Eles não são suportados para uso em ambientes de produção e os aplicativos que usam recursos experimentais não podem ser publicados na Microsoft Store.

Saiba mais sobre as APIs SDK de Aplicativos Windows, apoiadas por inteligência artificial (IA), que podem detetar e extrair texto (caracteres, palavras, linhas, limites de texto poligonal e níveis de confiança para cada correspondência) em imagens e convertê-lo em fluxos de caracteres legíveis por máquina.

Para obter mais detalhes, consulte Introdução ao Reconhecimento de Texto (OCR) no SDK do Aplicativo Windows.

Dica

Forneça opiniões sobre essas APIs e suas funcionalidades criando um novo Problema Issue no repositório GitHub do Windows App SDK. (Certifique-se de incluir OCR no título!)


Espaço de nomes Microsoft.Windows.Vision

Fornece APIs para modelos de aprendizado de máquina que analisam o conteúdo textual de imagens.

Enum DetectedLineStyle

public enum DetectedLineStyle

Especifica os estilos de linha que podem ser reconhecidos.

Campos

Manuscrito: 0

A linha de texto é escrita à mão.

Outros: 1

A linha de texto não é escrita à mão.

Enumeração OrientationDetectionOptions

public enum OrientationDetectionOptions

Especifica as orientações de texto que podem ser reconhecidas.

Campos

Nenhum: 0

A orientação não é reconhecida.

DetectOrientation: 1

A orientação é reconhecida.

Classe RecognizedLine

public sealed class RecognizedLine

Representa uma única linha de texto reconhecido.

Propriedade RecognizedLine.Style

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Obtém o estilo de linha reconhecido.

Valor do imóvel

o estilo de linha conhecido.

Comentários

Inclui se a linha de texto foi manuscrita ou não e o nível de confiança de reconhecimento.

propriedade RecognizedLine.Text

public string Text { get; }

Obtém o texto da linha reconhecida.

Valor do imóvel

O texto da linha reconhecida.

Comentários

Todas as palavras concatenadas com espaços.

Propriedade "RecognizedLine.Words"

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

As palavras na linha reconhecida.

Valor do imóvel

As palavras na linha reconhecida.

Estrutura RecognizedLineStyle

public struct RecognizedLineStyle

Representa o estilo da linha reconhecida.

Campos

Confiança

O nível de confiança do reconhecimento do estilo de linha.

Nome

O nome do estilo de linha.

Classe RecognizedText

public sealed class RecognizedText

Representa o resultado de uma operação de reconhecimento de imagem para texto.

propriedade RecognizedText.ImageAngle

public float ImageAngle { get; }

Obtém o ângulo de rotação no sentido horário do texto reconhecido em graus.

Valor do imóvel

O ângulo de rotação do texto reconhecido no sentido horário, em graus.

Propriedade Linhas de RecognizedText

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Obtém a coleção de linhas reconhecidas.

Valor do imóvel

A coleção de linhas reconhecidas.

Classe RecognizedWord

public sealed class RecognizedWord

Representa uma única palavra reconhecida.

Propriedade do RecognizedWord.BoundingBox

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Obtém o limite quadrilátero da palavra reconhecida.

Valor do imóvel

O limite quadrilátero da palavra reconhecida. TopLeft é relativo à rotação da palavra.

Propriedade Confiança do RecognizedWord

public float Confidence { get; }

Obtém a probabilidade de essa palavra ter sido reconhecida corretamente.

Valor do imóvel

Uau provavelmente esta palavra foi reconhecida corretamente. O valor varia de 0,0 a 1,0, inclusive.

RecognizedWord.Text propriedade

public string Text { get; }

Obtém o texto da palavra reconhecida.

Valor do imóvel

O texto da palavra reconhecida.

TextRecognition.BoundingBox estrutura de dados

public struct BoundingBox

Um polígono com 4 pontos usado para o limite de palavras reconhecidas e linhas de texto.

Campos

Abaixo-Esquerda

O canto inferior esquerdo da caixa delimitadora.

AbaixoDireita

O canto inferior direito da caixa delimitadora.

TopLeft

O ponto superior esquerdo da caixa delimitadora.

TopRight

O ponto superior direito da caixa delimitadora.

Comentários

Quando retornados como um limite para uma palavra ou linha, os pontos de TopLeft, TopRight, BottomRighte BottomLeft são relativos à rotação e inclinação do texto reconhecido na imagem. O diagrama a seguir mostra o layout de pontos para diferentes rotações de texto onde 0 é TopLeft, 1 é TopRight, 2 é BottomRighte 3 é BottomLeft, todos relativos ao texto.

Diagrama de três exemplos de caixas delimitadoras mostrando como os pontos de canto são identificados com base na rotação do texto.

TextRecognizer classe

public sealed class TextRecognizer : System.IDisposable

Reconhece palavras e linhas, e seus limites quadriláteros, em uma imagem de origem.

Método TextRecognizer.Close

Elimina o objeto e os recursos associados.

Comentários

Não implementado em C#.

Método TextRecognizer.CreateAsync

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

Cria de forma assíncrona uma nova instância da classe TextRecognizer.

Devoluções

Uma nova instância da classe TextRecognizer.

Isso retornará um erro se GetModelReadyStatus não estiver Pronto.

Método TextRecognizer.IsAvailable

public static bool IsAvailable ();

Recupera se o modelo de linguagem subjacente está instalado.

Devoluções

True se o modelo de linguagem subjacente estiver instalado. Caso contrário, falso.

Método TextRecognizer.MakeAvailableAsync

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Garante que o modelo de linguagem subjacente esteja instalado e disponível para uso.

Devoluções

Uma ação assíncrona com progresso que retorna um PackageDeploymentResult quando concluída.

Método TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Reconheça o texto na imagem fornecida.

Parâmetros
imageBuffer

Um bitmap não compactado.

Opções

Opções para configurar o modelo de reconhecimento de texto para o TextRecognizer.

Devoluções

O texto reconhecido.

Método TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Reconheça de forma assíncrona o texto na imagem fornecida.

Parâmetros
imageBuffer

Um bitmap não compactado.

Opções

Opções para configurar o modelo de reconhecimento de texto para o TextRecognizer.

Devoluções

O texto reconhecido.

TextRecognizerOptions classe

public sealed class TextRecognizerOptions

Fornece opções para configurar o modelo de reconhecimento de texto para um TextRecognizer.

Propriedade MaxAnalysisSize do TextRecognizerOptions

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

Obtém ou define o tamanho máximo da imagem.

Valor do imóvel

O tamanho máximo da imagem. O valor padrão é 1152 largura e 768 altura.

Comentários

Este tamanho é uma sugestão e nem sempre será seguido.

Se a imagem de origem for maior do que o tamanho máximo, ela será automaticamente reduzida para os limites de tamanho superiores.

TextRecognizerOptions.MaxLineCount propriedade

public uint MaxLineCount { get; set; }

Obtém ou define o número máximo de linhas a serem retornadas da operação de reconhecimento.

Valor do imóvel

O número máximo de linhas a serem retornadas da operação de reconhecimento.

Comentários

O valor predefinido é MaxLineCountSupported. Se for especificado, o máximo de linhas retornadas será o menor entre este valor e MaxLineCountSupported.

TextRecognizerOptions.OrientationDetection propriedade

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Obtém ou define se a orientação do texto deve ser detetada.

Valor do imóvel

Determinar se a orientação do texto deve ser detetada. O valor padrão é Nenhum.

Opções do Reconhecedor de Texto: constructor #ctor

public TextRecognizerOptions ();

Inicializa uma nova instância da classe TextRecognizerOptions.