Compartilhar via


Referência de API para Reconhecimento de Texto por IA (OCR) no SDK de Aplicativos do Windows

Importante

Disponível na versão de lançamento mais recente do canal experimental do SDK do Aplicativo do Windows.

O canal experimental do SDK do Aplicativo do Windows inclui APIs e recursos em estágios iniciais de desenvolvimento. Todas as APIs no canal experimental estão sujeitas a extensas revisões e alterações interruptivas, podendo ser removidas de versões subsequentes a qualquer momento. Não há suporte para recursos experimentais para uso em ambientes de produção e aplicativos que os usam não podem ser publicados na Microsoft Store.

  • Não há suporte para aplicativos não empacotados.

Saiba mais sobre as APIs SDK do Aplicativo Windows, apoiadas por IA (inteligência artificial), que podem detectar e extrair texto (caracteres, palavras, linhas, limites de texto poligonais e níveis de confiança para cada correspondência) em imagens e convertê-lo em fluxos de caracteres legíveis por computador.

Para obter mais detalhes, consulte Introdução ao OCR (reconhecimento de texto) no SDK do Aplicativo Windows.

Dica

Forneça feedback sobre essas APIs e suas funcionalidades criando um novo problema no repositório GitHub do SDK do Aplicativo Windows (inclua OCR no título) ou respondendo a um problema existente.


Namespace Microsoft.Windows.Vision

Fornece APIs para modelos de aprendizado de máquina que analisam o conteúdo textual de imagens.

Enumeração DetectedLineStyle

public enum DetectedLineStyle

Especifica os estilos de linha que podem ser reconhecidos.

Fields

Manuscrito

A linha de texto é escrita à mão.

Outros 1%

A linha de texto não é escrita à mão.

Enumeração OrientationDetectionOptions

public enum OrientationDetectionOptions

Especifica as orientações de texto que podem ser reconhecidas.

Fields

Nenhuma = 0

A orientação não é reconhecida.

detectOrientation:

A orientação é reconhecida.

Classe RecognizedLine

public sealed class RecognizedLine

Representa uma única linha de texto reconhecido.

Propriedade RecognizedLine.Style

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Obtém o estilo de linha reconhecido.

Valor da propriedade

o estilo de linha reconhecido.

Comentários

Inclui se a linha de texto foi manuscrita ou não e o nível de confiança de reconhecimento.

Propriedade RecognizedLine.Text

public string Text { get; }

Obtém o texto da linha reconhecida.

Valor da propriedade

O texto da linha reconhecida.

Comentários

Todas as palavras concatenadas com espaços.

Propriedade RecognizedLine.Words

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

As palavras na linha reconhecida.

Valor da propriedade

As palavras na linha reconhecida.

Struct RecognizedLineStyle

public struct RecognizedLineStyle

Representa o estilo da linha reconhecida.

Fields

Confiança

O nível de confiança do reconhecimento de estilo de linha.

Nome

O nome do estilo de linha.

Classe RecognizedText

public sealed class RecognizedText

Representa o resultado de uma operação de reconhecimento de imagem para texto.

Propriedade RecognizedText.ImageAngle

public float ImageAngle { get; }

Obtém o ângulo de rotação no sentido horário do texto reconhecido em graus.

Valor da propriedade

O ângulo, em graus, da rotação no sentido horário.

Propriedade RecognizedText.Lines

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Obtém a coleção de linhas reconhecidas.

Valor da propriedade

A coleção de linhas reconhecidas.

Classe RecognizedWord

public sealed class RecognizedWord

Representa uma única palavra reconhecida.

Propriedade RecognizedWord.BoundingBox

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Obtém o limite quadrilátero da palavra reconhecida.

Valor da propriedade

O limite quadrilátero da palavra reconhecida. TopLeft é relativo à rotação da palavra.

Propriedade RecognizedWord.Confidence

public float Confidence { get; }

Obtém a probabilidade de que essa palavra tenha sido reconhecida corretamente.

Valor da propriedade

Uau provavelmente esta palavra foi reconhecida corretamente. O valor varia de 0,0 a 1,0, inclusive.

Propriedade RecognizedWord.Text

public string Text { get; }

Obtém o texto da palavra reconhecida.

Valor da propriedade

O texto da palavra reconhecida.

Struct TextRecognition.BoundingBox

public struct BoundingBox

Um polígono com 4 pontos usados para o limite de palavras reconhecidas e linhas de texto.

Fields

bottomLeft

O canto inferior esquerdo do .

bottomRight

O canto inferior direito da caixa delimitadora.

topLeft

O ponto superior esquerdo da caixa delimitadora.

topRight

O ponto superior direito da caixa delimitadora.

Comentários

Quando retornados como um limite para uma palavra ou linha, os pontos TopLeft, TopRight, BottomRight e BottomLeft são relativos à rotação e inclinação do texto reconhecido na imagem. O diagrama a seguir mostra o layout de ponto para diferentes rotações de texto em que 0 é TopLeft, 1 é TopRight, 2 é BottomRight e 3 é BottomLeft, todos relativos ao texto.

Diagrama de três exemplos de caixas delimitadoras mostrando como os pontos de canto são identificados com base na rotação do texto.

Classe TextRecognizer

public sealed class TextRecognizer : System.IDisposable

Reconhece palavras e linhas, e seus limites quadriláteros, em uma imagem de origem.

Método TextRecognizer.Close

Descarta o objeto e os recursos associados.

Comentários

Não implementado em C#.

Método TextRecognizer.CreateAsync

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

Cria de forma assíncrona uma nova instância da classe TextRecognizer.

Devoluções

Uma nova instância da classe TextRecognizer.

Isso retornará um erro se GetModelReadyStatus não estiver pronto.

Método TextRecognizer.IsAvailable

public static bool IsAvailable ();

Recupera se o modelo de idioma subjacente está instalado.

Devoluções

True se o modelo de idioma subjacente estiver instalado. Caso contrário, false.

Método TextRecognizer.MakeAvailableAsync

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Garante que o modelo de idioma subjacente esteja instalado e disponível para uso.

Devoluções

Uma ação assíncrona com progresso que retorna um PackageDeploymentResult na conclusão.

Método TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Reconheça o texto na imagem fornecida.

Parâmetros
imageBuffer

Um bitmap não compactado.

opções

Opções para configurar o modelo de reconhecimento de texto para o TextRecognizer.

Devoluções

O texto reconhecido.

Método TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Reconhecer texto de forma assíncrona na imagem fornecida.

Parâmetros
imageBuffer

Um bitmap não compactado.

opções

Opções para configurar o modelo de reconhecimento de texto para o TextRecognizer.

Devoluções

O texto reconhecido.

Classe TextRecognizerOptions

public sealed class TextRecognizerOptions

Fornece opções para configurar o modelo de reconhecimento de texto para um TextRecognizer.

Propriedade TextRecognizerOptions.MaxAnalysisSize

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

Obtém ou define o tamanho máximo de falha.

Valor da propriedade

Tamanho máximo da imagem. O valor padrão é 1152 de largura e 768 de altura.

Comentários

Esse tamanho é uma sugestão, e nem sempre pode ser honrado.

Se a imagem de origem for maior do que o tamanho máximo, ela será automaticamente reduzida para os limites de tamanho superiores.

Propriedade TextRecognizerOptions.MaxLineCount

public uint MaxLineCount { get; set; }

Obtém ou define o número máximo de linhas a serem retornadas da operação de reconhecimento.

Valor da propriedade

O número máximo de linhas a serem retornadas da operação de reconhecimento.

Comentários

O padrão é MaxLineCountSupported. Se especificado, o máximo de linhas retornadas será o menor desse valor e MaxLineCountSupported.

Propriedade TextRecognizerOptions.OrientationDetection

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Obtém ou define a orientação do texto.

Valor da propriedade

Se a orientação do texto deve ser detectada. O valor padrão é None.

Construtor TextRecognizerOptions.#ctor

public TextRecognizerOptions ();

Inicializa uma nova instância da classe usando o texto fornecido.