Referência de API para Reconhecimento de Texto por IA (OCR) no SDK de Aplicativos do Windows
Importante
Disponível na versão de lançamento mais recente do canal experimental do SDK do Aplicativo do Windows.
O canal experimental do SDK do Aplicativo do Windows inclui APIs e recursos em estágios iniciais de desenvolvimento. Todas as APIs no canal experimental estão sujeitas a extensas revisões e alterações interruptivas, podendo ser removidas de versões subsequentes a qualquer momento. Não há suporte para recursos experimentais para uso em ambientes de produção e aplicativos que os usam não podem ser publicados na Microsoft Store.
- Não há suporte para aplicativos não empacotados.
Saiba mais sobre as APIs SDK do Aplicativo Windows, apoiadas por IA (inteligência artificial), que podem detectar e extrair texto (caracteres, palavras, linhas, limites de texto poligonais e níveis de confiança para cada correspondência) em imagens e convertê-lo em fluxos de caracteres legíveis por computador.
Para obter mais detalhes, consulte Introdução ao OCR (reconhecimento de texto) no SDK do Aplicativo Windows.
Dica
Forneça feedback sobre essas APIs e suas funcionalidades criando um novo problema no repositório GitHub do SDK do Aplicativo Windows (inclua OCR no título) ou respondendo a um problema existente.
Namespace Microsoft.Windows.Vision
Fornece APIs para modelos de aprendizado de máquina que analisam o conteúdo textual de imagens.
Enumeração DetectedLineStyle
public enum DetectedLineStyle
Especifica os estilos de linha que podem ser reconhecidos.
Fields
Manuscrito
A linha de texto é escrita à mão.
Outros 1%
A linha de texto não é escrita à mão.
Enumeração OrientationDetectionOptions
public enum OrientationDetectionOptions
Especifica as orientações de texto que podem ser reconhecidas.
Fields
Nenhuma = 0
A orientação não é reconhecida.
detectOrientation:
A orientação é reconhecida.
Classe RecognizedLine
public sealed class RecognizedLine
Representa uma única linha de texto reconhecido.
Propriedade RecognizedLine.Style
public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }
Obtém o estilo de linha reconhecido.
Valor da propriedade
o estilo de linha reconhecido.
Comentários
Inclui se a linha de texto foi manuscrita ou não e o nível de confiança de reconhecimento.
Propriedade RecognizedLine.Text
public string Text { get; }
Obtém o texto da linha reconhecida.
Valor da propriedade
O texto da linha reconhecida.
Comentários
Todas as palavras concatenadas com espaços.
Propriedade RecognizedLine.Words
public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }
As palavras na linha reconhecida.
Valor da propriedade
As palavras na linha reconhecida.
Struct RecognizedLineStyle
public struct RecognizedLineStyle
Representa o estilo da linha reconhecida.
Fields
Confiança
O nível de confiança do reconhecimento de estilo de linha.
Nome
O nome do estilo de linha.
Classe RecognizedText
public sealed class RecognizedText
Representa o resultado de uma operação de reconhecimento de imagem para texto.
Propriedade RecognizedText.ImageAngle
public float ImageAngle { get; }
Obtém o ângulo de rotação no sentido horário do texto reconhecido em graus.
Valor da propriedade
O ângulo, em graus, da rotação no sentido horário.
Propriedade RecognizedText.Lines
public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }
Obtém a coleção de linhas reconhecidas.
Valor da propriedade
A coleção de linhas reconhecidas.
Classe RecognizedWord
public sealed class RecognizedWord
Representa uma única palavra reconhecida.
Propriedade RecognizedWord.BoundingBox
public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }
Obtém o limite quadrilátero da palavra reconhecida.
Valor da propriedade
O limite quadrilátero da palavra reconhecida. TopLeft é relativo à rotação da palavra.
Propriedade RecognizedWord.Confidence
public float Confidence { get; }
Obtém a probabilidade de que essa palavra tenha sido reconhecida corretamente.
Valor da propriedade
Uau provavelmente esta palavra foi reconhecida corretamente. O valor varia de 0,0 a 1,0, inclusive.
Propriedade RecognizedWord.Text
public string Text { get; }
Obtém o texto da palavra reconhecida.
Valor da propriedade
O texto da palavra reconhecida.
Struct TextRecognition.BoundingBox
public struct BoundingBox
Um polígono com 4 pontos usados para o limite de palavras reconhecidas e linhas de texto.
Fields
bottomLeft
O canto inferior esquerdo do .
bottomRight
O canto inferior direito da caixa delimitadora.
topLeft
O ponto superior esquerdo da caixa delimitadora.
topRight
O ponto superior direito da caixa delimitadora.
Comentários
Quando retornados como um limite para uma palavra ou linha, os pontos TopLeft, TopRight, BottomRight e BottomLeft são relativos à rotação e inclinação do texto reconhecido na imagem. O diagrama a seguir mostra o layout de ponto para diferentes rotações de texto em que 0 é TopLeft, 1 é TopRight, 2 é BottomRight e 3 é BottomLeft, todos relativos ao texto.
Classe TextRecognizer
public sealed class TextRecognizer : System.IDisposable
Reconhece palavras e linhas, e seus limites quadriláteros, em uma imagem de origem.
Método TextRecognizer.Close
Descarta o objeto e os recursos associados.
Comentários
Não implementado em C#.
Método TextRecognizer.CreateAsync
public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();
Cria de forma assíncrona uma nova instância da classe TextRecognizer.
Devoluções
Uma nova instância da classe TextRecognizer.
Isso retornará um erro se GetModelReadyStatus não estiver pronto.
Método TextRecognizer.IsAvailable
public static bool IsAvailable ();
Recupera se o modelo de idioma subjacente está instalado.
Devoluções
True se o modelo de idioma subjacente estiver instalado. Caso contrário, false.
Método TextRecognizer.MakeAvailableAsync
public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult,
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();
Garante que o modelo de idioma subjacente esteja instalado e disponível para uso.
Devoluções
Uma ação assíncrona com progresso que retorna um PackageDeploymentResult na conclusão.
Método TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)
public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Reconheça o texto na imagem fornecida.
Parâmetros
imageBuffer
Um bitmap não compactado.
opções
Opções para configurar o modelo de reconhecimento de texto para o TextRecognizer.
Devoluções
O texto reconhecido.
Método TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)
public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Reconhecer texto de forma assíncrona na imagem fornecida.
Parâmetros
imageBuffer
Um bitmap não compactado.
opções
Opções para configurar o modelo de reconhecimento de texto para o TextRecognizer.
Devoluções
O texto reconhecido.
Classe TextRecognizerOptions
public sealed class TextRecognizerOptions
Fornece opções para configurar o modelo de reconhecimento de texto para um TextRecognizer.
Propriedade TextRecognizerOptions.MaxAnalysisSize
public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }
Obtém ou define o tamanho máximo de falha.
Valor da propriedade
Tamanho máximo da imagem. O valor padrão é 1152 de largura e 768 de altura.
Comentários
Esse tamanho é uma sugestão, e nem sempre pode ser honrado.
Se a imagem de origem for maior do que o tamanho máximo, ela será automaticamente reduzida para os limites de tamanho superiores.
Propriedade TextRecognizerOptions.MaxLineCount
public uint MaxLineCount { get; set; }
Obtém ou define o número máximo de linhas a serem retornadas da operação de reconhecimento.
Valor da propriedade
O número máximo de linhas a serem retornadas da operação de reconhecimento.
Comentários
O padrão é MaxLineCountSupported. Se especificado, o máximo de linhas retornadas será o menor desse valor e MaxLineCountSupported.
Propriedade TextRecognizerOptions.OrientationDetection
public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }
Obtém ou define a orientação do texto.
Valor da propriedade
Se a orientação do texto deve ser detectada. O valor padrão é None.
Construtor TextRecognizerOptions.#ctor
public TextRecognizerOptions ();
Inicializa uma nova instância da classe usando o texto fornecido.