Partager via


Référence d’API pour la reconnaissance de texte IA (OCR) dans le Kit de développement logiciel (SDK) d’application Windows

Importante

Disponible dans la dernière version de la chaîne expérimentale du SDK d’applications Windows.

Le canal expérimental du Kit de développement logiciel (SDK) d’application Windows inclut des API et des fonctionnalités au début du développement. Toutes les API de la chaîne expérimentale font l'objet de révisions approfondies et de changements radicaux et peuvent être supprimées des versions ultérieures à tout moment. Les fonctionnalités expérimentales ne sont pas prises en charge pour une utilisation dans les environnements de production et les applications qui les utilisent ne peuvent pas être publiées dans le Microsoft Store.

  • Les applications autonomes ne sont pas prises en charge.

Découvrez les API du SDK d'applications Windows, soutenues par l'intelligence artificielle (IA), qui peuvent détecter et extraire du texte (caractères, mots, lignes, limites polygonales du texte et niveaux de confiance pour chaque correspondance) dans des images et les convertir en flux de caractères lisibles par machine.

Pour plus de détails, voir Démarrer avec la reconnaissance de texte (OCR) dans le SDK d'applications Windows.

Conseil

Fournissez des commentaires sur ces API et leurs fonctionnalités en créant un nouveau problème dans le référentiel GitHub du Kit de développement logiciel (SDK) d’application Windows (inclure ocr dans le titre) ou en répondant à un problème existant.


Espace de noms Microsoft.Windows.Vision

Fournit des API pour les modèles d'apprentissage automatique qui analysent le contenu textuel des images.

Énumération DetectedLineStyle

public enum DetectedLineStyle

Spécifie les styles de ligne qui peuvent être reconnus.

Champs

Écriture manuscrite : 0

La ligne de texte est écrite à la main.

Autre : 1

La ligne de texte n'est pas écrite à la main.

Énumération OrientationDetectionOptions

public enum OrientationDetectionOptions

Spécifie les orientations de texte qui peuvent être reconnues.

Champs

Aucune : 0

L'orientation n'est pas reconnue.

Détecter l'orientation : 1

L'orientation est reconnue.

Classe RecognizedLine

public sealed class RecognizedLine

Représente une seule ligne de texte reconnue.

RecognizedLine.Style property

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Obtient le style de ligne reconnu.

Valeur de propriété

Le style de ligne reconnu.

Remarques

Indique si la ligne de texte est manuscrite ou non et le niveau de confiance de la reconnaissance.

RecognizedLine.Text property

public string Text { get; }

Obtient le texte de la ligne reconnue.

Valeur de propriété

Le texte de la ligne reconnue.

Remarques

Tous les mots concaténés avec des espaces.

Propriété RecognizedLine.Words

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

Les mots de la ligne reconnue.

Valeur de propriété

Les mots de la ligne reconnue.

Structure RecognizedLineStyle

public struct RecognizedLineStyle

Représente le style de la ligne reconnue.

Champs

Confiance

Le niveau de confiance de la reconnaissance du style de ligne.

Name

Le nom du style de ligne.

Classe RecognizedText

public sealed class RecognizedText

Représente le résultat d'une opération de reconnaissance d'image en texte.

Propriété RecognizedText.ImageAngle

public float ImageAngle { get; }

Obtient l'angle de rotation dans le sens des aiguilles d'une montre du texte reconnu en degrés.

Valeur de propriété

L'angle de rotation dans le sens des aiguilles d'une montre du texte reconnu en degrés.

Propriété RecognizedText.Lines

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Obtient la collection de lignes reconnues.

Valeur de propriété

La collection de lignes reconnues.

Classe RecognizedWord

public sealed class RecognizedWord

Représente un seul mot reconnu.

Propriété RecognizedWord.BoundingBox

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Obtient la limite quadrilatérale du mot reconnu.

Valeur de propriété

La limite du quadrilatère du mot reconnu. TopLeft est relatif à la rotation du mot.

Propriété RecognizedWord.Confidence

public float Confidence { get; }

Indique la probabilité que ce mot soit reconnu correctement.

Valeur de propriété

La probabilité que ce mot ait été reconnu correctement. La valeur est comprise entre 0,0 et 1,0, inclusivement.

Propriété RecognizedWord.Text

public string Text { get; }

Obtient le texte du mot reconnu.

Valeur de propriété

Le texte du mot reconnu.

Structure TextRecognition.BoundingBox

public struct BoundingBox

Un polygone à 4 points utilisé pour délimiter les mots reconnus et les lignes de texte.

Champs

BottomLeft

Le coin inférieur gauche de la boîte de délimitation.

BottomRight

Le coin inférieur droit de la boîte englobante.

TopLeft

Le point supérieur gauche de la boîte englobante.

TopRight

Le point supérieur droit de la boîte de délimitation.

Remarques

Lorsqu'ils sont renvoyés en tant que limites d'un mot ou d'une ligne, les points TopLeft, TopRight, BottomRight et BottomLeft sont relatifs à la rotation et à l'inclinaison du texte reconnu dans l'image. Le diagramme suivant montre la disposition des points pour différentes rotations du texte où 0 est TopLeft, 1 est TopRight, 2 est BottomRight, et 3 est BottomLeft, le tout par rapport au texte.

Schéma de trois exemples de cadres englobants montrant comment les points d’angle sont identifiés en fonction de la rotation du texte.

Classe TextRecognizer

public sealed class TextRecognizer : System.IDisposable

Reconnaît les mots et les lignes, ainsi que leurs limites quadrilatérales, dans une image source.

Méthode TextRecognizer.Close

Libère l’objet et ses ressources associées.

Remarques

Non implémenté en C#.

Méthode TextRecognizer.CreateAsync

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

Crée de manière asynchrone une nouvelle instance de la classe TextRecognizer.

retourne :

Une nouvelle instance de la classe TextRecognizer.

Une erreur sera renvoyée si GetModelReadyStatus n'est pas Ready.

Méthode TextRecognizer.IsAvailable

public static bool IsAvailable ();

Permet de savoir si le modèle linguistique sous-jacent est installé.

retourne :

True si le modèle linguistique sous-jacent est installé. Sinon, False.

Méthode TextRecognizer.MakeAvailableAsync

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Assure que le modèle linguistique sous-jacent est installé et prêt à être utilisé.

retourne :

Une action asynchrone avec progression qui renvoie un PackageDeploymentResult à la fin.

Méthode TextRecognizer.RecognizeTextFromImage(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Reconnaître le texte dans l'image fournie.

Parameters
imageBuffer

Une image bitmap non compressée.

options

Options de configuration du modèle de reconnaissance de texte pour le TextRecognizer.

retourne :

Le texte reconnu.

TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) méthode

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Reconnaître de manière asynchrone le texte dans l'image fournie.

Parameters
imageBuffer

Une image bitmap non compressée.

options

Options de configuration du modèle de reconnaissance de texte pour le TextRecognizer.

retourne :

Le texte reconnu.

Classe TextRecognizerOptions

public sealed class TextRecognizerOptions

Fournit des options pour configurer le modèle de reconnaissance de texte pour un TextRecognizer.

Propriété TextRecognizerOptions.MaxAnalysisSize

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

Obtient ou définit la taille maximale de l'image.

Valeur de propriété

La taille maximale de l'image. La valeur par défaut est de 1152 en largeur et 768 en hauteur.

Remarques

Cette taille est une suggestion et ne sera pas toujours respectée.

Si l'image source est plus grande que la taille maximale, elle sera automatiquement réduite pour respecter les limites de taille supérieures.

Propriété TextRecognizerOptions.MaxLineCount

public uint MaxLineCount { get; set; }

Obtient ou définit le nombre maximal de lignes à renvoyer après l'opération de reconnaissance.

Valeur de propriété

Nombre maximal de lignes à renvoyer lors de l'opération de reconnaissance.

Remarques

La valeur par défaut est MaxLineCountSupported. S'il est spécifié, le nombre maximal de lignes renvoyées sera le moindre de cette valeur et de MaxLineCountSupported.

Propriété TextRecognizerOptions.OrientationDetection

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Obtient ou définit s'il faut détecter l'orientation du texte.

Valeur de propriété

Déterminer si l'orientation du texte doit être détectée. La valeur par défaut est None.

TextRecognizerOptions.#ctor constructor

public TextRecognizerOptions ();

Initialise une nouvelle instance de la classe TextRecognizerOptions.