Référence d’API pour la reconnaissance de texte IA (OCR) dans le Kit de développement logiciel (SDK) d’application Windows
Importante
Disponible dans la dernière version de la chaîne expérimentale du SDK d’applications Windows.
Le canal expérimental du Kit de développement logiciel (SDK) d’application Windows inclut des API et des fonctionnalités au début du développement. Toutes les API de la chaîne expérimentale font l'objet de révisions approfondies et de changements radicaux et peuvent être supprimées des versions ultérieures à tout moment. Les fonctionnalités expérimentales ne sont pas prises en charge pour une utilisation dans les environnements de production et les applications qui les utilisent ne peuvent pas être publiées dans le Microsoft Store.
- Les applications autonomes ne sont pas prises en charge.
Découvrez les API du SDK d'applications Windows, soutenues par l'intelligence artificielle (IA), qui peuvent détecter et extraire du texte (caractères, mots, lignes, limites polygonales du texte et niveaux de confiance pour chaque correspondance) dans des images et les convertir en flux de caractères lisibles par machine.
Pour plus de détails, voir Démarrer avec la reconnaissance de texte (OCR) dans le SDK d'applications Windows.
Conseil
Fournissez des commentaires sur ces API et leurs fonctionnalités en créant un nouveau problème dans le référentiel GitHub du Kit de développement logiciel (SDK) d’application Windows (inclure ocr dans le titre) ou en répondant à un problème existant.
Espace de noms Microsoft.Windows.Vision
Fournit des API pour les modèles d'apprentissage automatique qui analysent le contenu textuel des images.
Énumération DetectedLineStyle
public enum DetectedLineStyle
Spécifie les styles de ligne qui peuvent être reconnus.
Champs
Écriture manuscrite : 0
La ligne de texte est écrite à la main.
Autre : 1
La ligne de texte n'est pas écrite à la main.
Énumération OrientationDetectionOptions
public enum OrientationDetectionOptions
Spécifie les orientations de texte qui peuvent être reconnues.
Champs
Aucune : 0
L'orientation n'est pas reconnue.
Détecter l'orientation : 1
L'orientation est reconnue.
Classe RecognizedLine
public sealed class RecognizedLine
Représente une seule ligne de texte reconnue.
RecognizedLine.Style property
public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }
Obtient le style de ligne reconnu.
Valeur de propriété
Le style de ligne reconnu.
Remarques
Indique si la ligne de texte est manuscrite ou non et le niveau de confiance de la reconnaissance.
RecognizedLine.Text property
public string Text { get; }
Obtient le texte de la ligne reconnue.
Valeur de propriété
Le texte de la ligne reconnue.
Remarques
Tous les mots concaténés avec des espaces.
Propriété RecognizedLine.Words
public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }
Les mots de la ligne reconnue.
Valeur de propriété
Les mots de la ligne reconnue.
Structure RecognizedLineStyle
public struct RecognizedLineStyle
Représente le style de la ligne reconnue.
Champs
Confiance
Le niveau de confiance de la reconnaissance du style de ligne.
Name
Le nom du style de ligne.
Classe RecognizedText
public sealed class RecognizedText
Représente le résultat d'une opération de reconnaissance d'image en texte.
Propriété RecognizedText.ImageAngle
public float ImageAngle { get; }
Obtient l'angle de rotation dans le sens des aiguilles d'une montre du texte reconnu en degrés.
Valeur de propriété
L'angle de rotation dans le sens des aiguilles d'une montre du texte reconnu en degrés.
Propriété RecognizedText.Lines
public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }
Obtient la collection de lignes reconnues.
Valeur de propriété
La collection de lignes reconnues.
Classe RecognizedWord
public sealed class RecognizedWord
Représente un seul mot reconnu.
Propriété RecognizedWord.BoundingBox
public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }
Obtient la limite quadrilatérale du mot reconnu.
Valeur de propriété
La limite du quadrilatère du mot reconnu. TopLeft est relatif à la rotation du mot.
Propriété RecognizedWord.Confidence
public float Confidence { get; }
Indique la probabilité que ce mot soit reconnu correctement.
Valeur de propriété
La probabilité que ce mot ait été reconnu correctement. La valeur est comprise entre 0,0 et 1,0, inclusivement.
Propriété RecognizedWord.Text
public string Text { get; }
Obtient le texte du mot reconnu.
Valeur de propriété
Le texte du mot reconnu.
Structure TextRecognition.BoundingBox
public struct BoundingBox
Un polygone à 4 points utilisé pour délimiter les mots reconnus et les lignes de texte.
Champs
BottomLeft
Le coin inférieur gauche de la boîte de délimitation.
BottomRight
Le coin inférieur droit de la boîte englobante.
TopLeft
Le point supérieur gauche de la boîte englobante.
TopRight
Le point supérieur droit de la boîte de délimitation.
Remarques
Lorsqu'ils sont renvoyés en tant que limites d'un mot ou d'une ligne, les points TopLeft, TopRight, BottomRight et BottomLeft sont relatifs à la rotation et à l'inclinaison du texte reconnu dans l'image. Le diagramme suivant montre la disposition des points pour différentes rotations du texte où 0 est TopLeft, 1 est TopRight, 2 est BottomRight, et 3 est BottomLeft, le tout par rapport au texte.
Classe TextRecognizer
public sealed class TextRecognizer : System.IDisposable
Reconnaît les mots et les lignes, ainsi que leurs limites quadrilatérales, dans une image source.
Méthode TextRecognizer.Close
Libère l’objet et ses ressources associées.
Remarques
Non implémenté en C#.
Méthode TextRecognizer.CreateAsync
public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();
Crée de manière asynchrone une nouvelle instance de la classe TextRecognizer.
retourne :
Une nouvelle instance de la classe TextRecognizer.
Une erreur sera renvoyée si GetModelReadyStatus n'est pas Ready.
Méthode TextRecognizer.IsAvailable
public static bool IsAvailable ();
Permet de savoir si le modèle linguistique sous-jacent est installé.
retourne :
True si le modèle linguistique sous-jacent est installé. Sinon, False.
Méthode TextRecognizer.MakeAvailableAsync
public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult,
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();
Assure que le modèle linguistique sous-jacent est installé et prêt à être utilisé.
retourne :
Une action asynchrone avec progression qui renvoie un PackageDeploymentResult à la fin.
Méthode TextRecognizer.RecognizeTextFromImage(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)
public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Reconnaître le texte dans l'image fournie.
Parameters
imageBuffer
Une image bitmap non compressée.
options
Options de configuration du modèle de reconnaissance de texte pour le TextRecognizer.
retourne :
Le texte reconnu.
TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) méthode
public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Reconnaître de manière asynchrone le texte dans l'image fournie.
Parameters
imageBuffer
Une image bitmap non compressée.
options
Options de configuration du modèle de reconnaissance de texte pour le TextRecognizer.
retourne :
Le texte reconnu.
Classe TextRecognizerOptions
public sealed class TextRecognizerOptions
Fournit des options pour configurer le modèle de reconnaissance de texte pour un TextRecognizer.
Propriété TextRecognizerOptions.MaxAnalysisSize
public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }
Obtient ou définit la taille maximale de l'image.
Valeur de propriété
La taille maximale de l'image. La valeur par défaut est de 1152 en largeur et 768 en hauteur.
Remarques
Cette taille est une suggestion et ne sera pas toujours respectée.
Si l'image source est plus grande que la taille maximale, elle sera automatiquement réduite pour respecter les limites de taille supérieures.
Propriété TextRecognizerOptions.MaxLineCount
public uint MaxLineCount { get; set; }
Obtient ou définit le nombre maximal de lignes à renvoyer après l'opération de reconnaissance.
Valeur de propriété
Nombre maximal de lignes à renvoyer lors de l'opération de reconnaissance.
Remarques
La valeur par défaut est MaxLineCountSupported. S'il est spécifié, le nombre maximal de lignes renvoyées sera le moindre de cette valeur et de MaxLineCountSupported.
Propriété TextRecognizerOptions.OrientationDetection
public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }
Obtient ou définit s'il faut détecter l'orientation du texte.
Valeur de propriété
Déterminer si l'orientation du texte doit être détectée. La valeur par défaut est None.
TextRecognizerOptions.#ctor constructor
public TextRecognizerOptions ();
Initialise une nouvelle instance de la classe TextRecognizerOptions.
Contenu associé
- Développement d'applications et de fonctionnalités d'intelligence artificielle générative responsable sur Windows
- Bien démarrer avec la reconnaissance de texte (OCR) dans le SDK d'applications Windows
- Kit de développement logiciel (SDK) pour application Windows
- Dernières notes de version pour le SDK d'applications Windows