API-Ref für AI-gesicherte Texterkennung (OCR) im Windows App SDK
Wichtig
Dieses Feature ist noch nicht verfügbar. Es wird erwartet, dass es in einer bevorstehenden experimentellen Kanalversion des Windows App SDK ausgeliefert wird.
Der experimentelle Kanal des Windows App SDK enthält APIs und Features in frühen Entwicklungsphasen. Alle APIs im experimentellen Kanal unterliegen umfangreichen Überarbeitungen und Breaking Changes und können jederzeit aus nachfolgenden Versionen entfernt werden. Sie werden nicht für die Verwendung in Produktionsumgebungen unterstützt, und Apps, die experimentelle Features verwenden, können nicht im Microsoft Store veröffentlicht werden.
Erfahren Sie mehr über die Windows App SDK-APIs , die durch künstliche Intelligenz (AI) unterstützt werden, die Text (Zeichen, Wörter, Zeilen, polygonale Textgrenzen und Konfidenzniveaus für jede Übereinstimmung) innerhalb von Bildern erkennen und extrahieren und in maschinenlesbare Zeichenströme konvertieren können.
Weitere Informationen finden Sie unter "Erste Schritte mit der Texterkennung (OCR)" im Windows App SDK.
Tipp
Geben Sie Feedback zu diesen APIs und deren Funktionalität, indem Sie ein neues Problem im GitHub-Repository des Windows App SDK erstellen. (Stellen Sie sicher, dass Sie OCR in den Titel einschließen!)
Microsoft.Windows.Vision-Namespace
Stellt APIs für Machine Learning-Modelle bereit, die den Textinhalt von Bildern analysieren.
DetectedLineStyle-Aufzählung
public enum DetectedLineStyle
Gibt die Linienarten an, die erkannt werden können.
Felder
Handschriftlich
Die Textzeile wird handschriftlichen Text geschrieben.
Other 1%
Die Textzeile wird nicht handschriftlichen Text geschrieben.
OrientationDetectionOptions-Aufzählung
public enum OrientationDetectionOptions
Gibt die Textausrichtungen an, die erkannt werden können.
Felder
None = 0
Die Ausrichtung wird nicht erkannt.
detectOrientation:
Die Ausrichtung wird erkannt.
RecognizedLine-Klasse
public sealed class RecognizedLine
Stellt eine einzelne Zeile erkannten Texts dar.
RecognizedLine.Style-Eigenschaft
public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }
Ruft die erkannte Linienart ab.
Eigenschaftswert
die erkannte Linienart.
Hinweise
Enthält, ob die Textzeile handschriftlich geschrieben wurde oder nicht, und die Vertrauenswürdigkeit der Erkennung.
RecognizedLine.Text-Eigenschaft
public string Text { get; }
Ruft den Text der erkannten Zeile ab.
Eigenschaftswert
Der Text der erkannten Zeile.
Hinweise
Alle Wörter, die mit Leerzeichen verkettet sind.
RecognizedLine.Words-Eigenschaft
public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }
Die Wörter in der erkannten Zeile.
Eigenschaftswert
Die Wörter in der erkannten Zeile.
RecognizedLineStyle-Struktur
public struct RecognizedLineStyle
Stellt die Formatvorlage der erkannten Linie dar.
Felder
Zuverlässigkeit
Die Konfidenzstufe der Linienarterkennung.
Name
Der Name der Linienart.
RecognizedText-Klasse
public sealed class RecognizedText
Stellt das Ergebnis eines Bild-zu-Text-Erkennungsvorgangs dar.
RecognizedText.ImageAngle-Eigenschaft
public float ImageAngle { get; }
Ruft den Drehwinkel im Uhrzeigersinn des erkannten Texts in Grad ab.
Eigenschaftswert
In Grad der Winkel einer Drehung im Uhrzeigersinn.
RecognizedText.Lines-Eigenschaft
public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }
Ruft die Auflistung der erkannten Zeilen ab.
Eigenschaftswert
Die Sammlung erkannter Zeilen.
RecognizedWord-Klasse
public sealed class RecognizedWord
Stellt ein einzelnes erkanntes Wort dar.
RecognizedWord.BoundingBox-Eigenschaft
public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }
Ruft die viereckige Grenze des erkannten Worts ab.
Eigenschaftswert
Die viereckige Grenze des erkannten Worts. TopLeft ist relativ zur Drehung des Worts.
RecognizedWord.Confidence-Eigenschaft
public float Confidence { get; }
Ruft ab, wie wahrscheinlich dieses Wort richtig erkannt wurde.
Eigenschaftswert
Wow wahrscheinlich wurde dieses Wort richtig erkannt. Der Wert reicht von 0,0 bis einschließlich 1,0.
RecognizedWord.Text-Eigenschaft
public string Text { get; }
Ruft den Text des erkannten Worts ab.
Eigenschaftswert
Der Text des erkannten Worts.
TextRecognition.BoundingBox-Struktur
public struct BoundingBox
Ein Polygon mit 4 Punkten, das für die Grenze erkannter Wörter und Textzeilen verwendet wird.
Felder
bottomLeft
Die linke untere Ecke des -Steuerelements
bottomRight
Die untere rechte Ecke des umgebenden Felds.
topLeft
Der obere linke Punkt des umgebenden Felds.
topRight
Der obere rechte Punkt des umgebenden Felds.
Hinweise
Wenn sie als Grenze für ein Wort oder eine Linie zurückgegeben wird, sind die Punkte "TopLeft", "TopRight", "BottomRight" und "BottomLeft" relativ zur Drehung und Neigung des erkannten Texts im Bild. Das folgende Diagramm zeigt das Punktlayout für unterschiedliche Textdrehungen, wobei 0 "TopLeft", "1" "TopRight", "2" "BottomRight" und "3" "BottomLeft" ist, die alle relativ zum Text sind.
TextRecognizer-Klasse
public sealed class TextRecognizer : System.IDisposable
Erkennt Wörter und Linien und deren vierfache Begrenzungen in einem Quellbild.
TextRecognizer.Close-Methode
Entfernt das Objekt und die zugeordneten Ressourcen.
Hinweise
In nicht implementiert.
TextRecognizer.CreateAsync-Methode
public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();
Erstellt asynchron eine neue Instanz der TextRecognizer-Klasse.
Gibt zurück
Eine neue Instanz der TextRecognizer-Klasse.
Dadurch wird ein Fehler zurückgegeben, wenn GetModelReadyStatus nicht bereit ist.
TextRecognizer.IsAvailable-Methode
public static bool IsAvailable ();
Ruft ab, ob das zugrunde liegende Sprachmodell installiert ist.
Gibt zurück
True, wenn das zugrunde liegende Sprachmodell installiert ist. Andernfalls lautet der Wert false.
TextRecognizer.MakeAvailableAsync-Methode
public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult,
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();
Stellt sicher, dass das zugrunde liegende Sprachmodell installiert und zur Verwendung verfügbar ist.
Gibt zurück
Eine asynchrone Aktion mit Fortschritt, die ein PackageDeploymentResult nach Abschluss zurückgibt.
Methode TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)
public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Erkennen von Text im bereitgestellten Bild.
Parameter
imageBuffer
Eine nicht komprimierte Bitmap.
Optionen
Optionen zum Konfigurieren des Texterkennungsmodells für den TextRecognizer.
Gibt zurück
Der erkannte Text.
Methode TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)
public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Asynchrones Erkennen von Text im bereitgestellten Bild.
Parameter
imageBuffer
Eine nicht komprimierte Bitmap.
Optionen
Optionen zum Konfigurieren des Texterkennungsmodells für den TextRecognizer.
Gibt zurück
Der erkannte Text.
TextRecognizerOptions-Klasse
public sealed class TextRecognizerOptions
Bietet Optionen zum Konfigurieren des Texterkennungsmodells für einen TextRecognizer.
TextRecognizerOptions.MaxAnalysisSize-Eigenschaft
public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }
Ruft die maximale Fehlergröße ab oder legt diese fest.
Eigenschaftswert
Maximale Bildgröße. Der Standardwert beträgt 1152 Breite und 768 Höhe.
Hinweise
Diese Größe ist ein Vorschlag und wird möglicherweise nicht immer berücksichtigt.
Wenn das Quellbild größer als die maximale Größe ist, wird es automatisch auf die oberen Größenbeschränkungen skaliert.
TextRecognizerOptions.MaxLineCount-Eigenschaft
public uint MaxLineCount { get; set; }
Ruft die maximale Anzahl von Zeilen ab, die vom Erkennungsvorgang zurückgegeben werden sollen, oder legt diese fest.
Eigenschaftswert
Die maximale Anzahl von Zeilen, die vom Erkennungsvorgang zurückgegeben werden sollen.
Hinweise
Der Standardwert ist "MaxLineCountSupported". Wenn angegeben, sind die zurückgegebenen maximalen Zeilen kleiner als dieser Wert und MaxLineCountSupported.
TextRecognizerOptions.OrientationDetection-Eigenschaft
public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }
Ruft ab oder legt fest, ob die Textausrichtung erkannt wird.
Eigenschaftswert
Gibt an, ob die Textausrichtung erkannt werden soll. Der Standardwert ist Keiner.
TextRecognizerOptions.#ctor-Konstruktor
public TextRecognizerOptions ();
Initialisiert eine neue Instanz der -Klasse mit dem angegebenen Text.