Freigeben über


API-Ref für AI-gesicherte Texterkennung (OCR) im Windows App SDK

Wichtig

Dieses Feature ist noch nicht verfügbar. Es wird erwartet, dass es in einer bevorstehenden experimentellen Kanalversion des Windows App SDK ausgeliefert wird.

Der experimentelle Kanal des Windows App SDK enthält APIs und Features in frühen Entwicklungsphasen. Alle APIs im experimentellen Kanal unterliegen umfangreichen Überarbeitungen und Breaking Changes und können jederzeit aus nachfolgenden Versionen entfernt werden. Sie werden nicht für die Verwendung in Produktionsumgebungen unterstützt, und Apps, die experimentelle Features verwenden, können nicht im Microsoft Store veröffentlicht werden.

Erfahren Sie mehr über die Windows App SDK-APIs , die durch künstliche Intelligenz (AI) unterstützt werden, die Text (Zeichen, Wörter, Zeilen, polygonale Textgrenzen und Konfidenzniveaus für jede Übereinstimmung) innerhalb von Bildern erkennen und extrahieren und in maschinenlesbare Zeichenströme konvertieren können.

Weitere Informationen finden Sie unter "Erste Schritte mit der Texterkennung (OCR)" im Windows App SDK.

Tipp

Geben Sie Feedback zu diesen APIs und deren Funktionalität, indem Sie ein neues Problem im GitHub-Repository des Windows App SDK erstellen. (Stellen Sie sicher, dass Sie OCR in den Titel einschließen!)


Microsoft.Windows.Vision-Namespace

Stellt APIs für Machine Learning-Modelle bereit, die den Textinhalt von Bildern analysieren.

DetectedLineStyle-Aufzählung

public enum DetectedLineStyle

Gibt die Linienarten an, die erkannt werden können.

Felder

Handschriftlich

Die Textzeile wird handschriftlichen Text geschrieben.

Other 1%

Die Textzeile wird nicht handschriftlichen Text geschrieben.

OrientationDetectionOptions-Aufzählung

public enum OrientationDetectionOptions

Gibt die Textausrichtungen an, die erkannt werden können.

Felder

None = 0

Die Ausrichtung wird nicht erkannt.

detectOrientation:

Die Ausrichtung wird erkannt.

RecognizedLine-Klasse

public sealed class RecognizedLine

Stellt eine einzelne Zeile erkannten Texts dar.

RecognizedLine.Style-Eigenschaft

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Ruft die erkannte Linienart ab.

Eigenschaftswert

die erkannte Linienart.

Hinweise

Enthält, ob die Textzeile handschriftlich geschrieben wurde oder nicht, und die Vertrauenswürdigkeit der Erkennung.

RecognizedLine.Text-Eigenschaft

public string Text { get; }

Ruft den Text der erkannten Zeile ab.

Eigenschaftswert

Der Text der erkannten Zeile.

Hinweise

Alle Wörter, die mit Leerzeichen verkettet sind.

RecognizedLine.Words-Eigenschaft

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

Die Wörter in der erkannten Zeile.

Eigenschaftswert

Die Wörter in der erkannten Zeile.

RecognizedLineStyle-Struktur

public struct RecognizedLineStyle

Stellt die Formatvorlage der erkannten Linie dar.

Felder

Zuverlässigkeit

Die Konfidenzstufe der Linienarterkennung.

Name

Der Name der Linienart.

RecognizedText-Klasse

public sealed class RecognizedText

Stellt das Ergebnis eines Bild-zu-Text-Erkennungsvorgangs dar.

RecognizedText.ImageAngle-Eigenschaft

public float ImageAngle { get; }

Ruft den Drehwinkel im Uhrzeigersinn des erkannten Texts in Grad ab.

Eigenschaftswert

In Grad der Winkel einer Drehung im Uhrzeigersinn.

RecognizedText.Lines-Eigenschaft

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Ruft die Auflistung der erkannten Zeilen ab.

Eigenschaftswert

Die Sammlung erkannter Zeilen.

RecognizedWord-Klasse

public sealed class RecognizedWord

Stellt ein einzelnes erkanntes Wort dar.

RecognizedWord.BoundingBox-Eigenschaft

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Ruft die viereckige Grenze des erkannten Worts ab.

Eigenschaftswert

Die viereckige Grenze des erkannten Worts. TopLeft ist relativ zur Drehung des Worts.

RecognizedWord.Confidence-Eigenschaft

public float Confidence { get; }

Ruft ab, wie wahrscheinlich dieses Wort richtig erkannt wurde.

Eigenschaftswert

Wow wahrscheinlich wurde dieses Wort richtig erkannt. Der Wert reicht von 0,0 bis einschließlich 1,0.

RecognizedWord.Text-Eigenschaft

public string Text { get; }

Ruft den Text des erkannten Worts ab.

Eigenschaftswert

Der Text des erkannten Worts.

TextRecognition.BoundingBox-Struktur

public struct BoundingBox

Ein Polygon mit 4 Punkten, das für die Grenze erkannter Wörter und Textzeilen verwendet wird.

Felder

bottomLeft

Die linke untere Ecke des -Steuerelements

bottomRight

Die untere rechte Ecke des umgebenden Felds.

topLeft

Der obere linke Punkt des umgebenden Felds.

topRight

Der obere rechte Punkt des umgebenden Felds.

Hinweise

Wenn sie als Grenze für ein Wort oder eine Linie zurückgegeben wird, sind die Punkte "TopLeft", "TopRight", "BottomRight" und "BottomLeft" relativ zur Drehung und Neigung des erkannten Texts im Bild. Das folgende Diagramm zeigt das Punktlayout für unterschiedliche Textdrehungen, wobei 0 "TopLeft", "1" "TopRight", "2" "BottomRight" und "3" "BottomLeft" ist, die alle relativ zum Text sind.

Diagramm mit drei Begrenzungsfeldbeispielen, die zeigen, wie Eckpunkte basierend auf der Textdrehung identifiziert werden.

TextRecognizer-Klasse

public sealed class TextRecognizer : System.IDisposable

Erkennt Wörter und Linien und deren vierfache Begrenzungen in einem Quellbild.

TextRecognizer.Close-Methode

Entfernt das Objekt und die zugeordneten Ressourcen.

Hinweise

In nicht implementiert.

TextRecognizer.CreateAsync-Methode

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

Erstellt asynchron eine neue Instanz der TextRecognizer-Klasse.

Gibt zurück

Eine neue Instanz der TextRecognizer-Klasse.

Dadurch wird ein Fehler zurückgegeben, wenn GetModelReadyStatus nicht bereit ist.

TextRecognizer.IsAvailable-Methode

public static bool IsAvailable ();

Ruft ab, ob das zugrunde liegende Sprachmodell installiert ist.

Gibt zurück

True, wenn das zugrunde liegende Sprachmodell installiert ist. Andernfalls lautet der Wert false.

TextRecognizer.MakeAvailableAsync-Methode

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Stellt sicher, dass das zugrunde liegende Sprachmodell installiert und zur Verwendung verfügbar ist.

Gibt zurück

Eine asynchrone Aktion mit Fortschritt, die ein PackageDeploymentResult nach Abschluss zurückgibt.

Methode TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Erkennen von Text im bereitgestellten Bild.

Parameter
imageBuffer

Eine nicht komprimierte Bitmap.

Optionen

Optionen zum Konfigurieren des Texterkennungsmodells für den TextRecognizer.

Gibt zurück

Der erkannte Text.

Methode TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Asynchrones Erkennen von Text im bereitgestellten Bild.

Parameter
imageBuffer

Eine nicht komprimierte Bitmap.

Optionen

Optionen zum Konfigurieren des Texterkennungsmodells für den TextRecognizer.

Gibt zurück

Der erkannte Text.

TextRecognizerOptions-Klasse

public sealed class TextRecognizerOptions

Bietet Optionen zum Konfigurieren des Texterkennungsmodells für einen TextRecognizer.

TextRecognizerOptions.MaxAnalysisSize-Eigenschaft

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

Ruft die maximale Fehlergröße ab oder legt diese fest.

Eigenschaftswert

Maximale Bildgröße. Der Standardwert beträgt 1152 Breite und 768 Höhe.

Hinweise

Diese Größe ist ein Vorschlag und wird möglicherweise nicht immer berücksichtigt.

Wenn das Quellbild größer als die maximale Größe ist, wird es automatisch auf die oberen Größenbeschränkungen skaliert.

TextRecognizerOptions.MaxLineCount-Eigenschaft

public uint MaxLineCount { get; set; }

Ruft die maximale Anzahl von Zeilen ab, die vom Erkennungsvorgang zurückgegeben werden sollen, oder legt diese fest.

Eigenschaftswert

Die maximale Anzahl von Zeilen, die vom Erkennungsvorgang zurückgegeben werden sollen.

Hinweise

Der Standardwert ist "MaxLineCountSupported". Wenn angegeben, sind die zurückgegebenen maximalen Zeilen kleiner als dieser Wert und MaxLineCountSupported.

TextRecognizerOptions.OrientationDetection-Eigenschaft

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Ruft ab oder legt fest, ob die Textausrichtung erkannt wird.

Eigenschaftswert

Gibt an, ob die Textausrichtung erkannt werden soll. Der Standardwert ist Keiner.

TextRecognizerOptions.#ctor-Konstruktor

public TextRecognizerOptions ();

Initialisiert eine neue Instanz der -Klasse mit dem angegebenen Text.