Freigeben über


API-Ref für AI-Texterkennung (OCR) im Windows App SDK

Wichtig

Im neuesten experimentellen Kanal-Release für das Windows App SDK verfügbar.

Der experimentelle Kanal des Windows App SDK umfasst APIs und Features in frühen Entwicklungsphasen. Alle APIs im experimentellen Kanal unterliegen umfangreichen Überarbeitungen und Breaking Changes und können jederzeit aus nachfolgenden Versionen entfernt werden. Experimentelle Features werden nicht für die Verwendung in Produktionsumgebungen und Apps unterstützt, die sie verwenden, können nicht im Microsoft Store veröffentlicht werden.

  • Eigenständige Apps werden nicht unterstützt.

Erfahren Sie mehr über KI-gestützte Windows App SDK-APIs, die in der Lage sind, Text (Zeichen, Wörter, Zeilen, polygonale Textgrenzen und Konfidenzniveaus für jede Übereinstimmung) in Bildern zu erkennen, diesen zu extrahieren und in maschinenlesbare Zeichenströme zu konvertieren.

Weitere Informationen finden Sie unter Erste Schritte mit der Texterkennung im Windows App SDK.

Tipp

Geben Sie Feedback zu diesen APIs und deren Funktionalität, indem Sie ein neues Problem im GitHub-Repository des Windows App SDK erstellen (OCR- in den Titel einschließen) oder indem Sie auf ein vorhandenes Problemreagieren.


Microsoft.Windows.Vision-Namespace

Stellt APIs für Machine Learning-Modelle bereit, die den Textinhalt von Bildern analysieren.

DetectedLineStyle-Aufzählung

public enum DetectedLineStyle

Gibt die Linienarten an, die erkannt werden können.

Felder

Handschriftlich

Die Textzeile wird handschriftlichen Text geschrieben.

Other 1%

Die Textzeile wird nicht handschriftlichen Text geschrieben.

OrientationDetectionOptions-Aufzählung

public enum OrientationDetectionOptions

Gibt die Textausrichtungen an, die erkannt werden können.

Felder

None = 0

Die Ausrichtung wird nicht erkannt.

detectOrientation:

Die Ausrichtung wird erkannt.

RecognizedLine-Klasse

public sealed class RecognizedLine

Stellt eine einzelne Zeile erkannten Texts dar.

RecognizedLine.Style-Eigenschaft

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Ruft die erkannte Linienart ab.

Eigenschaftswert

die erkannte Linienart.

Hinweise

Enthält, ob die Textzeile handschriftlich geschrieben wurde oder nicht, und die Vertrauenswürdigkeit der Erkennung.

RecognizedLine.Text-Eigenschaft

public string Text { get; }

Ruft den Text der erkannten Zeile ab.

Eigenschaftswert

Der Text der erkannten Zeile.

Hinweise

Alle Wörter, die mit Leerzeichen verkettet sind.

RecognizedLine.Words-Eigenschaft

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

Die Wörter in der erkannten Zeile.

Eigenschaftswert

Die Wörter in der erkannten Zeile.

RecognizedLineStyle-Struktur

public struct RecognizedLineStyle

Stellt die Formatvorlage der erkannten Linie dar.

Felder

Confidence

Die Konfidenzstufe der Linienarterkennung.

Name

Der Name der Linienart.

RecognizedText-Klasse

public sealed class RecognizedText

Stellt das Ergebnis eines Bild-zu-Text-Erkennungsvorgangs dar.

RecognizedText.ImageAngle-Eigenschaft

public float ImageAngle { get; }

Ruft den Drehwinkel im Uhrzeigersinn des erkannten Texts in Grad ab.

Eigenschaftswert

In Grad der Winkel einer Drehung im Uhrzeigersinn.

RecognizedText.Lines-Eigenschaft

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Ruft die Auflistung der erkannten Zeilen ab.

Eigenschaftswert

Die Sammlung erkannter Zeilen.

RecognizedWord-Klasse

public sealed class RecognizedWord

Stellt ein einzelnes erkanntes Wort dar.

RecognizedWord.BoundingBox-Eigenschaft

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Ruft die viereckige Grenze des erkannten Worts ab.

Eigenschaftswert

Die viereckige Grenze des erkannten Worts. TopLeft ist relativ zur Drehung des Worts.

RecognizedWord.Confidence-Eigenschaft

public float Confidence { get; }

Ruft ab, wie wahrscheinlich dieses Wort richtig erkannt wurde.

Eigenschaftswert

Wow wahrscheinlich wurde dieses Wort richtig erkannt. Der Wert reicht von 0,0 bis einschließlich 1,0.

RecognizedWord.Text-Eigenschaft

public string Text { get; }

Ruft den Text des erkannten Worts ab.

Eigenschaftswert

Der Text des erkannten Worts.

TextRecognition.BoundingBox-Struktur

public struct BoundingBox

Ein Polygon mit 4 Punkten, das für die Grenze erkannter Wörter und Textzeilen verwendet wird.

Felder

BottomLeft

Die linke untere Ecke des -Steuerelements

BottomRight

Die untere rechte Ecke des umgebenden Felds.

TopLeft

Der obere linke Punkt des umgebenden Felds.

TopRight

Der obere rechte Punkt des umgebenden Felds.

Hinweise

Wenn sie als Grenze für ein Wort oder eine Linie zurückgegeben wird, sind die Punkte "TopLeft", "TopRight", "BottomRight" und "BottomLeft" relativ zur Drehung und Neigung des erkannten Texts im Bild. Das folgende Diagramm zeigt das Punktlayout für unterschiedliche Textdrehungen, wobei 0 "TopLeft", "1" "TopRight", "2" "BottomRight" und "3" "BottomLeft" ist, die alle relativ zum Text sind.

Diagramm mit drei Begrenzungsfeldbeispielen, die zeigen, wie Eckpunkte basierend auf der Textdrehung identifiziert werden.

TextRecognizer-Klasse

public sealed class TextRecognizer : System.IDisposable

Erkennt Wörter und Linien und deren vierfache Begrenzungen in einem Quellbild.

TextRecognizer.Close-Methode

Entfernt das Objekt und die zugeordneten Ressourcen.

Hinweise

In C# nicht implementiert.

TextRecognizer.CreateAsync-Methode

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

Erstellt asynchron eine neue Instanz der TextRecognizer-Klasse.

Gibt zurück

Eine neue Instanz der TextRecognizer-Klasse.

Dadurch wird ein Fehler zurückgegeben, wenn GetModelReadyStatus nicht bereit ist.

TextRecognizer.IsAvailable-Methode

public static bool IsAvailable ();

Ruft ab, ob das zugrunde liegende Sprachmodell installiert ist.

Gibt zurück

True, wenn das zugrunde liegende Sprachmodell installiert ist. Andernfalls „false“.

TextRecognizer.MakeAvailableAsync-Methode

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Stellt sicher, dass das zugrunde liegende Sprachmodell installiert und zur Verwendung verfügbar ist.

Gibt zurück

Eine asynchrone Aktion mit Fortschritt, die ein PackageDeploymentResult nach Abschluss zurückgibt.

TextRecognizer.RecognizeTextFromImage(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) - Methode

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Erkennen von Text im bereitgestellten Bild.

Parameter
imageBuffer

Eine nicht komprimierte Bitmap.

Optionen

Optionen zum Konfigurieren des Texterkennungsmodells für den TextRecognizer.

Gibt zurück

Der erkannte Text.

TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Graphics.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)-Methode

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Graphics.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Asynchrones Erkennen von Text im bereitgestellten Bild.

Parameter
imageBuffer

Eine nicht komprimierte Bitmap.

Optionen

Optionen zum Konfigurieren des Texterkennungsmodells für den TextRecognizer.

Gibt zurück

Der erkannte Text.

TextRecognizerOptions-Klasse

public sealed class TextRecognizerOptions

Bietet Optionen zum Konfigurieren des Texterkennungsmodells für einen TextRecognizer.

TextRecognizerOptions.MaxAnalysisSize-Eigenschaft

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

Ruft die maximale Fehlergröße ab oder legt diese fest.

Eigenschaftswert

Maximale Bildgröße. Der Standardwert beträgt 1152 Breite und 768 Höhe.

Hinweise

Diese Größe ist ein Vorschlag und wird möglicherweise nicht immer berücksichtigt.

Wenn das Quellbild größer als die maximale Größe ist, wird es automatisch auf die oberen Größenbeschränkungen skaliert.

TextRecognizerOptions.MaxLineCount-Eigenschaft

public uint MaxLineCount { get; set; }

Ruft die maximale Anzahl von Zeilen ab, die vom Erkennungsvorgang zurückgegeben werden sollen, oder legt diese fest.

Eigenschaftswert

Die maximale Anzahl von Zeilen, die vom Erkennungsvorgang zurückgegeben werden sollen.

Hinweise

Der Standardwert ist "MaxLineCountSupported". Wenn angegeben, sind die zurückgegebenen maximalen Zeilen kleiner als dieser Wert und MaxLineCountSupported.

TextRecognizerOptions.OrientationDetection-Eigenschaft

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Ruft ab oder legt fest, ob die Textausrichtung erkannt wird.

Eigenschaftswert

Gibt an, ob die Textausrichtung erkannt werden soll. Der Standardwert ist Keiner.

TextRecognizerOptions.#ctor-Konstruktor

public TextRecognizerOptions ();

Initialisiert eine neue Instanz der -Klasse mit dem angegebenen Text.