Udostępnij za pośrednictwem


Dokumentacja interfejsu API dla rozpoznawania tekstu sztucznej inteligencji (OCR) w zestawie SDK aplikacji systemu Windows

Ważny

Dostępne w najnowszej wersji eksperymentalnego kanału zestawu SDK aplikacji systemu Windows.

Eksperymentalny kanał zestawu SDK aplikacji systemu Windows obejmuje interfejsy API i funkcje we wczesnych etapach programowania. Wszystkie interfejsy API w kanale eksperymentalnym podlegają istotnym zmianom i zmianom, które mogą powodować niekompatybilność oraz mogą zostać usunięte z kolejnych wersji w dowolnym momencie. Funkcje eksperymentalne nie są obsługiwane w środowiskach produkcyjnych i aplikacjach, które ich używają, nie mogą być publikowane w sklepie Microsoft Store.

  • Niezapakowane aplikacje nie są obsługiwane.

Dowiedz się więcej o zestawie SDK aplikacji systemu Windows interfejsów API opartych na sztucznej inteligencji, które potrafią wykrywać i wyodrębniać tekst (znaki, słowa, linie, granice tekstu wielokątnego i poziomy ufności dla każdego dopasowania) na obrazach i konwertować go na strumienie znaków czytelnych dla maszyny.

Aby uzyskać więcej informacji, zobacz Rozpoczynanie pracy z rozpoznawaniem tekstu (OCR) w zestawie SDK aplikacji systemu Windows.

Napiwek

Prześlij opinię na temat tych interfejsów API i ich funkcji, tworząc nowe zgłoszenie w repozytorium GitHub Windows App SDK (uwzględniając OCR w tytule) lub odpowiadając na istniejące zgłoszenie.


Microsoft.Windows.Vision przestrzeń nazw

Udostępnia interfejsy API dla modeli uczenia maszynowego, które analizują tekstową zawartość obrazów.

DetectedLineStyle, enum

public enum DetectedLineStyle

Określa style linii, które można rozpoznać.

Pola

Odręczny: 0

Wiersz tekstu jest napisany ręcznie.

Inne: 1

Wiersz tekstu nie jest napisany ręcznie.

Wyliczenie OrientationDetectionOptions

public enum OrientationDetectionOptions

Określa orientacje tekstu, które można rozpoznać.

Pola

Brak: 0

Orientacja nie jest rozpoznawana.

DetectOrientation: 1

Orientacja jest rozpoznawana.

Klasa RecognizedLine

public sealed class RecognizedLine

Reprezentuje pojedynczy wiersz rozpoznanego tekstu.

Właściwość RecognizedLine.Style

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Pobiera rozpoznany styl linii.

Wartość właściwości

rozpoznany styl linii.

Uwagi

Zawiera informacje o tym, czy wiersz tekstu został odręczny, czy nie, oraz poziom ufności rozpoznawania.

Właściwość RecognizedLine.Text

public string Text { get; }

Pobiera tekst rozpoznanego wiersza.

Wartość właściwości

Tekst rozpoznanej linii.

Uwagi

Wszystkie wyrazy łączone są spacjami.

Właściwość RecognizedLine.Words

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

Wyrazy w rozpoznanym wierszu.

Wartość właściwości

Wyrazy w rozpoznanym wierszu.

Struktura RecognizedLineStyle

public struct RecognizedLineStyle

Reprezentuje styl rozpoznanej linii.

Pola

Pewność siebie

Poziom ufności rozpoznawania stylu wiersza.

Nazwa

Nazwa stylu wiersza.

Klasa RecognizedText

public sealed class RecognizedText

Reprezentuje wynik operacji rozpoznawania obrazów do tekstu.

Właściwość RecognizedText.ImageAngle

public float ImageAngle { get; }

Pobiera kąt obrotu rozpoznanego tekstu zgodnie z ruchem wskazówek zegara, wyrażony w stopniach.

Wartość właściwości

Kąt obrotu zgodnie z ruchem wskazówek zegara rozpoznanego tekstu w stopniach.

Właściwość RecognizedText.Lines

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Pobiera kolekcję rozpoznanych wierszy.

Wartość właściwości

Kolekcja rozpoznanych wierszy.

klasa RecognizedWord

public sealed class RecognizedWord

Reprezentuje jedno rozpoznane słowo.

Właściwość RecognizedWord.BoundingBox

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Pobiera granicę czworokątną rozpoznanego słowa.

Wartość właściwości

Czterostronna granica rozpoznanego słowa. TopLeft jest względny względem rotacji słowa.

Właściwość RecognizedWord.Confidence

public float Confidence { get; }

Określa prawdopodobieństwo poprawnego rozpoznania tego słowa.

Wartość właściwości

Wow prawdopodobnie to słowo zostało poprawnie rozpoznane. Zakresy wartości z zakresu od 0,0 do 1,0 włącznie.

Właściwość RecognizedWord.Text

public string Text { get; }

Pobiera tekst rozpoznanego wyrazu.

Wartość właściwości

Tekst rozpoznanego słowa.

Struktura TextRecognition.BoundingBox

public struct BoundingBox

Wielokąt z 4 punktami używanymi do granicy rozpoznanych wyrazów i wierszy tekstu.

Pola

Lewy dolny róg

Lewy dolny róg ramki ograniczającej.

Prawy dolny

Prawy dolny róg pola ograniczenia.

TopLeft

Lewy górny punkt pola ograniczenia.

TopRight

Prawy górny punkt ramki ograniczającej.

Uwagi

Gdy są zwracane jako granice słowa lub wiersza, punkty TopLeft, TopRight, BottomRighti BottomLeft odnoszą się do rotacji i przekrzywienia rozpoznanego tekstu na obrazie. Na poniższym diagramie przedstawiono układ punktów dla różnych rotacji tekstu, gdzie 0 jest TopLeft, 1 jest TopRight, 2 jest BottomRight, a 3 jest BottomLeft, wszystkie względem tekstu.

Diagram trzech przykładów pól ograniczenia pokazujących sposób identyfikowania punktów narożnych na podstawie obrotu tekstu.

klasa TextRecognizer

public sealed class TextRecognizer : System.IDisposable

Rozpoznaje wyrazy i linie oraz ich granice czworokątne w obrazie źródłowym.

TextRecognizer.Close (metoda)

Usuwa obiekt i skojarzone zasoby.

Uwagi

Nie zaimplementowano w języku C#.

Metoda TextRecognizer.CreateAsync

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

Asynchronicznie tworzy nowe wystąpienie klasy TextRecognizer.

Zwraca

Nowe wystąpienie klasy TextRecognizer.

Spowoduje to zwrócenie błędu, jeśli parametr GetModelReadyStatus nie jest gotowy.

Metoda TextRecognizer.IsAvailable

public static bool IsAvailable ();

Pobiera, czy jest zainstalowany bazowy model językowy.

Zwraca

Prawda, jeśli jest zainstalowany podstawowy model językowy. W przeciwnym razie false.

Metoda TextRecognizer.MakeAvailableAsync

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Zapewnia, że podstawowy model językowy jest zainstalowany i dostępny do użycia.

Zwraca

Asynchroniczna akcja z uwzględnieniem postępu, która po zakończeniu zwraca PackageDeploymentResult.

Metoda TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Rozpoznawanie tekstu na podanym obrazie.

Parametry
bufor obrazu

Nieskompresowana mapa bitowa.

Opcje

Opcje konfigurowania modelu rozpoznawania tekstu dla TextRecognizer.

Zwraca

Rozpoznany tekst.

Metoda TextRecognizer.RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Asynchronicznie rozpoznaj tekst na podanym obrazie.

Parametry
bufor obrazu

Nieskompresowana mapa bitowa.

Opcje

Opcje konfigurowania modelu rozpoznawania tekstu dla TextRecognizer.

Zwraca

Rozpoznany tekst.

Klasa TextRecognizerOptions

public sealed class TextRecognizerOptions

Udostępnia opcje konfiguracji modelu rozpoznawania tekstu dla TextRecognizer.

Właściwość TextRecognizerOptions.MaxAnalysisSize

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

Pobiera lub ustawia maksymalny rozmiar obrazu.

Wartość właściwości

Maksymalny rozmiar obrazu. Wartość domyślna to 1152 szerokość i wysokość 768.

Uwagi

Ten rozmiar jest sugestią i może nie zawsze być honorowany.

Jeśli obraz źródłowy jest większy niż maksymalny rozmiar, zostanie on automatycznie przeskalowany w dół do górnych limitów rozmiaru.

Właściwość TextRecognizerOptions.MaxLineCount

public uint MaxLineCount { get; set; }

Pobiera lub ustawia maksymalną liczbę wierszy do zwrócenia w wyniku operacji rozpoznawania.

Wartość właściwości

Maksymalna liczba wierszy do zwrócenia z operacji rozpoznawania.

Uwagi

Domyślnym ustawieniem jest MaxLineCountSupported. Jeśli zostanie określone, zwracana maksymalna liczba wierszy będzie mniejsza z tej wartości i MaxLineCountSupported.

Właściwość TextRecognizerOptions.OrientationDetection

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Pobiera lub ustawia, czy ma być wykrywana orientacja tekstu.

Wartość właściwości

Czy wykryć orientację tekstu. Wartość domyślna to Brak.

Konstruktor TextRecognizerOptions.#ctor

public TextRecognizerOptions ();

Inicjuje nowe wystąpienie klasy TextRecognizerOptions.