Dokumentacja interfejsu API dla rozpoznawania tekstu sztucznej inteligencji (OCR) w zestawie SDK aplikacji systemu Windows
Ważny
Dostępne w najnowszej wersji eksperymentalnego kanału zestawu SDK aplikacji systemu Windows.
Eksperymentalny kanał zestawu SDK aplikacji systemu Windows obejmuje interfejsy API i funkcje we wczesnych etapach programowania. Wszystkie interfejsy API w kanale eksperymentalnym podlegają istotnym zmianom i zmianom, które mogą powodować niekompatybilność oraz mogą zostać usunięte z kolejnych wersji w dowolnym momencie. Funkcje eksperymentalne nie są obsługiwane w środowiskach produkcyjnych i aplikacjach, które ich używają, nie mogą być publikowane w sklepie Microsoft Store.
- Niezapakowane aplikacje nie są obsługiwane.
Dowiedz się więcej o zestawie SDK aplikacji systemu Windows interfejsów API opartych na sztucznej inteligencji, które potrafią wykrywać i wyodrębniać tekst (znaki, słowa, linie, granice tekstu wielokątnego i poziomy ufności dla każdego dopasowania) na obrazach i konwertować go na strumienie znaków czytelnych dla maszyny.
Aby uzyskać więcej informacji, zobacz Rozpoczynanie pracy z rozpoznawaniem tekstu (OCR) w zestawie SDK aplikacji systemu Windows.
Napiwek
Prześlij opinię na temat tych interfejsów API i ich funkcji, tworząc nowe zgłoszenie w repozytorium GitHub Windows App SDK (uwzględniając OCR w tytule) lub odpowiadając na istniejące zgłoszenie.
Microsoft.Windows.Vision przestrzeń nazw
Udostępnia interfejsy API dla modeli uczenia maszynowego, które analizują tekstową zawartość obrazów.
DetectedLineStyle, enum
public enum DetectedLineStyle
Określa style linii, które można rozpoznać.
Pola
Odręczny: 0
Wiersz tekstu jest napisany ręcznie.
Inne: 1
Wiersz tekstu nie jest napisany ręcznie.
Wyliczenie OrientationDetectionOptions
public enum OrientationDetectionOptions
Określa orientacje tekstu, które można rozpoznać.
Pola
Brak: 0
Orientacja nie jest rozpoznawana.
DetectOrientation: 1
Orientacja jest rozpoznawana.
Klasa RecognizedLine
public sealed class RecognizedLine
Reprezentuje pojedynczy wiersz rozpoznanego tekstu.
Właściwość RecognizedLine.Style
public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }
Pobiera rozpoznany styl linii.
Wartość właściwości
rozpoznany styl linii.
Uwagi
Zawiera informacje o tym, czy wiersz tekstu został odręczny, czy nie, oraz poziom ufności rozpoznawania.
Właściwość RecognizedLine.Text
public string Text { get; }
Pobiera tekst rozpoznanego wiersza.
Wartość właściwości
Tekst rozpoznanej linii.
Uwagi
Wszystkie wyrazy łączone są spacjami.
Właściwość RecognizedLine.Words
public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }
Wyrazy w rozpoznanym wierszu.
Wartość właściwości
Wyrazy w rozpoznanym wierszu.
Struktura RecognizedLineStyle
public struct RecognizedLineStyle
Reprezentuje styl rozpoznanej linii.
Pola
Pewność siebie
Poziom ufności rozpoznawania stylu wiersza.
Nazwa
Nazwa stylu wiersza.
Klasa RecognizedText
public sealed class RecognizedText
Reprezentuje wynik operacji rozpoznawania obrazów do tekstu.
Właściwość RecognizedText.ImageAngle
public float ImageAngle { get; }
Pobiera kąt obrotu rozpoznanego tekstu zgodnie z ruchem wskazówek zegara, wyrażony w stopniach.
Wartość właściwości
Kąt obrotu zgodnie z ruchem wskazówek zegara rozpoznanego tekstu w stopniach.
Właściwość RecognizedText.Lines
public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }
Pobiera kolekcję rozpoznanych wierszy.
Wartość właściwości
Kolekcja rozpoznanych wierszy.
klasa RecognizedWord
public sealed class RecognizedWord
Reprezentuje jedno rozpoznane słowo.
Właściwość RecognizedWord.BoundingBox
public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }
Pobiera granicę czworokątną rozpoznanego słowa.
Wartość właściwości
Czterostronna granica rozpoznanego słowa. TopLeft jest względny względem rotacji słowa.
Właściwość RecognizedWord.Confidence
public float Confidence { get; }
Określa prawdopodobieństwo poprawnego rozpoznania tego słowa.
Wartość właściwości
Wow prawdopodobnie to słowo zostało poprawnie rozpoznane. Zakresy wartości z zakresu od 0,0 do 1,0 włącznie.
Właściwość RecognizedWord.Text
public string Text { get; }
Pobiera tekst rozpoznanego wyrazu.
Wartość właściwości
Tekst rozpoznanego słowa.
Struktura TextRecognition.BoundingBox
public struct BoundingBox
Wielokąt z 4 punktami używanymi do granicy rozpoznanych wyrazów i wierszy tekstu.
Pola
Lewy dolny róg
Lewy dolny róg ramki ograniczającej.
Prawy dolny
Prawy dolny róg pola ograniczenia.
TopLeft
Lewy górny punkt pola ograniczenia.
TopRight
Prawy górny punkt ramki ograniczającej.
Uwagi
Gdy są zwracane jako granice słowa lub wiersza, punkty TopLeft, TopRight, BottomRighti BottomLeft odnoszą się do rotacji i przekrzywienia rozpoznanego tekstu na obrazie. Na poniższym diagramie przedstawiono układ punktów dla różnych rotacji tekstu, gdzie 0 jest TopLeft, 1 jest TopRight, 2 jest BottomRight, a 3 jest BottomLeft, wszystkie względem tekstu.
klasa TextRecognizer
public sealed class TextRecognizer : System.IDisposable
Rozpoznaje wyrazy i linie oraz ich granice czworokątne w obrazie źródłowym.
TextRecognizer.Close (metoda)
Usuwa obiekt i skojarzone zasoby.
Uwagi
Nie zaimplementowano w języku C#.
Metoda TextRecognizer.CreateAsync
public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();
Asynchronicznie tworzy nowe wystąpienie klasy TextRecognizer.
Zwraca
Nowe wystąpienie klasy TextRecognizer.
Spowoduje to zwrócenie błędu, jeśli parametr GetModelReadyStatus nie jest gotowy.
Metoda TextRecognizer.IsAvailable
public static bool IsAvailable ();
Pobiera, czy jest zainstalowany bazowy model językowy.
Zwraca
Prawda, jeśli jest zainstalowany podstawowy model językowy. W przeciwnym razie false.
Metoda TextRecognizer.MakeAvailableAsync
public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult,
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();
Zapewnia, że podstawowy model językowy jest zainstalowany i dostępny do użycia.
Zwraca
Asynchroniczna akcja z uwzględnieniem postępu, która po zakończeniu zwraca PackageDeploymentResult.
Metoda TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)
public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Rozpoznawanie tekstu na podanym obrazie.
Parametry
bufor obrazu
Nieskompresowana mapa bitowa.
Opcje
Opcje konfigurowania modelu rozpoznawania tekstu dla TextRecognizer.
Zwraca
Rozpoznany tekst.
Metoda TextRecognizer.RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)
public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Asynchronicznie rozpoznaj tekst na podanym obrazie.
Parametry
bufor obrazu
Nieskompresowana mapa bitowa.
Opcje
Opcje konfigurowania modelu rozpoznawania tekstu dla TextRecognizer.
Zwraca
Rozpoznany tekst.
Klasa TextRecognizerOptions
public sealed class TextRecognizerOptions
Udostępnia opcje konfiguracji modelu rozpoznawania tekstu dla TextRecognizer.
Właściwość TextRecognizerOptions.MaxAnalysisSize
public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }
Pobiera lub ustawia maksymalny rozmiar obrazu.
Wartość właściwości
Maksymalny rozmiar obrazu. Wartość domyślna to 1152 szerokość i wysokość 768.
Uwagi
Ten rozmiar jest sugestią i może nie zawsze być honorowany.
Jeśli obraz źródłowy jest większy niż maksymalny rozmiar, zostanie on automatycznie przeskalowany w dół do górnych limitów rozmiaru.
Właściwość TextRecognizerOptions.MaxLineCount
public uint MaxLineCount { get; set; }
Pobiera lub ustawia maksymalną liczbę wierszy do zwrócenia w wyniku operacji rozpoznawania.
Wartość właściwości
Maksymalna liczba wierszy do zwrócenia z operacji rozpoznawania.
Uwagi
Domyślnym ustawieniem jest MaxLineCountSupported. Jeśli zostanie określone, zwracana maksymalna liczba wierszy będzie mniejsza z tej wartości i MaxLineCountSupported.
Właściwość TextRecognizerOptions.OrientationDetection
public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }
Pobiera lub ustawia, czy ma być wykrywana orientacja tekstu.
Wartość właściwości
Czy wykryć orientację tekstu. Wartość domyślna to Brak.
Konstruktor TextRecognizerOptions.#ctor
public TextRecognizerOptions ();
Inicjuje nowe wystąpienie klasy TextRecognizerOptions.