Sdílet prostřednictvím


Referenční informace k rozhraní API pro rozpoznávání textu založené na umělé inteligenci (OCR) v sadě Windows App SDK

Důležitý

Tato funkce ještě není k dispozici. Očekává se, že se doručí v nadcházejícím experimentálním kanálu vydání sady Windows App SDK.

Sada Windows App SDK experimentální kanál zahrnuje rozhraní API a funkce v počátečních fázích vývoje. Všechna rozhraní API v experimentálním kanálu podléhají rozsáhlým revizem a zásadním změnám a je možné je kdykoli odebrat z následujících verzí. Nejsou podporovány pro použití v produkčních prostředích a aplikace, které používají experimentální funkce, nelze publikovat do Microsoft Storu.

Seznamte se s rozhraními API sady Windows App SDK, která podporuje umělou inteligenci (AI), která dokáže rozpoznat a extrahovat text (znaky, slova, čáry, hranice mnohoúhelníku textu a úrovně spolehlivosti pro každou shodu) v obrázcích a převést ho na strojově čitelné datové proudy znaků.

Další podrobnosti najdete v tématu Začínáme s rozpoznáváním textu (OCR) v sadě Windows App SDK.

Spropitné

Poskytněte zpětnou vazbu k těmto rozhraním API a jejich funkcím vytvořením nového problému v úložišti GitHub sady Windows App SDK. (Nezapomeňte do názvu zahrnout OCR!)


Microsoft.Windows.Vision namespace

Poskytuje rozhraní API pro modely strojového učení, které analyzují textový obsah obrázků.

DetectedLineStyle – výčet

public enum DetectedLineStyle

Určuje styly čar, které lze rozpoznat.

Pole

Rukou psané: 0

Řádek textu je napsaný rukou.

Jiné: 1

Řádek textu není napsaný rukou.

OrientationDetectionOptions – výčet

public enum OrientationDetectionOptions

Určuje orientaci textu, která lze rozpoznat.

Pole

Žádné: 0

Orientace není rozpoznána.

Detekovat Orientaci: 1

Orientace je rozpoznána.

RecognizedLine třída

public sealed class RecognizedLine

Představuje jeden řádek rozpoznaného textu.

RecognizedLine.Style – vlastnost

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Získá rozpoznaný styl čáry.

Hodnota vlastnosti

rozpoznaný styl čáry.

Poznámky

Zahrnuje, zda byl řádek textu rukou psaný nebo ne, a úroveň spolehlivosti rozpoznávání.

RecognizedLine.Text – vlastnost

public string Text { get; }

Získá text rozpoznaného řádku.

Hodnota vlastnosti

Text rozpoznaného řádku

Poznámky

Všechna slova zřetězená s mezerami.

Vlastnost RecognizedLine.Words

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

Slova v rozpoznané čáře.

Hodnota vlastnosti

Slova v rozpoznané čáře.

RecognizedLineStyle – struktura

public struct RecognizedLineStyle

Představuje styl rozpoznané linie.

Pole

Důvěrnost

Úroveň spolehlivosti rozpoznávání stylu čáry.

Jméno

Název stylu čáry.

Třída RecognizedText

public sealed class RecognizedText

Představuje výsledek operace rozpoznávání obrázku na text.

RecognizedText.ImageAngle – vlastnost vlastnosti úhlu obrazu

public float ImageAngle { get; }

Získá úhel otočení po směru hodinových ručiček rozpoznaného textu ve stupních.

Hodnota vlastnosti

Úhel otočení rozpoznaného textu ve stupních ve směru hodinových ručiček.

RecognizedText.Lines – vlastnost

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Získá kolekci rozpoznaných řádků.

Hodnota vlastnosti

Kolekce rozpoznaných řádků.

RecognizedWord – třída

public sealed class RecognizedWord

Představuje jedno rozpoznané slovo.

RecognizedWord.BoundingBox – vlastnost

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Získá hranici čtyřúhelníku rozpoznaného slova.

Hodnota vlastnosti

Hranice čtyřúhelníka rozpoznaného slova. TopLeft je relativní k rotaci slova.

RecognizedWord.Confidence – vlastnost

public float Confidence { get; }

Získá, jak pravděpodobné, že toto slovo bylo rozpoznáno správně.

Hodnota vlastnosti

Páni, pravděpodobně bylo toto slovo rozpoznáno správně. Rozsah hodnot je od 0,0 do 1,0 včetně.

RecognizedWord.Text – vlastnost

public string Text { get; }

Získá text rozpoznaného slova.

Hodnota vlastnosti

Text rozpoznaného slova

TextRecognition.BoundingBox – struktura

public struct BoundingBox

Mnohoúhelník se 4 body používanými pro hranici rozpoznaných slov a řádků textu.

Pole

Dole vlevo

Levý dolní roh ohraničujícího rámečku.

Dole vpravo

Pravý dolní roh ohraničujícího rámečku.

Vlevo nahoře

Levý horní bod ohraničujícího rámečku.

TopRight

Pravý horní bod ohraničujícího rámečku.

Poznámky

Když jsou vráceny jako hranice slova nebo řádku, body TopLeft, TopRight, BottomRighta BottomLeft jsou vztaženy k rotaci a zkosení rozpoznaného textu na obrázku. Následující diagram znázorňuje rozložení bodů pro různé otočení textu, kde 0 je TopLeft, 1 je TopRight, 2 je BottomRighta 3 je BottomLeft, všechny vzhledem k textu.

diagram tří příkladů ohraničujícího rámečku znázorňující, jak jsou rohové body identifikovány na základě otočení textu.

TextRecognizer – třída

public sealed class TextRecognizer : System.IDisposable

Rozpozná slova a čáry a jejich čtyřúhelníkové hranice ve zdrojovém obrázku.

Metoda TextRecognizer.Close

Odstraní objekt a přidružené prostředky.

Poznámky

V jazyce C# není implementováno.

Metoda TextRecognizer.CreateAsync

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

Asynchronně vytvoří novou instanci Třídy TextRecognizer.

Návraty

Nová instance Třídy TextRecognizer.

Pokud getModelReadyStatus není připravený, vrátí se chyba.

Metoda TextRecognizer.IsAvailable

public static bool IsAvailable ();

Načte, zda je nainstalovaný základní jazykový model.

Návraty

Hodnota True, pokud je nainstalovaný základní jazykový model. V opačném případě nepravda.

Metoda TextRecognizer.MakeAvailableAsync

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Zajišťuje instalaci a dostupnost základního jazykového modelu.

Návraty

Asynchronní akce s průběhem, která vrací PackageDeploymentResult po dokončení.

Metoda TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Rozpozná text na zadaném obrázku.

Parametry
imageBuffer

Nekomprimovaný rastrový obrázek.

možnosti

Možnosti konfigurace modelu rozpoznávání textu pro textRecognizer

Návraty

Rozpoznaný text.

Metoda TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Asynchronně rozpoznává text v zadaném obrázku.

Parametry
imageBuffer

Nekomprimovaný rastrový obrázek.

možnosti

Možnosti konfigurace modelu rozpoznávání textu pro textRecognizer

Návraty

Rozpoznaný text.

TextRecognizerOptions – třída

public sealed class TextRecognizerOptions

Poskytuje možnosti konfigurace modelu rozpoznávání textu pro TextRecognizer.

TextRecognizerOptions.MaxAnalysisSize – vlastnost

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

Získá nebo nastaví maximální velikost obrázku.

Hodnota vlastnosti

Maximální velikost obrázku. Výchozí hodnota je šířka 1152 a výška 768.

Poznámky

Tato velikost je návrh a nemusí být vždy respektována.

Pokud je zdrojová image větší než maximální velikost, automaticky se sníží na horní limity velikosti.

TextRecognizerOptions.MaxLineCount – vlastnost

public uint MaxLineCount { get; set; }

Umožňuje získat nebo nastavit maximální počet řádků, které se mají vrátit z operace rozpoznávání.

Hodnota vlastnosti

Maximální počet řádků, které se mají vrátit z operace rozpoznávání.

Poznámky

Výchozí nastavení je MaxLineCountSupported. Pokud je zadáno, maximální počet vrácených řádků bude menší z těchto dvou hodnot: této hodnoty a MaxLineCountSupported.

TextRecognizerOptions.OrientationDetection – vlastnost

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Nastaví nebo určí, zda detekovat orientaci textu.

Hodnota vlastnosti

Jestli chcete zjistit orientaci textu. Výchozí hodnota je None.

Konstruktor TextRecognizerOptions.#ctor

public TextRecognizerOptions ();

Inicializuje novou instanci třídy TextRecognizerOptions.