共用方式為


#D62C2EDE9D38F4EB782175789FD2FDE63 中 AI 支援的文字辨識 API 參考 (OCR)

重要

此功能尚無法使用。 預計它將在即將發行的實驗通道中發行 Windows 應用程式 SDK。

Windows 應用程式 SDK 實驗通道包含開發初期的 API 和功能。 實驗通道中的所有 API 都受限於廣泛的修訂和中斷性變更,而且可以隨時從後續版本中移除。 不支援在生產環境中使用,且使用實驗性功能的應用程式無法發佈至 Microsoft 市集。

瞭解由人工智慧 (AI) 支援的 Windows 應用程式 SDK API,可在影像中偵測和擷取文字(字元、文字、線條、多邊形文字界限和信賴等級),並將其轉換成計算機可讀取的字元數據流。

如需詳細資訊,請參閱 Windows 應用程式 SDK 中的開始使用文字辨識(OCR)。

提示

藉由 Windows 應用程式 SDK 在 GitHub 存放庫中建立新的問題,提供這些 API 及其功能的意見反應。 (請確定您在 標題中包含 OCR


Microsoft.Windows.Vision 命名空間

針對分析影像文字內容的機器學習模型提供 API。

DetectedLineStyle 列舉

public enum DetectedLineStyle

指定可辨識的線條樣式。

欄位

手寫: 0

文字行是手寫的。

其他:1

文字行不是手寫的。

取向檢測選項列舉

public enum OrientationDetectionOptions

指定可辨識的文字方向。

欄位

無:0

無法辨識方向。

DetectOrientation:1

辨識方向。

RecognizedLine 類別

public sealed class RecognizedLine

表示單行可辨識的文字。

RecognizedLine.Style 屬性

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

取得辨識的線條樣式。

屬性值

可辨識的線條樣式。

備註

包含文字行是否為手寫,以及辨識信賴等級。

RecognizedLine.Text 屬性

public string Text { get; }

取得已辨識行的文字。

屬性值

已辨識行的文字。

備註

與空格串連的所有單字。

RecognizedLine.Words 屬性

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

辨識行中的字組。

屬性值

辨識行中的字組。

RecognizedLineStyle 結構體

public struct RecognizedLineStyle

表示已辨識線條的樣式。

欄位

信賴度

線條樣式辨識的信賴等級。

名稱

線條樣式名稱。

RecognizedText 類別

public sealed class RecognizedText

表示影像到文字辨識作業的結果。

RecognizedText.ImageAngle 屬性

public float ImageAngle { get; }

取得可辨識文字以度為單位的順時針旋轉角度。

屬性值

以度為單位辨識文字的順時針旋轉角度。

RecognizedText.Lines 屬性

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

取得已辨識行的集合。

屬性值

已辨識行的集合。

RecognizedWord 類別

public sealed class RecognizedWord

表示單一辨識的單字。

RecognizedWord.BoundingBox 屬性

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

取得已辨識字組的四邊邊界。

屬性值

已辨識字組的四邊邊界。 TopLeft 相對於字組的旋轉。

RecognizedWord.Confidence 屬性

public float Confidence { get; }

取得正確辨識這個字的可能性。

屬性值

哇這個字很可能被正確辨識。 值範圍從 0.0 到 1.0,包含。

RecognizedWord.Text 屬性

public string Text { get; }

取得已辨識字組的文字。

屬性值

已辨識文字的文字。

TextRecognition.BoundingBox 結構

public struct BoundingBox

多邊形,用於辨識文字和文字行界限的 4 點。

欄位

BottomLeft

周框方塊的左下角。

BottomRight

周框方塊的右下角。

TopLeft

周框方塊的左上方點。

TopRight

周框方塊的右上方點。

備註

當傳回為單字或線條的界限時,TopLeftTopRight、BottomRightBottomLeft 點會相對於影像中已辨識文字的旋轉和扭曲。 下圖顯示不同文字旋轉的點配置,其中 0 是 TopLeft,1 是 TopRight,2 是 BottomRight,3BottomLeft,全部相對於文字。

三個周框方塊範例的圖表,顯示如何根據文字旋轉來識別角落點。

TextRecognizer 類別

public sealed class TextRecognizer : System.IDisposable

辨識來源影像中的單字和線條及其四邊邊界。

TextRecognizer.Close 方法

處置 對象和相關聯的資源。

備註

未在 C# 中實作。

TextRecognizer.CreateAsync 方法

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

以異步方式建立 TextRecognizer 類別的新實例。

傳回

TextRecognizer 類別的新實例。

如果 GetModelReadyStatus 尚未就緒,這會傳回錯誤。

TextRecognizer.IsAvailable 方法

public static bool IsAvailable ();

擷取是否已安裝基礎語言模型。

傳回

True 是表示 如果已安裝基礎語言模型。 否則為 false。

TextRecognizer.MakeAvailableAsync 方法

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

確定已安裝基礎語言模型並可供使用。

傳回

異步動作,其進度會在完成時傳 回 PackageDeploymentResult

TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) 方法

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

辨識所提供影像中的文字。

參數
imageBuffer

未壓縮的點陣圖。

電子商務選項中

設定 TextRecognizer 文字辨識模型的選項。

傳回

已辨識的文字。

TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer,Microsoft.Windows.Vision.TextRecognizerOptions) 方法

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

以異步方式辨識所提供影像中的文字。

參數
imageBuffer

未壓縮的點陣圖。

電子商務選項中

設定 TextRecognizer 文字辨識模型的選項。

傳回

已辨識的文字。

TextRecognizerOptions 類別

public sealed class TextRecognizerOptions

提供選項來設定 TextRecognizer 的文字辨識模型。

TextRecognizerOptions.MaxAnalysisSize 屬性

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

取得或設定影像大小上限。

屬性值

影像大小上限。 預設值為 1152 寬度和 768 高度。

備註

此大小是建議,而且可能不一定接受。

如果來源影像大於大小上限,系統會自動縮小為大小上限。

TextRecognizerOptions.MaxLineCount 屬性設定

public uint MaxLineCount { get; set; }

取得或設定要從辨識作業傳回的最大行數。

屬性值

要從辨識作業傳回的最大行數。

備註

默認為 MaxLineCountSupported。 如果指定,傳回的最大行數將會是此值的較小和 MaxLineCountSupported。

TextRecognizerOptions.OrientationDetection 屬性

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

取得或設定是否要偵測文字方向。

屬性值

是否要偵測文字方向。 預設值為 None。

TextRecognizerOptions.#ctor 建構函式

public TextRecognizerOptions ();

初始化 TextRecognizerOptions 類別的新實例。