#D62C2EDE9D38F4EB782175789FD2FDE63 中 AI 支援的文字辨識 API 參考（OCR）

發行項
12/21/2024

重要

此功能尚無法使用。 預計它將在即將發行的實驗通道中發行 Windows 應用程式 SDK。

Windows 應用程式 SDK 實驗通道包含開發初期的 API 和功能。實驗通道中的所有 API 都受限於廣泛的修訂和中斷性變更，而且可以隨時從後續版本中移除。不支援在生產環境中使用，且使用實驗性功能的應用程式無法發佈至 Microsoft 市集。

瞭解由人工智慧（AI）支援的 Windows 應用程式 SDK API，可在影像中偵測和擷取文字（字元、文字、線條、多邊形文字界限和信賴等級），並將其轉換成計算機可讀取的字元數據流。

如需詳細資訊，請參閱 Windows 應用程式 SDK 中的開始使用文字辨識（OCR）。

提示

藉由 Windows 應用程式 SDK 在 GitHub 存放庫中建立新的問題，提供這些 API 及其功能的意見反應。（請確定您在 標題中包含 OCR ！）

Microsoft.Windows.Vision 命名空間

針對分析影像文字內容的機器學習模型提供 API。

DetectedLineStyle 列舉

public enum DetectedLineStyle

指定可辨識的線條樣式。

欄位

手寫： 0

文字行是手寫的。

其他：1

文字行不是手寫的。

取向檢測選項列舉

public enum OrientationDetectionOptions

指定可辨識的文字方向。

欄位

無：0

無法辨識方向。

DetectOrientation：1

辨識方向。

RecognizedLine 類別

public sealed class RecognizedLine

表示單行可辨識的文字。

RecognizedLine.Style 屬性

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

取得辨識的線條樣式。

屬性值

可辨識的線條樣式。

備註

包含文字行是否為手寫，以及辨識信賴等級。

RecognizedLine.Text 屬性

public string Text { get; }

取得已辨識行的文字。

屬性值

已辨識行的文字。

備註

與空格串連的所有單字。

RecognizedLine.Words 屬性

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

辨識行中的字組。

屬性值

辨識行中的字組。

RecognizedLineStyle 結構體

public struct RecognizedLineStyle

表示已辨識線條的樣式。

欄位

信賴度

線條樣式辨識的信賴等級。

名稱

線條樣式名稱。

RecognizedText 類別

public sealed class RecognizedText

表示影像到文字辨識作業的結果。

RecognizedText.ImageAngle 屬性

public float ImageAngle { get; }

取得可辨識文字以度為單位的順時針旋轉角度。

屬性值

以度為單位辨識文字的順時針旋轉角度。

RecognizedText.Lines 屬性

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

取得已辨識行的集合。

屬性值

已辨識行的集合。

RecognizedWord 類別

public sealed class RecognizedWord

表示單一辨識的單字。

RecognizedWord.BoundingBox 屬性

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

取得已辨識字組的四邊邊界。

屬性值

已辨識字組的四邊邊界。 TopLeft 相對於字組的旋轉。

RecognizedWord.Confidence 屬性

public float Confidence { get; }

取得正確辨識這個字的可能性。

屬性值

哇這個字很可能被正確辨識。值範圍從 0.0 到 1.0，包含。

RecognizedWord.Text 屬性

public string Text { get; }

取得已辨識字組的文字。

屬性值

已辨識文字的文字。

TextRecognition.BoundingBox 結構

public struct BoundingBox

多邊形，用於辨識文字和文字行界限的 4 點。

欄位

BottomLeft

周框方塊的左下角。

BottomRight

周框方塊的右下角。

TopLeft

周框方塊的左上方點。

TopRight

周框方塊的右上方點。

備註

當傳回為單字或線條的界限時，TopLeft、TopRight、BottomRight 和 BottomLeft 點會相對於影像中已辨識文字的旋轉和扭曲。下圖顯示不同文字旋轉的點配置，其中 0 是 TopLeft，1 是 TopRight，2 是 BottomRight，3 是 BottomLeft，全部相對於文字。

三個周框方塊範例的圖表，顯示如何根據文字旋轉來識別角落點。

TextRecognizer 類別

public sealed class TextRecognizer : System.IDisposable

辨識來源影像中的單字和線條及其四邊邊界。

TextRecognizer.Close 方法

處置對象和相關聯的資源。

備註

未在 C# 中實作。

TextRecognizer.CreateAsync 方法

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

以異步方式建立 TextRecognizer 類別的新實例。

傳回

TextRecognizer 類別的新實例。

如果 GetModelReadyStatus 尚未就緒，這會傳回錯誤。

TextRecognizer.IsAvailable 方法

public static bool IsAvailable ();

擷取是否已安裝基礎語言模型。

傳回

True 是表示如果已安裝基礎語言模型。否則為 false。

TextRecognizer.MakeAvailableAsync 方法

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

確定已安裝基礎語言模型並可供使用。

傳回

異步動作，其進度會在完成時傳回 PackageDeploymentResult 。

TextRecognizer.RecognizeTextFromImage（Microsoft.Windows.Imaging.ImageBuffer， Microsoft.Windows.Vision.TextRecognizerOptions）方法

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

辨識所提供影像中的文字。

參數

imageBuffer

未壓縮的點陣圖。

電子商務選項中

設定 TextRecognizer 文字辨識模型的選項。

傳回

已辨識的文字。

TextRecognizer.RecognizeTextFromImageAsync（Microsoft.Windows.Imaging.ImageBuffer，Microsoft.Windows.Vision.TextRecognizerOptions）方法

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

以異步方式辨識所提供影像中的文字。

參數

imageBuffer

未壓縮的點陣圖。

電子商務選項中

設定 TextRecognizer 文字辨識模型的選項。

傳回

已辨識的文字。

TextRecognizerOptions 類別

public sealed class TextRecognizerOptions

提供選項來設定 TextRecognizer 的文字辨識模型。

TextRecognizerOptions.MaxAnalysisSize 屬性

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

取得或設定影像大小上限。

屬性值

影像大小上限。預設值為 1152 寬度和 768 高度。

備註

此大小是建議，而且可能不一定接受。

如果來源影像大於大小上限，系統會自動縮小為大小上限。

TextRecognizerOptions.MaxLineCount 屬性設定

public uint MaxLineCount { get; set; }

取得或設定要從辨識作業傳回的最大行數。

屬性值

要從辨識作業傳回的最大行數。

備註

默認為 MaxLineCountSupported。如果指定，傳回的最大行數將會是此值的較小和 MaxLineCountSupported。

TextRecognizerOptions.OrientationDetection 屬性

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

取得或設定是否要偵測文字方向。

屬性值

是否要偵測文字方向。預設值為 None。

TextRecognizerOptions.#ctor 建構函式

public TextRecognizerOptions ();

初始化 TextRecognizerOptions 類別的新實例。

共用方式為

#D62C2EDE9D38F4EB782175789FD2FDE63 中 AI 支援的文字辨識 API 參考 （OCR）

Microsoft.Windows.Vision 命名空間

DetectedLineStyle 列舉

欄位

手寫： 0

其他：1

取向檢測選項列舉

欄位

無：0

DetectOrientation：1

RecognizedLine 類別

RecognizedLine.Style 屬性

屬性值

備註

RecognizedLine.Text 屬性

屬性值

備註

RecognizedLine.Words 屬性

屬性值

RecognizedLineStyle 結構體

欄位

信賴度

名稱

RecognizedText 類別

RecognizedText.ImageAngle 屬性

屬性值

RecognizedText.Lines 屬性

屬性值

RecognizedWord 類別

RecognizedWord.BoundingBox 屬性

屬性值

RecognizedWord.Confidence 屬性

屬性值

RecognizedWord.Text 屬性

屬性值

TextRecognition.BoundingBox 結構

欄位

BottomLeft

BottomRight

TopLeft

TopRight

備註

TextRecognizer 類別

TextRecognizer.Close 方法

備註

TextRecognizer.CreateAsync 方法

傳回

TextRecognizer.IsAvailable 方法

傳回

TextRecognizer.MakeAvailableAsync 方法

傳回

TextRecognizer.RecognizeTextFromImage（Microsoft.Windows.Imaging.ImageBuffer， Microsoft.Windows.Vision.TextRecognizerOptions） 方法

參數

imageBuffer

電子商務選項中

傳回

TextRecognizer.RecognizeTextFromImageAsync（Microsoft.Windows.Imaging.ImageBuffer，Microsoft.Windows.Vision.TextRecognizerOptions） 方法

參數

imageBuffer

電子商務選項中

傳回

TextRecognizerOptions 類別

TextRecognizerOptions.MaxAnalysisSize 屬性

屬性值

備註

TextRecognizerOptions.MaxLineCount 屬性設定

屬性值

備註

TextRecognizerOptions.OrientationDetection 屬性

屬性值

TextRecognizerOptions.#ctor 建構函式

相關內容

意見反應

其他資源

#D62C2EDE9D38F4EB782175789FD2FDE63 中 AI 支援的文字辨識 API 參考（OCR）

TextRecognizer.RecognizeTextFromImage（Microsoft.Windows.Imaging.ImageBuffer， Microsoft.Windows.Vision.TextRecognizerOptions）方法

TextRecognizer.RecognizeTextFromImageAsync（Microsoft.Windows.Imaging.ImageBuffer，Microsoft.Windows.Vision.TextRecognizerOptions）方法