#D62C2EDE9D38F4EB782175789FD2FDE63 中 AI 支援的文字辨識 API 參考 (OCR)
重要
此功能尚無法使用。 預計它將在即將發行的實驗通道中發行 Windows 應用程式 SDK。
Windows 應用程式 SDK 實驗通道包含開發初期的 API 和功能。 實驗通道中的所有 API 都受限於廣泛的修訂和中斷性變更,而且可以隨時從後續版本中移除。 不支援在生產環境中使用,且使用實驗性功能的應用程式無法發佈至 Microsoft 市集。
瞭解由人工智慧 (AI) 支援的 Windows 應用程式 SDK API,可在影像中偵測和擷取文字(字元、文字、線條、多邊形文字界限和信賴等級),並將其轉換成計算機可讀取的字元數據流。
如需詳細資訊,請參閱 Windows 應用程式 SDK 中的開始使用文字辨識(OCR)。
提示
藉由 Windows 應用程式 SDK 在 GitHub 存放庫中建立新的問題,提供這些 API 及其功能的意見反應。 (請確定您在 標題中包含 OCR !)
Microsoft.Windows.Vision 命名空間
針對分析影像文字內容的機器學習模型提供 API。
DetectedLineStyle 列舉
public enum DetectedLineStyle
指定可辨識的線條樣式。
欄位
手寫: 0
文字行是手寫的。
其他:1
文字行不是手寫的。
取向檢測選項列舉
public enum OrientationDetectionOptions
指定可辨識的文字方向。
欄位
無:0
無法辨識方向。
DetectOrientation:1
辨識方向。
RecognizedLine 類別
public sealed class RecognizedLine
表示單行可辨識的文字。
RecognizedLine.Style 屬性
public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }
取得辨識的線條樣式。
屬性值
可辨識的線條樣式。
備註
包含文字行是否為手寫,以及辨識信賴等級。
RecognizedLine.Text 屬性
public string Text { get; }
取得已辨識行的文字。
屬性值
已辨識行的文字。
備註
與空格串連的所有單字。
RecognizedLine.Words 屬性
public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }
辨識行中的字組。
屬性值
辨識行中的字組。
RecognizedLineStyle 結構體
public struct RecognizedLineStyle
表示已辨識線條的樣式。
欄位
信賴度
線條樣式辨識的信賴等級。
名稱
線條樣式名稱。
RecognizedText 類別
public sealed class RecognizedText
表示影像到文字辨識作業的結果。
RecognizedText.ImageAngle 屬性
public float ImageAngle { get; }
取得可辨識文字以度為單位的順時針旋轉角度。
屬性值
以度為單位辨識文字的順時針旋轉角度。
RecognizedText.Lines 屬性
public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }
取得已辨識行的集合。
屬性值
已辨識行的集合。
RecognizedWord 類別
public sealed class RecognizedWord
表示單一辨識的單字。
RecognizedWord.BoundingBox 屬性
public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }
取得已辨識字組的四邊邊界。
屬性值
已辨識字組的四邊邊界。 TopLeft 相對於字組的旋轉。
RecognizedWord.Confidence 屬性
public float Confidence { get; }
取得正確辨識這個字的可能性。
屬性值
哇這個字很可能被正確辨識。 值範圍從 0.0 到 1.0,包含。
RecognizedWord.Text 屬性
public string Text { get; }
取得已辨識字組的文字。
屬性值
已辨識文字的文字。
TextRecognition.BoundingBox 結構
public struct BoundingBox
多邊形,用於辨識文字和文字行界限的 4 點。
欄位
BottomLeft
周框方塊的左下角。
BottomRight
周框方塊的右下角。
TopLeft
周框方塊的左上方點。
TopRight
周框方塊的右上方點。
備註
當傳回為單字或線條的界限時,TopLeft、TopRight、BottomRight 和 BottomLeft 點會相對於影像中已辨識文字的旋轉和扭曲。 下圖顯示不同文字旋轉的點配置,其中 0 是 TopLeft,1 是 TopRight,2 是 BottomRight,3 是 BottomLeft,全部相對於文字。
TextRecognizer 類別
public sealed class TextRecognizer : System.IDisposable
辨識來源影像中的單字和線條及其四邊邊界。
TextRecognizer.Close 方法
處置 對象和相關聯的資源。
備註
未在 C# 中實作。
TextRecognizer.CreateAsync 方法
public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();
以異步方式建立 TextRecognizer 類別的新實例。
傳回
TextRecognizer 類別的新實例。
如果 GetModelReadyStatus 尚未就緒,這會傳回錯誤。
TextRecognizer.IsAvailable 方法
public static bool IsAvailable ();
擷取是否已安裝基礎語言模型。
傳回
True 是表示 如果已安裝基礎語言模型。 否則為 false。
TextRecognizer.MakeAvailableAsync 方法
public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult,
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();
確定已安裝基礎語言模型並可供使用。
傳回
異步動作,其進度會在完成時傳 回 PackageDeploymentResult 。
TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions) 方法
public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
辨識所提供影像中的文字。
參數
imageBuffer
未壓縮的點陣圖。
電子商務選項中
設定 TextRecognizer 文字辨識模型的選項。
傳回
已辨識的文字。
TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer,Microsoft.Windows.Vision.TextRecognizerOptions) 方法
public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
以異步方式辨識所提供影像中的文字。
參數
imageBuffer
未壓縮的點陣圖。
電子商務選項中
設定 TextRecognizer 文字辨識模型的選項。
傳回
已辨識的文字。
TextRecognizerOptions 類別
public sealed class TextRecognizerOptions
提供選項來設定 TextRecognizer 的文字辨識模型。
TextRecognizerOptions.MaxAnalysisSize 屬性
public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }
取得或設定影像大小上限。
屬性值
影像大小上限。 預設值為 1152 寬度和 768 高度。
備註
此大小是建議,而且可能不一定接受。
如果來源影像大於大小上限,系統會自動縮小為大小上限。
TextRecognizerOptions.MaxLineCount 屬性設定
public uint MaxLineCount { get; set; }
取得或設定要從辨識作業傳回的最大行數。
屬性值
要從辨識作業傳回的最大行數。
備註
默認為 MaxLineCountSupported。 如果指定,傳回的最大行數將會是此值的較小和 MaxLineCountSupported。
TextRecognizerOptions.OrientationDetection 屬性
public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }
取得或設定是否要偵測文字方向。
屬性值
是否要偵測文字方向。 預設值為 None。
TextRecognizerOptions.#ctor 建構函式
public TextRecognizerOptions ();
初始化 TextRecognizerOptions 類別的新實例。
相關內容
- 在 Windows 上開發負責任的生成式 AI 應用程式和功能
- 開始使用 Windows 應用程式 SDK 中的文字辨識 (OCR)
- Windows 應用程式 ADK (機器翻譯)
- Windows 應用程式 SDK 的最新版本資訊