Ссылка на API для распознавания текста с поддержкой ИИ (OCR) в пакете SDK для приложений Windows
Внимание
Эта функция пока недоступна. Ожидается, что он будет отправлен в предстоящем экспериментальном выпуске пакета SDK для приложений Windows.
Экспериментальный канал пакета SDK для приложений Windows включает API и функции на ранних этапах разработки. Все API-интерфейсы в экспериментальном канале подвергаются обширным исправлениям и критическим изменениям и могут быть удалены из последующих выпусков в любое время. Они не поддерживаются для использования в рабочих средах, а приложения, использующие экспериментальные функции, не могут быть опубликованы в Microsoft Store.
Узнайте об API пакета SDK для приложений Windows, поддерживаемых искусственным интеллектом (ИИ), которые могут обнаруживать и извлекать текст (символы, строки, границы многоугольника и уровни достоверности для каждого совпадения) в изображениях и преобразовывать их в потоки символов, доступные для машинного чтения.
Дополнительные сведения см. в статье "Начало работы с распознаванием текста" (OCR) в пакете SDK для приложений Windows.
Совет
Предоставьте отзыв об этих API и их функциональных возможностях, создав новую проблему в репозитории GitHub пакета SDK для приложений Windows. (Убедитесь, что вы включили OCR в название!)
Пространство имен Microsoft.Windows.Vision
Предоставляет API для моделей машинного обучения, которые анализируют текстовое содержимое изображений.
Перечисление DetectedLineStyle
public enum DetectedLineStyle
Задает стили линий, которые можно распознать.
Поля
Рукописный текст: 0
Строка текста написана вручную.
Другое: 1
Строка текста не написана вручную.
Перечисление OrientationDetectionOptions
public enum OrientationDetectionOptions
Указывает ориентацию текста, которую можно распознать.
Поля
Нет: 0
Ориентация не распознается.
DetectOrientation: 1
Ориентация распознается.
Класс RecognizedLine
public sealed class RecognizedLine
Представляет одну строку распознанного текста.
Свойство RecognizedLine.Style
public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }
Возвращает распознанный стиль линии.
Значение свойства
распознанный стиль линии.
Замечания
Включает, была ли строка текста рукописной или нет, а также уровень достоверности распознавания.
Свойство RecognizedLine.Text
public string Text { get; }
Возвращает текст распознанной строки.
Значение свойства
Текст распознанной строки.
Замечания
Все слова сцеплены пробелами.
Свойство RecognizedLine.Words
public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }
Слова в распознанной строке.
Значение свойства
Слова в распознанной строке.
Структура RecognizedLineStyle
public struct RecognizedLineStyle
Представляет стиль распознанной строки.
Поля
Достоверность
Уровень достоверности распознавания стиля линии.
Имя.
Имя стиля строки.
Класс RecognizedText
public sealed class RecognizedText
Представляет результат операции распознавания изображений в тексте.
Свойство RecognizedText.ImageAngle
public float ImageAngle { get; }
Получает угол поворота по часовой стрелке распознанного текста в градусах.
Значение свойства
Угол поворота по часовой стрелке распознанного текста в градусах.
Свойство RecognizedText.Lines
public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }
Возвращает коллекцию распознанных строк.
Значение свойства
Коллекция распознанных строк.
Класс RecognizedWord
public sealed class RecognizedWord
Представляет одно распознаваемое слово.
Свойство BoundingBox для RecognizedWord
public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }
Получает четырехсторонняя граница распознанного слова.
Значение свойства
Четырехсторонняя граница распознанного слова. TopLeft относится к повороту слова.
Свойство RecognizedWord.Confidence
public float Confidence { get; }
Возвращает вероятность правильного распознавания этого слова.
Значение свойства
Вау, вероятно, это слово было распознано правильно. Значения варьируются от 0,0 до 1.0 включительно.
Свойство RecognizedWord.Text
public string Text { get; }
Получает текст распознанного слова.
Значение свойства
Текст распознанного слова.
Структура TextRecognition.BoundingBox
public struct BoundingBox
Многоугольник с 4 точками, используемыми для границ распознанных слов и строк текста.
Поля
BottomLeft
Нижний левый угол ограничивающего прямоугольника.
Нижний Райт
Правый нижний угол ограничивающего прямоугольника.
TopLeft
Верхняя левая точка ограничивающего прямоугольника.
TopRight
Верхняя правая точка ограничивающего прямоугольника.
Замечания
При возврате в качестве границы для слова или строки точки TopLeft, TopRight, BottomRight и BottomLeft соответствуют повороту и отклонению распознанного текста на изображении. На следующей схеме показан макет точки для разных поворотов текста, где 0 — TopLeft, 1 — TopRight, 2 — BottomRight, а 3 — BottomLeft, все относительно текста.
Класс TextRecognizer
public sealed class TextRecognizer : System.IDisposable
Распознает слова и линии, а также их четырехсторонние границы в исходном изображении.
Метод TextRecognizer.Close
Удаляет объект и связанные ресурсы.
Замечания
Не реализован в C#.
Метод TextRecognizer.CreateAsync
public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();
Асинхронно создает новый экземпляр класса TextRecognizer.
Возвраты
Новый экземпляр класса TextRecognizer.
Это возвращает ошибку, если GetModelReadyStatus не готов.
Метод TextRecognizer.IsAvailable
public static bool IsAvailable ();
Извлекает, установлена ли базовая языковая модель.
Возвраты
Значение True, если установлен базовая языковая модель. В противном случае — значение false.
Метод TextRecognizer.MakeAvailableAsync
public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult,
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();
Гарантирует, что базовая языковая модель установлена и доступна для использования.
Возвраты
Асинхронное действие с ходом выполнения, которое возвращает пакет PackageDeploymentResult при завершении.
Метод TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)
public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Распознать текст в предоставленном изображении.
Параметры
imageBuffer
Распаковка растрового изображения.
options
Параметры настройки модели распознавания текста для TextRecognizer.
Возвраты
Распознанный текст.
Метод TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)
public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer,
Microsoft.Windows.Vision.TextRecognizerOptions options);
Асинхронно распознает текст в предоставленном изображении.
Параметры
imageBuffer
Распаковка растрового изображения.
options
Параметры настройки модели распознавания текста для TextRecognizer.
Возвраты
Распознанный текст.
Класс TextRecognizerOptions
public sealed class TextRecognizerOptions
Предоставляет параметры настройки модели распознавания текста для TextRecognizer.
Свойство TextRecognizerOptions.MaxAnalysisSize
public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }
Возвращает или задает максимальный размер изображения.
Значение свойства
Максимальный размер изображения. Значение по умолчанию — 1152 ширина и высота 768.
Замечания
Этот размер является предложением, и может не всегда быть почетным.
Если исходный образ больше максимального размера, он автоматически будет масштабироваться до верхнего размера.
Свойство MaxLineCount в TextRecognizerOptions
public uint MaxLineCount { get; set; }
Возвращает или задает максимальное количество строк, возвращаемых из операции распознавания.
Значение свойства
Максимальное количество строк, возвращаемых из операции распознавания.
Замечания
По умолчанию используется maxLineCountSupported. Если задано, то возвращаемые максимальные строки будут меньше этого значения и MaxLineCountSupported.
Свойство TextRecognizerOptions.OrientationDetection
public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }
Возвращает или задает, следует ли обнаруживать ориентацию текста.
Значение свойства
Указывает, следует ли обнаруживать ориентацию текста. Значение по умолчанию — None.
Конструктор TextRecognizerOptions.#ctor
public TextRecognizerOptions ();
Инициализирует новый экземпляр класса TextRecognizerOptions.