Поделиться через


Ссылка на API для распознавания текста с поддержкой ИИ (OCR) в пакете SDK для приложений Windows

Внимание

Эта функция пока недоступна. Ожидается, что он будет отправлен в предстоящем экспериментальном выпуске пакета SDK для приложений Windows.

Экспериментальный канал пакета SDK для приложений Windows включает API и функции на ранних этапах разработки. Все API-интерфейсы в экспериментальном канале подвергаются обширным исправлениям и критическим изменениям и могут быть удалены из последующих выпусков в любое время. Они не поддерживаются для использования в рабочих средах, а приложения, использующие экспериментальные функции, не могут быть опубликованы в Microsoft Store.

Узнайте об API пакета SDK для приложений Windows, поддерживаемых искусственным интеллектом (ИИ), которые могут обнаруживать и извлекать текст (символы, строки, границы многоугольника и уровни достоверности для каждого совпадения) в изображениях и преобразовывать их в потоки символов, доступные для машинного чтения.

Дополнительные сведения см. в статье "Начало работы с распознаванием текста" (OCR) в пакете SDK для приложений Windows.

Совет

Предоставьте отзыв об этих API и их функциональных возможностях, создав новую проблему в репозитории GitHub пакета SDK для приложений Windows. (Убедитесь, что вы включили OCR в название!)


Пространство имен Microsoft.Windows.Vision

Предоставляет API для моделей машинного обучения, которые анализируют текстовое содержимое изображений.

Перечисление DetectedLineStyle

public enum DetectedLineStyle

Задает стили линий, которые можно распознать.

Поля

Рукописный текст: 0

Строка текста написана вручную.

Другое: 1

Строка текста не написана вручную.

Перечисление OrientationDetectionOptions

public enum OrientationDetectionOptions

Указывает ориентацию текста, которую можно распознать.

Поля

Нет: 0

Ориентация не распознается.

DetectOrientation: 1

Ориентация распознается.

Класс RecognizedLine

public sealed class RecognizedLine

Представляет одну строку распознанного текста.

Свойство RecognizedLine.Style

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Возвращает распознанный стиль линии.

Значение свойства

распознанный стиль линии.

Замечания

Включает, была ли строка текста рукописной или нет, а также уровень достоверности распознавания.

Свойство RecognizedLine.Text

public string Text { get; }

Возвращает текст распознанной строки.

Значение свойства

Текст распознанной строки.

Замечания

Все слова сцеплены пробелами.

Свойство RecognizedLine.Words

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

Слова в распознанной строке.

Значение свойства

Слова в распознанной строке.

Структура RecognizedLineStyle

public struct RecognizedLineStyle

Представляет стиль распознанной строки.

Поля

Достоверность

Уровень достоверности распознавания стиля линии.

Имя.

Имя стиля строки.

Класс RecognizedText

public sealed class RecognizedText

Представляет результат операции распознавания изображений в тексте.

Свойство RecognizedText.ImageAngle

public float ImageAngle { get; }

Получает угол поворота по часовой стрелке распознанного текста в градусах.

Значение свойства

Угол поворота по часовой стрелке распознанного текста в градусах.

Свойство RecognizedText.Lines

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Возвращает коллекцию распознанных строк.

Значение свойства

Коллекция распознанных строк.

Класс RecognizedWord

public sealed class RecognizedWord

Представляет одно распознаваемое слово.

Свойство BoundingBox для RecognizedWord

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Получает четырехсторонняя граница распознанного слова.

Значение свойства

Четырехсторонняя граница распознанного слова. TopLeft относится к повороту слова.

Свойство RecognizedWord.Confidence

public float Confidence { get; }

Возвращает вероятность правильного распознавания этого слова.

Значение свойства

Вау, вероятно, это слово было распознано правильно. Значения варьируются от 0,0 до 1.0 включительно.

Свойство RecognizedWord.Text

public string Text { get; }

Получает текст распознанного слова.

Значение свойства

Текст распознанного слова.

Структура TextRecognition.BoundingBox

public struct BoundingBox

Многоугольник с 4 точками, используемыми для границ распознанных слов и строк текста.

Поля

BottomLeft

Нижний левый угол ограничивающего прямоугольника.

Нижний Райт

Правый нижний угол ограничивающего прямоугольника.

TopLeft

Верхняя левая точка ограничивающего прямоугольника.

TopRight

Верхняя правая точка ограничивающего прямоугольника.

Замечания

При возврате в качестве границы для слова или строки точки TopLeft, TopRight, BottomRight и BottomLeft соответствуют повороту и отклонению распознанного текста на изображении. На следующей схеме показан макет точки для разных поворотов текста, где 0 — TopLeft, 1 — TopRight, 2 — BottomRight, а 3 — BottomLeft, все относительно текста.

Схема трех ограничивающих полей, показывающих, как точки угла определяются на основе поворота текста.

Класс TextRecognizer

public sealed class TextRecognizer : System.IDisposable

Распознает слова и линии, а также их четырехсторонние границы в исходном изображении.

Метод TextRecognizer.Close

Удаляет объект и связанные ресурсы.

Замечания

Не реализован в C#.

Метод TextRecognizer.CreateAsync

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

Асинхронно создает новый экземпляр класса TextRecognizer.

Возвраты

Новый экземпляр класса TextRecognizer.

Это возвращает ошибку, если GetModelReadyStatus не готов.

Метод TextRecognizer.IsAvailable

public static bool IsAvailable ();

Извлекает, установлена ли базовая языковая модель.

Возвраты

Значение True, если установлен базовая языковая модель. В противном случае — значение false.

Метод TextRecognizer.MakeAvailableAsync

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Гарантирует, что базовая языковая модель установлена и доступна для использования.

Возвраты

Асинхронное действие с ходом выполнения, которое возвращает пакет PackageDeploymentResult при завершении.

Метод TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Распознать текст в предоставленном изображении.

Параметры
imageBuffer

Распаковка растрового изображения.

options

Параметры настройки модели распознавания текста для TextRecognizer.

Возвраты

Распознанный текст.

Метод TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Асинхронно распознает текст в предоставленном изображении.

Параметры
imageBuffer

Распаковка растрового изображения.

options

Параметры настройки модели распознавания текста для TextRecognizer.

Возвраты

Распознанный текст.

Класс TextRecognizerOptions

public sealed class TextRecognizerOptions

Предоставляет параметры настройки модели распознавания текста для TextRecognizer.

Свойство TextRecognizerOptions.MaxAnalysisSize

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

Возвращает или задает максимальный размер изображения.

Значение свойства

Максимальный размер изображения. Значение по умолчанию — 1152 ширина и высота 768.

Замечания

Этот размер является предложением, и может не всегда быть почетным.

Если исходный образ больше максимального размера, он автоматически будет масштабироваться до верхнего размера.

Свойство MaxLineCount в TextRecognizerOptions

public uint MaxLineCount { get; set; }

Возвращает или задает максимальное количество строк, возвращаемых из операции распознавания.

Значение свойства

Максимальное количество строк, возвращаемых из операции распознавания.

Замечания

По умолчанию используется maxLineCountSupported. Если задано, то возвращаемые максимальные строки будут меньше этого значения и MaxLineCountSupported.

Свойство TextRecognizerOptions.OrientationDetection

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Возвращает или задает, следует ли обнаруживать ориентацию текста.

Значение свойства

Указывает, следует ли обнаруживать ориентацию текста. Значение по умолчанию — None.

Конструктор TextRecognizerOptions.#ctor

public TextRecognizerOptions ();

Инициализирует новый экземпляр класса TextRecognizerOptions.