Основные сведения о Пользовательском визуальном распознавании

Завершено

Мы будем использовать службу azure AI Пользовательское визуальное распознавание для создания модели машинного обучения. Подробнее рассмотрим, как работает Пользовательское визуальное распознавание. Затем вы ознакомитесь с пошаговым процессом создания модели — от разработки идеи до реализации полностью работоспособной модели.

Что такое машинное обучение?

Скорее всего, вы уже слышали об ИИ, машинном обучении или глубоком обучении. Определим эти термины, чтобы понять, чем они отличаются.

  • Искусственный интеллект (ИИ) — это процесс программирования компьютера для имитации человеческого интеллекта. ИИ включает в себя машинное обучение. Идея искусственного интеллекта заключается в использовании компьютера для имитации человеческого интеллекта, но ИИ предлагает множество различных методов. Методика, которой посвящен этот модуль, — машинное обучение.

  • Машинное обучение. Машинное обучение — это подмножество ИИ. В машинном обучении используются методы обучения компьютеров на основе полученного опыта. Представьте себе опыт в виде набора данных с уже указанными правильными и неправильными ответами. В машинном обучении компьютер использует предоставленные ответы, чтобы улучшить процесс выполнения им конкретных задач. Поле машинного обучения также включает глубокое обучение.

  • Глубокое обучение. Глубокое обучение — это подмножество машинного обучения, основанное на искусственных нейронных сетях (ANN). Процесс обучения является глубоким, так как структура ИНС состоит из нескольких слоев: входные и выходные данные, а также скрытые слои. Каждый слой содержит единицы, преобразующие входные данные в сведения, которые следующий слой может использовать для определенной задачи прогнозирования. Структура нейронной сети позволяет компьютеру учиться в процессе обработки данных.

    Графическое изображение связей между ИИ, машинным обучением и глубоким обучением.

При создании модели мы пытаемся имитировать человеческий интеллект. Мы используем данные в качестве опыта для обучения модели, чтобы она овладела конкретной задачей или функцией.

Что такое передача обучения?

Azure AI Пользовательское визуальное распознавание использует обучение по передаче. Передача обучения — это возможность использовать предыдущие знания для поиска лучшего решения текущей проблемы. Люди все время применяют такой подход для решения проблем. Мы также обнаруживаем новые способы его выполнения с компьютерами.

Передача обучения работает в Пользовательском визуальном распознавании в Azure путем добавления слоя, который включает предварительно обученную модель, в нейронную сеть. Обученная модель дает нам фору при обучении новых данных. Обучение начинается с использованием домена общих знаний. Новые слои добавляются в нейронную сеть для решения определенной проблемы. В этом случае проблема, которую мы хотим решить, — определение птиц. Начиная работу с предварительно обученной модели, мы получаем лучшие результаты без необходимости добавлять большие объемы данных.

Создание модели машинного обучения

Чтобы лучше понять, как создается модель машинного обучения, ознакомьтесь с пошаговым описанием процесса. Мы выполним эту процедуру для создания модели машинного обучения.

Графическое описание шести шагов создания модели машинного обучения.

  1. Задайте конкретный вопрос. Наш вопрос заключается в том, можем ли мы определять виды птиц по изображению, чтобы помочь документировать различные тенденции и закономерности в поведении птиц.

  2. Подготовка данных. У нас есть набор данных из Корнеллской лаборатории с изображениями птиц, который является чистым и подготовленным, поэтому об этом шаге можно не беспокоиться. Если создана другая модель, вам нужно будет найти и подготовить данные для обучения модели. Вам нужно будет найти данные, которые помогут ответить на интересующий вас вопрос.

  3. Выберите алгоритм. Служба Пользовательское визуальное распознавание в Azure использует свертки нейронных сетей (CNN), поэтому нам не нужно беспокоиться об этом шаге. CNN — это тип глубокого обучения, который обычно используется для анализа изображений. Наличие уже созданного алгоритма экономит нам массу времени!

  4. Выберите модель-кандидат. Служба Пользовательское визуальное распознавание предоставляет нам полезные графы и данные, которые помогут определить, достаточно ли хорошо работает наша модель, чтобы дать удовлетворительный ответ на наш вопрос. Когда мы решим, что модель работает достаточно хорошо, мы перейдем к следующему шагу — тестированию.

  5. Протестируйте модель с помощью ранее не знакомых (новых) данных. Важно протестировать нашу модель, добавив новые данные. Мы выполним поиск в Интернете и найдем несколько тестовых изображений, чтобы увидеть, как модель работает с данными, которые отличаются от тех, что использовались для обучения. Далее в этом модуле мы рассмотрим, почему тестирование таким способом важно.

  6. Развертывание модели. Пользовательское визуальное распознавание предоставляет нам некоторые возможности, связанные с развертыванием модели. Можно выполнить развертывание в конечной точке, чтобы интегрировать модель. Также можно скачать модель. Если загрузить модель, можно выбрать один из нескольких форматов, чтобы выполнить развертывание наиболее подходящим для проекта способом. В этом модуле показано, как использовать параметр быстрого развертывания, доступный на портале Пользовательского визуального распознавания.

Приступим к созданию нашей модели!