Поделиться через


Рекомендации по выбору ресурсов для рабочих нагрузок ИИ в Azure

В этой статье представлены рекомендации по выбору ресурсов для организаций, работающих с рабочими нагрузками искусственного интеллекта в Azure. Он посвящен решениям платформы ИИ Azure как службы (PaaS), включая Azure AI Studio, Azure OpenAI, Машинное обучение Azure и Службы ИИ Azure. Она охватывает как рабочие нагрузки генерирующих, так и негенеративных ИИ.

Выбор ресурсов искусственного интеллекта позволяет организациям добиться повышения производительности, масштабируемости и экономичности при управлении рабочими нагрузками ИИ. В следующей таблице представлен обзор основных решений PaaS Azure ИИ и важных критериев принятия решений.

Платформа на базе искусственного интеллекта Тип ИИ Description Необходимые навыки
Azure OpenAI Генеративный ИИ Платформа для доступа к моделям OpenAI Навыки разработчика и обработки и анализа данных
Azure AI Studio Генеративный ИИ Платформа для разработки запросов и развертывания конечных точек искусственного интеллекта Навыки разработчика и обработки и анализа данных
Службы ИИ Azure Аналитический ИИ Платформа для использования предварительно созданных моделей машинного обучения Навыки разработчика
Машинное обучение Azure Машинное обучение Платформа для обучения и развертывания моделей машинного обучения Навыки разработчика и расширенные навыки обработки и анализа данных

Выбор ресурсов для рабочих нагрузок сгенерируемым искусственным интеллектом

Для создания искусственного интеллекта требуется сочетание различных ресурсов для обработки и создания значимых выходных данных на основе входных данных. Правильный выбор гарантирует, что созданные приложения ИИ, такие как использование расширенного поколения извлечения (RAG), обеспечивают точность путем приземления моделей ИИ.

Схема, показывающая основные компоненты рабочей нагрузки сгенерируемым искусственным интеллектом.

В типичной рабочей нагрузке RAG (1) рабочая нагрузка получает запрос пользователя. (2) Оркестратор, например поток запроса, семантический ядро или LangChain, управляет потоком данных. (3) Механизм поиска и извлечения находит соответствующие (4) данные о заземления для отправки в конечную точку создания искусственного интеллекта. (5) Конечная точка модели создания искусственного интеллекта создает ответ на основе пользовательских запросов и данных о заземления. Используйте следующие рекомендации в качестве платформы для создания создаваемых рабочих нагрузок RAG.

  • Выберите созданную платформу ИИ. Используйте Azure OpenAI или Azure AI Studio для развертывания моделей генерированных ИИ и управления ими. Служба Azure OpenAI предоставляет доступ к частным сетям моделей OpenAI и фильтрации содержимого. Azure AI Studio предлагает первую платформу для разработки рабочих нагрузок ИИ. Он имеет встроенные средства для создания и развертывания приложений. Он также включает большой каталог моделей, поток запросов, тонкое настройка, фильтры безопасности содержимого и многое другое.

  • Выберите соответствующий тип вычислений ИИ. Azure AI Studio требует вычислительных экземпляров для потока запросов, создания индексов и открытия Visual Studio Code (веб-приложения или рабочего стола) в студии. Выберите тип вычислений в зависимости от потребностей в производительности и бюджете.

  • Выберите оркестратор. Популярные оркестраторы для создания ИИ включают семантические ядра, поток запроса и LangChain. Семантическое ядро интегрируется со службами Azure. LangChain обеспечивает расширяемость за пределами экосистемы Майкрософт.

  • Выберите механизм поиска и извлечения знаний. Для создания моделей сгенерированных ИИ создайте индекс или векторную базу данных для получения соответствующих данных. Использование службы "Поиск ИИ Azure" для создания традиционных и векторных индексов из различных источников данных, применения фрагментирования данных и использования нескольких типов запросов. Если данные находятся в структурированных базах данных, рассмотрите возможность использования Azure Cosmos DB, База данных Azure для PostgreSQL и Кэш Azure для Redis.

  • Выберите источник данных для заземления данных. Для изображений, аудио, видео или больших наборов данных хранятся данные о заземления в Хранилище BLOB-объектов Azure. Кроме того, используйте базы данных, поддерживаемые поиском ИИ Azure или векторными базами данных.

  • Выберите вычислительную платформу. Используйте дерево принятия решений вычислений Azure, чтобы выбрать подходящую платформу для рабочей нагрузки.

Выбор ресурсов для негенеривных рабочих нагрузок ИИ

Негенеривные рабочие нагрузки ИИ используют платформы, вычислительные ресурсы, источники данных и средства обработки данных для поддержки задач машинного обучения. Выбор нужных ресурсов позволяет создавать рабочие нагрузки ИИ с помощью предварительно созданных и настраиваемых решений.

Схема, показывающая основные компоненты негенеративной рабочей нагрузки ИИ.

В негенеративных рабочих нагрузках ИИ (1) прием данных рабочей нагрузки. (2) Необязательный механизм обработки данных извлекает входящие данные или управляет ими. (3) Конечная точка модели ИИ анализирует данные. (4) Данные поддерживают обучение или настройку моделей ИИ. Используйте следующие рекомендации в качестве платформы для создания негенеривных рабочих нагрузок ИИ.

  • Выберите негенеративную платформу ИИ. Службы ИИ Azure предлагают предварительно созданные модели ИИ, которые не требуют навыков обработки и анализа данных. Инструкции по выбору подходящей службы ИИ Azure см. в статье "Выбор технологии служб искусственного интеллекта Azure". Машинное обучение Azure предоставляет платформу для создания моделей машинного обучения с собственными данными и использования этих моделей в рабочих нагрузках ИИ.

  • Выберите соответствующие вычислительные ресурсы ИИ. Для Машинное обучение Azure требуется вычислительные ресурсы для запуска задания или размещения конечной точки. Используйте тип вычислений, соответствующий вашим потребностям в производительности и бюджете. Для служб ИИ Azure не требуются вычислительные ресурсы.

  • Выберите источник данных. Для Машинное обучение Azure используйте один из поддерживаемых источников данных для размещения обучающих данных. Для служб ИИ Azure многие службы не требуют точной настройки данных, а некоторые, такие как Azure AI Пользовательское визуальное распознавание, предоставляют возможность отправки локальных файлов в управляемое решение для хранения данных.

  • Выберите вычислительную платформу. Используйте дерево принятия решений вычислений Azure для выбора подходящей платформы рабочей нагрузки.

  • Выберите службу обработки данных (необязательно). Функции Azure — это распространенный выбор обработки данных, так как он предоставляет бессерверный вариант. Сетка событий Azure также является общим механизмом триггера для запуска конвейера обработки данных.

Следующий шаг