Поделиться через


Рекомендации по управлению для рабочих нагрузок ИИ в инфраструктуре Azure (IaaS)

В этой статье приведены рекомендации по управлению для организаций, на которых выполняются рабочие нагрузки искусственного интеллекта в инфраструктуре Azure (IaaS). Эти рекомендации помогают организациям создавать структурированную платформу для управления ресурсами, управления затратами, безопасности и эффективности работы. Следуя этим рекомендациям, вы можете масштабировать рабочие нагрузки ИИ ответственно и обеспечить соответствие требованиям, безопасность и финансовые цели.

Управление ресурсами

Управление ресурсами устанавливает правила и стандарты для управления ресурсами Azure. Применяя политики управления, организации могут обеспечить соответствие требованиям, стандартизацию использования ресурсов и управление затратами, которые поддерживают ответственное масштабирование операций искусственного интеллекта.

  • Принудительное использование тегов. Используйте Политика Azure для применения правил, таких как расположение ресурсов, разрешенные номера SKU и обязательные теги. Например, создайте политики, чтобы ограничить развертывание некоторых высокозатратных виртуальных машин, помогая эффективно управлять бюджетами.

  • Применение политик управления для обеспечения соответствия требованиям и стандартизации. Используйте Политика Azure для применения правил, таких как расположение ресурсов, разрешенные номера SKU и обязательные теги. Например, создайте политики, чтобы ограничить развертывание некоторых высокозатратных виртуальных машин для управления бюджетом.

  • Используйте группы ресурсов для управления жизненным циклом. Развертывание ресурсов ИИ в группах ресурсов, которые используют общий жизненный цикл. Группы ресурсов позволяют развертывать, настраивать и удалять ресурсы совместно. Они также обеспечивают дополнительное управление (политика), безопасность (RBAC) и границы затрат (бюджет).

  • Стандартизируйте соглашения об именовании. Реализуйте стандартизированное соглашение об именовании для ресурсов искусственного интеллекта. Эта практика улучшает отслеживание и управление. Используйте правила именования и ограничения для каждого ресурса Azure и следуйте рекомендуемой сокращенности, так как многие ресурсы часто имеют ограничения длины имен.

  • Управление инфраструктурой как кодом. Используйте Microsoft Defender для облака для мониторинга и применения безопасности IaC. Это средство помогает обнаружить неправильные конфигурации IaC и обеспечить безопасные развертывания.

Управление затратами

Управление затратами отслеживает и контролирует расходы, связанные с рабочими нагрузками ИИ в Azure. Эффективное управление затратами позволяет организациям задавать бюджеты, отслеживать расходы и поддерживать финансовую устойчивость для проектов искусственного интеллекта.

  • Используйте теги для выделения затрат. Настройте определение Политика Azure для применения тегов к ресурсам. Используйте теги для классификации ресурсов по проекту, центру затрат, среде и владельцу для улучшения управления и выставления счетов.

  • Используйте наследование тегов. Используйте наследование тегов в службе "Управление затратами", чтобы применить выставление счетов, группу ресурсов и теги подписки к записям использования дочерних ресурсов.

  • Управление учетными записями выставления счетов. Используйте выставление счетов Майкрософт для контроля учетных записей выставления счетов и обработки счетов. Назначьте учетную запись выставления счетов каждому проекту или команде ИИ для упрощения точного отслеживания расходов.

  • Мониторинг затрат. Используйте службу "Управление затратами Майкрософт" для настройки оповещений бюджета, оповещений о затратах и запланированных оповещений. Мониторинг затрат таким образом помогает организациям поддерживать финансовую дисциплину.

  • Просмотр шаблонов расходов. Используйте анализ затрат Azure для регулярного просмотра шаблонов расходов. Этот процесс определяет тенденции и показывает области для потенциальной экономии, особенно в использовании виртуальных машин.

  • Разрешить определенные номера SKU виртуальных машин. Используйте политику Azure, чтобы разрешить только номера SKU виртуальных машин, которые соответствуют бюджету ИИ. Встроенное определение политики Разрешенные номера SKU виртуальных машин могут применять этот элемент управления.

  • Рассмотрите возможность автомасштабирования. Используйте масштабируемый набор виртуальных машин для динамической настройки количества виртуальных машин на основе спроса, оптимизации затрат.

  • Настройка автозапуска виртуальной машины. Используйте функцию автозапуска, чтобы запланировать работу виртуальных машин в нерабочее время, уменьшая ненужные затраты.

Управление безопасностью

Управление безопасностью устраняет необходимость надежных мер защиты в рабочих нагрузках ИИ. Реализуя политики безопасности и средства управления доступом, организации могут защищать конфиденциальные данные и ресурсы. Он снижает риск и поддерживает безопасную среду искусственного интеллекта в Azure.

  • Интеграция с идентификатором Microsoft Entra. Используйте идентификатор Microsoft Entra для централизованного управления удостоверениями и возможностей единого входа в рабочих нагрузках ИИ.

  • Реализуйте отдельные элементы управления доступом для каждой среды. Ограничьте удостоверение каждого конвейера развертывания заданной средой, что снижает риск случайного развертывания.

  • Включите Azure Defender. Активируйте Azure Defender для расширенной защиты от угроз. Azure Defender повышает безопасность рабочих нагрузок, включая виртуальные машины, учетные записи хранения и базы данных, повышая надежную защиту рабочих нагрузок ИИ.

Операционное управление

Оперативное управление обеспечивает согласованный мониторинг и управление рабочими нагрузками искусственного интеллекта. Используя средства для мониторинга, оповещения и автоматизированного развертывания, организации могут поддерживать работоспособность системы, обнаруживать проблемы на ранних этапах и повысить эффективность работы, обеспечивая надежную и стабильную работу искусственного интеллекта.

  • Развертывание агентов мониторинга. Убедитесь, что агенты Azure Monitor развертываются по умолчанию для виртуальных машин, Масштабируемые наборы виртуальных машин Azure и подключенных серверов Azure Arc. Подключите их к центральной рабочей области Log Analytics в подписке управления.

  • настраивать оповещения; Включите рекомендуемые правила генерации оповещений для получения уведомлений о отклонениях метрик.

  • Используйте конвейер CI/CD. Реализуйте непрерывную интеграцию и непрерывную доставку (CI/CD) для автоматизации тестирования кода и развертывания в разных средах.

Следующий шаг