Организация членов команды операций с данными
Архитектура аналитики в масштабе облака разработана с помощью набора основных принципов.
Основные принципы
Обеспечение самостоятельности: Разрешить группам проектов работать самостоятельно, что позволяет использовать гибкие методы разработки.
управление: обеспечивать внедрение контрольных мер на платформе Azure, чтобы команды проектов видели, изменяли и выполняли функции только в рамках своих разрешений.
Упрощенное развертывание: убедитесь, что общие политики доступны в организации, чтобы помочь командам быстро масштабировать и поддерживать команды с меньшим опытом работы в некоторых основных конструкциях и артефактах.
Роли и команды
В облачной аналитике рекомендуется перейти от горизонтально разложенных команд к гибким вертикальным междоменным командам. Команды по операциям с данными сосредоточены на управлении управлением на уровне управления, в то время как команды приложений данных сосредоточены на создании данных как продукта. Это различие требует изменения организации в шаблоне, более согласованном с разработкой приложений. Например, у каждого приложения есть владелец продукта, который определяет требования и работает с междоменной командой для доставки продукта. В этом случае продукт — это данные для потребления.
Дополнительные сведения см. в статье Общие сведения о ролях и командах для облачной аналитики в Azure
Развертывание и операции
Модель процесса развертывания и операций с данными (DataOps) является важной частью, которая поддерживает некоторые из этих основных принципов. Для организаций рекомендуется соблюдать следующие руководящие принципы для согласования с принципами.
- Используйте инфраструктуру в качестве кода.
- Развертывание шаблонов, охватывающих основные варианты использования в компании.
- Следуйте процессу развертывания, включающему стратегию для форков и веток GitHub.
- Поддержание центрального репозитория и развертывание посадочных зон управления данными.
Участники с узнаваемыми и индивидуальными навыками должны сформировать группу платформы для централизованного управления инфраструктурой платформы данных, а также для создания и развертывания общих компонентов инфраструктуры данных для зоны управления данными и различных зон данных. Группа платформы также может создавать, владеть и предоставлять неуправляемую технологию, которая помогает командам приложений данных записывать, обрабатывать, хранить и поддерживать свои приложения данных.
Группа платформы должна представлять свои службы самостоятельно, что может включать средства для хранения больших данных, управления версиями продуктов, организации или реализации конвейера данных, отмены идентификации данных и т. д. Эти типы инструментов являются ключевыми для минимизации узких мест в рабочем процессе и уменьшении времени на создание новых продуктов данных.
Группа платформы должна следовать рекомендациям, описанным в этом разделе, для достижения своих целей. Другие группы продуктов данных должны использовать рекомендации в предстоящих статьях для тестирования и автоматизации своих данных.
Дополнительные сведения см. в статье автоматизация DevOps для аналитики в масштабе облака в Azure