Рекомендации по решению проблем, связанных с живым выступлением

Статья
06/03/2024

Применимо к этой рекомендации Power Platform контрольного списка эффективности хорошо продуманной производительности:

Реагируйте на проблемы с живыми выступлениями. Разработайте план решения проблем производительности, установив четкие линии коммуникации и распределения обязанностей. При возникновении проблемной ситуации используйте полученные знания для определения превентивных мер и включите их в свою рабочую нагрузку. Внедрить методы, позволяющие быстрее вернуться к нормальной работе при возникновении подобных ситуаций.

В этом руководстве описываются лучшие методы реагирования на проблемы, возникающие во время живых выступлений. Проблемы с производительностью в реальном времени связаны с трудностями и узкими местами в реальном времени, которые могут помешать оптимальному выполнению рабочей нагрузки. Своевременное решение этих проблем не только способствует немедленному обнаружению и устранению сбоев в работе, но и гарантирует, что рабочая нагрузка будет постоянно соответствовать контрольным показателям производительности. Невыполнение этих требований может привести к осложнениям, включая замедление работы, сбои и невосприимчивость системы, а также к ухудшению пользовательского опыта. Они также могут помешать пользователям эффективно выполнять свои задачи и, в свою очередь, запятнать репутацию организации.

Определения

Термин	Определение
Корреляция данных	Согласование журналов, показателей и событий из различных частей вашей рабочей нагрузки для выявления основных причин.
Анализ первопричин	Процесс выявления основных факторов, ответственных за проблему.
Самоисцеление	Возможность автоматического устранения неполадок без вмешательства человека.
Самопрофилактика	Реализации в рамках рабочей нагрузки для предотвращения потенциальных проблем и сбоев.

Ключевые стратегии проектирования

Если у вас возникли проблемы с живым выступлением, вам необходимо иметь под рукой правильные данные и план реагирования на проблему. Этот план должен включать четкие линии коммуникации и ответственности. Основная цель — определить, являются ли проблемы с производительностью временными или изолированными, выявить основную причину проблемы с производительностью и внедрить решения, которые облегчат быстрый возврат к обычной работе и предоставят информацию об инциденте. Интеграция профилактических мер в ваш рабочий процесс является ключевой стратегией. Цель состоит в том, чтобы либо предотвратить повторное возникновение той же проблемы, либо уменьшить ее влияние на производительность, если предотвратить ее невозможно.

Подготовьтесь к проблемам

Идеальный ответ для решения проблем производительности сайта — точный и быстрый. Точность и скорость восстановления производительности требуют подготовки. Для эффективного реагирования на проблемы с производительностью в реальном времени крайне важно отслеживать ключевые показатели производительности, определять первопричину проблем и внедрять соответствующие решения или оптимизации. Для выполнения этих шагов вам может потребоваться проанализировать журналы рабочей нагрузки, провести тестирование производительности и оптимизировать код или конфигурации.

В следующих примерах описываются несколько важнейших областей подготовки:

Иметь точные архитектурные схемы. Ваши архитектурные схемы должны включать все компоненты и показывать, как они взаимодействуют. Визуальное представление может помочь выявить узкие места и отдельные точки отказа, которые могут привести к снижению производительности или недоступности. В идеале вы должны обнаружить и устранить эти проблемы до того, как они приведут к проблемам, но наличие актуальной диаграммы может помочь вам выявить проблемы в моменты повышенного стресса.
Проверьте доступ к данным. Данные и журналы процессов мониторинга имеют решающее значение для реагирования на проблемы с производительностью в режиме реального времени и проведения анализа первопричин. Однако важно сохранять целостность и конфиденциальность данных. Для устранения проблем с производительностью работающего сайта часто требуется доступ к базовым данным, которые обычно недоступны. Вам необходимо обеспечить, чтобы у персонала был доступ к данным, которые им понадобятся при возникновении проблем. Однако вам следует предоставлять только ограниченный по времени и минимальным привилегиям доступ, а также ограничить этот доступ кругом уполномоченных лиц.
Установите автоматические оповещения. Оповещения помогут вам выявлять и устранять проблемы сразу по мере их возникновения. Оповещения должны генерировать уведомления, когда производительность рабочей нагрузки отклоняется от базовых показателей производительности. Со временем вам следует настроить конфигурации оповещений, чтобы избежать генерации слишком большого или слишком малого количества уведомлений. Решения для мониторинга, которые вы используете, должны собирать достаточно данных для генерации оповещений. Эти оповещения должны соответствовать целевым показателям производительности и установленным базовым показателям. Вам следует избегать создания оповещений о проблемах, которые не имеют отношения к вашим целям. Примерами оповещений являются ухудшения времени ответ, производительности вызовов API или подключаемых модулей, а также загрузки страниц. Dataverse

Создайте план сортировки

Создание плана сортировки подразумевает разработку структурированного подхода к выявлению, эскалации, анализу, расстановке приоритетов и информированию о проблемах с производительностью на рабочем объекте. План сортировки — это стратегия реагирования на проблемы, возникающие во время живых выступлений. Он обеспечивает быстрое и эффективное устранение сбоев в работе с помощью четких ролей и процедур. Большинство проблем с производительностью не требуют протоколов аварийного восстановления, но они могут повлиять на функциональность рабочей нагрузки в достаточной степени, чтобы потребовать планирования сортировки. Хорошо документированный план сортировки гарантирует, что все члены команды будут действовать согласованно и быстро, сводя к минимуму влияние на пользователей и рабочую нагрузку. План сортировки должен включать следующие компоненты:

Выявление и мониторинг: Внедрите систему для выявления и мониторинга проблем производительности в режиме реального времени. У вас должен быть список контактных данных людей, которые способны принимать решения или передавать вопросы на более высокий уровень. В плане также должны быть определены роли и обязанности. Необходимо документировать, какие учетные записи получают доступ к защищенной информации и на какой срок.
Процесс эскалации: Определите четкий процесс эскалации, чтобы гарантировать, что проблемы с производительностью своевременно передаются соответствующим группам или лицам. Определение процесса должно включать контактную информацию и инструкции по эскалации проблем.
Анализ первопричин: Разработайте процесс проведения анализа первопричин, чтобы определить основную причину каждой проблемы с производительностью. Процесс должен включать анализ журналов и показателей производительности, а также проведение диагностических тестов для выявления источника каждой проблемы.
Приоритизация: создайте структуру приоритетов, чтобы определить серьезность проблем с производительностью и расставить их по приоритетам на основе их влияния на рабочую нагрузку и пользователей.
Коммуникация: Разработайте план коммуникации, чтобы информировать заинтересованные стороны о состоянии проблем производительности и ходе их решения. Рассмотрите возможность регулярных обновлений, отчетов о статусе и четких каналов связи.
Документация: задокументируйте план сортировки, включая все его этапы, процессы и передовые методы. Эта документация должна быть легкодоступна для членов команды, которые участвуют в реагировании на проблемы с производительностью.

Разработать методы выявления и решения проблем

Решение проблем с производительностью в реальном времени подразумевает выявление и устранение любых факторов, которые могут привести к снижению производительности или неэффективности при выполнении реальных рабочих задач. Данные, которые вы собираете в ходе мониторинга, бесценны для расследования и устранения инцидентов, связанных с производительностью. Эти данные предоставляют историческую запись показателей производительности. Имея в своем распоряжении данные мониторинга, вы можете проанализировать основные причины и выявить способствующие факторы. Вам следует использовать все соответствующие данные мониторинга, чтобы понять и устранить каждую проблему производительности. Отслеживайте количество обнаруженных вами кратковременных всплесков и соответствующим образом корректируйте пороговые значения.

Используйте анализ первопричин

Анализ первопричин требует проверки гипотез. После просмотра данных мониторинга следует составить список потенциальных причин проблем с производительностью и протестировать их.

Чтобы провести анализ первопричины проблемы живого выступления, выполните следующие действия:

Соберите информацию. Соберите как можно больше информации о проблеме производительности. Примерами могут служить сообщения об ошибках, журналы, показатели производительности и любые другие соответствующие данные. Также включите информацию о пользователях, сообщивших о проблеме, например, их устройство, сеть и местоположение.
Определите проблему. Четко определите проблему, указав симптомы и влияние, которое проблема оказывает на рабочую нагрузку или пользователей.
Расследуйте возможные причины. Сузьте область анализа, определив конкретный компонент или область рабочей нагрузки, где возникает проблема с производительностью. Определите потенциальные причины проблем с производительностью на основе собранной информации. Этот процесс может включать анализ кода, параметров конфигурации, инфраструктуры или внешних зависимостей.
Сопоставьте данные. Изучите собранные данные более подробно, чтобы выявить закономерности, аномалии или корреляции, которые могут способствовать возникновению проблем с производительностью. Корреляция данных имеет ключевое значение для выявления проблем с производительностью и их причин. Это может включать просмотр журналов, анализ показателей производительности и проведение тестов.
Проверка гипотез. Сформулируйте гипотезы на основе выявленных вами потенциальных причин. Проведите тесты, чтобы подтвердить или опровергнуть ваши гипотезы. Вам следует использовать тестовую среду, чтобы проверить, сможете ли вы воспроизвести ошибку.
Внедрение решений. После того как вы определите основную причину, разработайте и внедрите решения для устранения проблемы производительности.
Мониторинг и проверка. После внедрения решений постоянно контролируйте рабочую нагрузку, чтобы убедиться, что проблема с производительностью решена. Подтверждайте эффективность решений, отслеживая показатели производительности и отзывы пользователей.

Компромисс: этапы анализа первопричин, такие как выявление возможных причин, проверка гипотез и документирование анализа, могут занять много времени. Чтобы сопоставить проблемы с производительностью, вам также необходимо собирать и хранить данные. Необходимое время и инфраструктура могут существенно увеличить объем работы для операционных групп и стоимость рабочей нагрузки.

Риск: Если вы проводите анализ первопричин без надлежащих мер безопасности, существует риск раскрытия конфиденциальной информации при предоставлении доступа к журналам и данным.

Привлечь Microsoft поддержку

обратитесь в Microsoft службу поддержки , чтобы получить помощь в решении текущих проблем с производительностью. Microsoft Представители службы поддержки не только обладают знаниями, инструментами, ресурсами и опытом для решения проблем, но и могут быть в курсе любых текущих глобальных проблем с производительностью или сбоев, которые могут повлиять на вашу рабочую нагрузку. Уровень предоставляемой поддержки определяется вашим соглашением о поддержке.

Часто лучше работать параллельно со службой поддержки. Microsoft Например, рассмотрим стратегию, в которой некоторые члены команды сотрудничают со службой поддержки, в то время как другие продолжают сортировать и устранять проблемы с производительностью. Microsoft

Важно предоставить команде контактную информацию службы поддержки. Помните, что Microsoft службе поддержки также может потребоваться доступ к данным для эффективного участия в решении проблем.

Для получения дополнительной информации см. Получение справки и поддержки в Power Platform.

Извлекайте уроки из результатов

После устранения проблемы с производительностью работающего сайта необходимо проанализировать, что произошло. Цель — извлечь уроки из проблем производительности, а не просто выявить проблемы. Лучший способ обучения — это документирование. Задокументируйте каждую проблему и объясните, как ее исправить. Если вам помог поставщик, работайте с ним над улучшением документации, обучением своей команды и соответствующим образом измените рабочую нагрузку.

В документации должно быть указано, как предотвратить повторное возникновение каждой проблемы. Наряду с документацией вы можете создавать усовершенствованные оповещения, которые помогут вам своевременно реагировать на индикаторы проблем с производительностью.

Возможности в Power Platform

Power Platform и Azure предоставляют несколько инструментов, которые помогут вам реагировать на проблемы с живым выступлением:

Azure Monitor — это комплексное решение для мониторинга, которое предоставляет информацию о производительности и работоспособности ваших приложений и инфраструктуры. Azure Monitor предлагает такие функции, как метрики, журналы, оповещения и панели мониторинга, которые помогут вам отслеживать и диагностировать проблемы производительности. Power Platform Приложения и автоматизация могут интегрироваться с Azure Monitor с помощью Application Insights возможности. Стандартная телеметрия, а также пользовательские события трассировки могут регистрироваться и анализироваться.
Application Insights — это сервис управления производительностью приложений (APM), который помогает разработчикам и специалистам DevOps контролировать работающие приложения. Он автоматически обнаруживает аномалии производительности, собирает журналы и события на уровне приложений, а также предоставляет аналитические инструменты для диагностики проблем. Power Platform интегрируется с Application Insights.
Log Analytics — это служба, которая собирает и анализирует данные журналов из различных источников, включая приложения, виртуальные машины и ресурсы Azure. Используя Log Analytics, вы можете запрашивать и анализировать данные журналов, чтобы получить представление о производительности и поведении ваших приложений. Рассмотрите возможность использования Log Analytics, если ваша рабочая нагрузка использует ресурсы Azure.
Solution Checker выполняет глубокий статический анализ ваших решений с использованием набора правил передовой практики и выявляет проблемные шаблоны. Устраните все проблемы, связанные с производительностью, перед развертыванием решения в рабочей среде, чтобы избежать проблем с производительностью на рабочем объекте.

Контрольный список по обеспечению эффективности процессов

Обратитесь к полному набору рекомендаций.

Контрольный список эффективности производительности

Поделиться через