Здравствуйте.
Ваши проблемы могут быть связаны с несколькими факторами: от конфигурации DAG до сетевых проблем. Я бы рекомендовал провести комплексную диагностику, начиная с проверки конфигурации DAG и сетевого окружения, и далее обращать внимание на логи и состояние очередей сообщений.
Ваши наблюдения и описанные проблемы указывают на возможные сложности с конфигурацией DAG (Database Availability Group) и взаимодействием между серверами Exchange и сервером-свидетелем. Рассмотрим каждый из вопросов отдельно и предложим возможные шаги по диагностике и устранению проблем.
- Проблемы с остановкой входящей почты при отключении сервера-свидетеля:
Ожидаемое поведение:
- Сервер-свидетель в DAG используется для обеспечения кворума и решения вопросов доступности баз данных при сбое одного из серверов. Если отключить сервер-свидетель, а один из серверов в DAG уже не доступен, это может привести к потере кворума и остановке работы баз данных, что может объяснить проблемы с входящей почтой.
- Однако, если оба сервера в DAG работают нормально и доступны, кратковременное отключение сервера-свидетеля не должно оказывать существенного влияния на обработку почты. В идеале, при отключении свидетеля DAG должен продолжать функционировать, если оба сервера доступны.
Возможные причины проблемы:
- Неправильная конфигурация DAG, которая может вызывать проблемы с кворумом или связью между серверами.
- Проблемы с сетью между серверами Exchange и сервером-свидетелем.
Рекомендации:
- Проверьте конфигурацию DAG, включая настройки кворума. Убедитесь, что оба сервера в DAG могут обеспечить кворум без участия сервера-свидетеля в случае его кратковременного отключения.
- Проверьте сетевое соединение между серверами Exchange и сервером-свидетелем. Убедитесь, что сеть стабильна и серверы могут быстро восстанавливать связь после временных сбоев.
- Рассмотрите возможность использования динамического свидетеля (Dynamic Witness), который позволяет автоматическую настройку роли свидетеля в зависимости от состояния DAG.
- Проблемы после перезагрузки сервера-свидетеля:
Ожидаемое поведение:
- После перезагрузки сервера-свидетеля DAG должен восстанавливать кворум и продолжать функционировать нормально, не останавливая обработку входящей почты.
- Задержки после перезагрузки могут быть вызваны тем, что серверы Exchange требуют времени на восстановление связи и синхронизации с сервером-свидетелем.
Возможные причины проблемы:
- Проблемы с сетевым подключением или DNS после перезагрузки сервера-свидетеля.
- Возможные задержки в обработке сообщений из-за повторного подключения и восстановления очередей сообщений.
Рекомендации:
- Проверьте состояние сети и DNS после перезагрузки сервера-свидетеля. Убедитесь, что серверы Exchange могут быстро и корректно восстанавливать связь с ним.
- Проверьте логи на сервере Exchange и на сервере-свидетеле на наличие ошибок или предупреждений, которые могли бы указывать на проблемы при восстановлении связи.
- Убедитесь, что все сервисы, связанные с DAG, корректно запущены после перезагрузки сервера-свидетеля.
- Избыточность теневого копирования в Queue Viewer:
Ожидаемое поведение:
- Теневое копирование сообщений (Shadow Redundancy) – это нормальный механизм Exchange, который используется для защиты от потери данных. Exchange сохраняет копии сообщений, пока они не будут доставлены на целевой сервер или до их удаления.
- Наличие теневых копий для нескольких десятков сообщений не является критическим и может зависеть от текущей загрузки системы и состояния доставки сообщений.
Возможные причины проблемы:
- Если количество теневых копий постоянно держится на высоком уровне, это может указывать на проблемы с доставкой сообщений или синхронизацией между серверами.
- Могут быть проблемы с производительностью серверов Exchange или сетью, что замедляет доставку и обработку сообщений.
Рекомендации:
- Проверьте состояние доставки сообщений в Queue Viewer. Убедитесь, что сообщения доставляются корректно и без задержек.
- Проверьте производительность серверов Exchange, особенно загрузку процессора, дисковую подсистему и сеть.
- Если количество теневых копий продолжает увеличиваться, рассмотрите возможность дополнительной диагностики и, возможно, увеличения ресурсов серверов.
Пожалуйста отметьте ответ как "Ответ", если он Вам помог. Заранее спасибо!