Поделиться через


Оптимизация хранилища с помощью дедупликации и сжатия ReFS в локальной среде Azure

Область применения: Azure Local 2311.2 и более поздних версий

В этой статье описывается функция дедупликации и сжатия отказоустойчивой файловой системы (ReFS) и использование этой функции в локальной среде Azure для оптимизации хранилища.

Что такое дедупликация и сжатие ReFS?

Дедупликация и сжатие ReFS — это функция оптимизации хранилища, которая помогает оптимизировать использование хранилища и сократить затраты на хранение. Используйте дедупликацию специально для активных, чувствительных к производительности или с интенсивным чтением рабочих нагрузок, таких как инфраструктура виртуальных рабочих столов Azure (VDI) на Azure Local. Для менее высокопроизводительных рабочих нагрузок можно использовать сочетание дедупликации и сжатия или только сжатия.

Эта функция использует клонирование блоков ReFS для уменьшения перемещения данных и включения только операций с метаданными. Эта функция работает на уровне блока данных и использует фиксированный размер блока в зависимости от размера системы. Модуль сжатия создает тепловую карту, чтобы определить, должен ли блок иметь право на сжатие, оптимизируя использование ЦП.

Дедупликация и сжатие ReFS можно выполнять как одноразовое задание или автоматизировать его с запланированными заданиями. Эта функция работает как с все-флэш, так и с гибридными системами и поддерживает различные параметры устойчивости, такие как двухстороннее зеркало, вложенное двухстороннее зеркало, трехстороннее зеркало и ускоренная четность с зеркалом.

Льготы

Ниже приведены преимущества дедупликации и сжатия ReFS:

  • Экономия на хранении для активных рабочих процессов. Предназначен для активных рабочих нагрузок, таких как VDI, обеспечивая эффективную производительность в требовательных средах.
  • Несколько режимов. Работает в трех режимах: только дедупликация (режим по умолчанию), только сжатие, и одновременно дедупликация и сжатие, позволяя оптимально настроить в зависимости от ваших потребностей.
  • Инкрементная дедупликация. Дедуплицирует только новые или измененные данные вместо сканирования всего тома каждый раз, что оптимизирует длительность задания и снижает влияние на производительность системы.

Требования

Прежде чем начать, убедитесь, что выполнены следующие предварительные требования:

  • У вас есть доступ к локальному экземпляру Azure, который развернут и зарегистрирован.
  • У вас есть общий том кластера (CSV), созданный на экземпляре, и у вас есть доступ к нему.
  • В CSV-файле еще не включена функция дедупликации данных Windows.

Использование дедупликации и сжатия ReFS

Вы можете использовать дедупликацию и сжатие ReFS с помощью Центра администрирования Windows или PowerShell. PowerShell позволяет выполнять как вручную, так и автоматические задания, в то время как Windows Admin Center поддерживает только запланированные задания. Независимо от метода, можно настроить параметры задания и использовать отслеживание изменений файлов для более быстрых последующих запусков.

Примечание.

Рекомендуется использовать только дедупликацию для рабочих нагрузок, где важна производительность, вместо использования сжатия или их сочетания.

Включение и запуск дедупликации и сжатия ReFS

В Windows Admin Center можно создать расписание дедупликации ReFS для запуска на существующем томе или новом томе во время создания тома. Однако включение сжатия поддерживается только с помощью PowerShell.

Выполните следующие действия, чтобы включить дедупликацию ReFS через Центр администрирования Windows и задать расписание, когда она должна выполняться.

  1. Подключитесь к системе, а затем на панели "Сервис " слева выберите тома.

  2. На странице Тома выберите вкладку Инвентаризация, выберите соответствующий том, а затем выберите Параметры. Чтобы включить дедупликацию ReFS для нового тома, нажмите кнопку +Создать.

  3. В области параметров тома справа, в раскрывающемся списке "Дополнительные параметры", установите флажок "Использовать дедупликацию ReFS".

  4. Выберите дни недели, когда дедупликация ReFS должна выполняться, время запуска задания и максимальная длительность (по умолчанию не ограничено), а затем нажмите кнопку "Сохранить".

    На следующем снимке экрана показано, что дедупликация ReFS будет выполняться в пятницу и субботу в 10:00 вечера с максимальной длительностью 2 часа, начиная с пятницы 27.09.2024. Если дата начала была изменена на понедельник 9/30/2024, первый запуск будет 10/4/2024 10:00, так как это первая пятница после 9/30/2024.

    Снимок экрана: панель параметров тома, отображающая параметры дедупликации ReFS.

  5. Проверьте изменения в разделе "Свойства " тома. Расписание отображается в разделе "Свойства" и отображает разбивку экономии и следующее запланированное время выполнения. Эти экономии обновляются после каждого запуска, и вы можете наблюдать влияние производительности на диаграммах в разделе "Производительность ". Если сжатие включено с помощью PowerShell, его экономия также будет отображаться в разделе "Свойства ".

    Снимок экрана: раздел свойств тома, показывающий разбивку экономии и следующее запланированное время выполнения.

Приостановка запланированных заданий

Приостановка расписания отменяет все выполняемые задания и останавливает запланированные запуски в будущем. Этот параметр сохраняет дедупликацию ReFS и метаданные, связанные с сжатием, и продолжает отслеживать изменения файлов для оптимизированных будущих запусков. Вы можете возобновить расписание в любое время с сохраненными параметрами расписания.

Выполните следующие действия, чтобы приостановить запланированные задания с помощью Windows Admin Center:

  1. Подключитесь к системе, а затем на панели "Сервис " слева выберите тома.

  2. На странице "Тома" выберите вкладку "Инвентаризация", выберите соответствующий том, а затем выберите "Параметры".

  3. В области параметров тома справа в раскрывающемся списке "Дополнительные параметры" снимите флажок "Задать расписание" и выберите "Сохранить".

Отключите дедупликацию и сжатие ReFS на томе

Отключение дедупликации и сжатия ReFS на томе останавливает все текущие процессы и отменяет будущие запланированные задания. Кроме того, связанные метаданные тома не сохраняются, и отслеживание изменений файлов прекращается.

Примечание.

Если отключить эту функцию, она не отменяет дедупликацию или сжатие, так как все операции выполняются на уровне метаданных. С течением времени дедупликированные данные возвращаются в исходное состояние, поскольку объем данных подвергается операциям чтения и записи. Для распаковки данных убедитесь, что доступно достаточно свободного места, и используйте ReFSUtil для выполнения следующей операции.

refsutil compression /c /f NONE <vol>

Выполните следующие действия, чтобы отключить функцию с помощью Windows Admin Center:

  1. Подключитесь к системе, а затем на панели "Сервис " слева выберите тома.

  2. На странице "Тома" откройте вкладку "Инвентаризация", выберите соответствующий том, а затем нажмите "Параметры".

  3. На панели настроек тома справа, в раскрывающемся списке "Дополнительные параметры", снимите флажок "Использовать дедупликацию ReFS" и нажмите "Сохранить.

Часто задаваемые вопросы

В этом разделе приведены ответы на часто задаваемые вопросы о дедупликации и сжатия ReFS.

Отличается ли функция дедупликации и сжатия ReFS от дедупликации данных Windows?

Да, эта функция совершенно отличается от функции дедупликации данных Windows.

Внимание

Мы не поддерживаем одновременное включение дедупликации и сжатия ReFS и дедупликации данных Windows.

Дедупликация и сжатие ReFS предназначены для активных рабочих нагрузок, а также для минимизации влияния на производительность после оптимизации. В отличие от дедупликации данных Windows, дедупликация и сжатие ReFS не использует хранилище блоков для хранения дедупликированных данных и не участвует в перемещении физических данных. Эта функция использует клонирование блоков ReFS, чтобы обеспечить операции только для метаданных. Дедупликация данных Windows может обеспечить более высокую экономию хранилища из-за использования размеров блоков переменных, она также подходит для более широкого диапазона типов рабочих нагрузок, таких как файловые серверы общего назначения (GPFS), целевые объекты резервного копирования и многое другое.

Каковы этапы дедупликации и сжатия ReFS?

Процесс оптимизации состоит из следующих этапов, которые происходят последовательно и зависят от указанного режима. Если выполнение оптимизации достигает ограничения длительности, сжатие может не выполняться.

  • Инициализация. На этом этапе том хранилища проверяется, чтобы определить избыточные блоки данных.

  • Дедупликация данных. На этом этапе избыточные блоки преобразуются в одиночные экземпляры и отслеживаются с использованием технологии клонирования блоков ReFS.

  • Сжатие. На этом этапе создается тепловая карта, чтобы определить, должен ли блок иметь право на сжатие. Параметры по умолчанию сжимают редко доступные или холодные данные, чтобы уменьшить их размер. Вы можете изменить уровни сжатия, чтобы настроить диапазон блоков, подходящих для сжатия.

Что происходит при достижении ограничения длительности до полной оптимизации тома?

Ограничение длительности введено, чтобы предотвратить любое влияние на производительность рабочих нагрузок клиентов, вызванное заданием оптимизации в рабочие часы. Служба дедупликации отслеживает оптимизированные части тома и входящие изменения файлов. Эти данные используются в будущих заданиях для уменьшения времени оптимизации. Например, если том обрабатывается только на 30 % в первом запуске из-за ограничения длительности, последующий запуск обращается к оставшимся 70% и любым новым данным.

Известные проблемы

В следующем разделе перечислены известные проблемы, которые в настоящее время существуют с дедупликацией и сжатием ReFS.

Если сжатие включено, использование -FullRun параметра в заданиях после первого запуска оптимизации может привести к взаимоблокировке в системе.

Состояние: открыть.

Избегайте использования -FullRun в заданиях, запускаемых вручную, если Type не является Dedup.

Выполните следующие действия в качестве временного обходного решения, чтобы устранить эту проблему:

  1. Отключите дедупликацию и сжатие на ReFS-томе:

    Disable-ReFSDedup -Volume <path>
    
  2. Распаковка тома с помощью refsutil:

    refsutil compression /c /f NONE <vol>
    
  3. При необходимости повторно включите дедупликацию и сжатие ReFS с единственным режимом Dedup :

    Enable-ReFSDedup -Volume <path> -Type Dedup
    

Планирование заданий для одновременного запуска на нескольких CSV в одной системе может вызвать перемещения CSV и негативно повлиять на производительность.

Состояние: открыть.

Рекомендуется разнести время начала заданий, чтобы избежать их перекрытия. Однако если все задания должны выполняться одновременно, настройте выделение ЦП на каждое задание во всех CSV, чтобы оно составило менее 50% от общего использования ЦП системы. Помните, что применение ограничений ЦП может привести к более длительному времени выполнения задания.

Выполнено задание по дедупликации и сжатию ReFS (либо успешно, либо отменено), а экономия хранилища не указана в Get-ReFSDedupStatus или Windows Admin Center.

Состояние: решено.

Временное решение этой проблемы заключается в том, чтобы инициировать однократное задание и немедленно обновить результаты.

Start-ReFSDedupJob -Volume <path>

Отправка остановленного мониторинга событий трассировки событий для Windows (ETW) после отключения дедупликации и сжатия ReFS на томе.

Состояние: решено.

После отключения дедупликации и сжатия ReFS на томе канал ETW для журналов дедупликации ReFS фиксирует повторяющиеся события остановки мониторинга. Тем не менее, мы не ожидаем значительного влияния на использование из-за этой проблемы.

Событие сбоя задания не регистрируется, если том перемещается на другой узел во время сжатия.

Состояние: решено.

Если CSV-файл перемещается на другой компьютер системы во время сжатия, событие сбоя задания не регистрируется в канале дедупликации ReFS. Тем не менее, мы не ожидаем значительного влияния на использование из-за этой проблемы.

Следующие шаги