Работа с большими каталогами в общих папках Azure

Статья
01/23/2025

В этой статье приведены рекомендации по работе с каталогами, содержащими большое количество файлов. Обычно рекомендуется уменьшить количество файлов в одном каталоге, разместив файлы по нескольким каталогам. Однако существуют ситуации, в которых нельзя избежать больших каталогов. При работе с большими каталогами в общих папках Azure, подключенных к клиентам Linux, рассмотрите следующие рекомендации.

Применяется к

Тип общей папки	SMB	NFS
Стандартные общие папки (GPv2), LRS/ZRS
Стандартные общие папки (GPv2), GRS/GZRS
Общие папки уровня "Премиум" (FileStorage), LRS/ZRS

Увеличьте количество хэш-контейнеров

Общий объем ОЗУ в системе, выполняющий перечисление, влияет на внутреннюю работу протоколов файловой системы, таких как NFS и SMB. Даже если пользователи не имеют большого объема памяти, объем доступной памяти влияет на количество хэш-контейнеров в системе, которые влияют на производительность перечисления для больших каталогов. Можно изменить количество хэш-контейнеров в системе, чтобы уменьшить количество хэш-конфликтов, которые могут возникать во время больших рабочих нагрузок перечисления.

Для этого необходимо изменить параметры конфигурации загрузки, предоставив дополнительную команду ядра, которая вступает в силу во время загрузки, чтобы увеличить количество хэш-контейнеров inode. Выполните следующие действия.

С помощью текстового редактора измените /etc/default/grub файл.
```
sudo vim /etc/default/grub
```
Добавьте следующий текст в файл /etc/default/grub. Эта команда выделяет 128 МБ как размер хэш-таблицы и увеличивает потребление памяти системы не более чем на 128 МБ.
```
GRUB_CMDLINE_LINUX="ihash_entries=16777216"
```
Если GRUB_CMDLINE_LINUX уже существует, добавьте ihash_entries=16777216 пространство, как показано ниже:
```
GRUB_CMDLINE_LINUX="<previous commands> ihash_entries=16777216"
```
Чтобы применить изменения, выполните следующую команду:
```
sudo update-grub2
```
Перезапустите систему:
```
sudo reboot
```
Чтобы убедиться, что изменения вступили в силу, после перезагрузки системы проверьте команды cmdline ядра:
```
cat /proc/cmdline
```
Если ihash_entries отображается, система применила этот параметр, а производительность перечисления должна повыситься экспоненциально.

Вы также можете проверить выходные данные dmesg, чтобы узнать, был ли применен cmdline ядра:
```
dmesg | grep "Inode-cache hash table"
Inode-cache hash table entries: 16777216 (order: 15, 134217728 bytes, linear)
```

Команды и операции

Способ указания команд и операций также может повлиять на производительность. Перечисление всех файлов в большом каталоге с помощью ls команды является хорошим примером.

Примечание.

Некоторые операции, такие как рекурсивная ls, findи требуются как имена файлов, так и du атрибуты файлов, поэтому они объединяют перечисления каталогов (чтобы получить записи) со статистикой для каждой записи (чтобы получить атрибуты). Мы рекомендуем использовать более высокое значение для actimeo в точках подключения, где вы, скорее всего, будете выполнять такие команды.

Использование неоцененных ls

В некоторых дистрибутивах Linux оболочка автоматически задает параметры по умолчанию для ls команды, например ls --color=auto. Это изменяет способ ls работы по проводу и добавляет дополнительные операции в ls выполнение. Чтобы избежать снижения производительности, рекомендуется использовать неоплачиваемые ls. Это можно сделать одним из трех способов.

Удалите псевдоним с помощью команды unalias ls. Это только временное решение для текущего сеанса.
Для постоянного изменения можно изменить ls псевдоним в файле пользователя bashrc/bash_aliases . В Ubuntu измените ~/.bashrc его, чтобы удалить псевдоним.ls
Вместо вызова lsможно напрямую вызвать двоичный ls файл, например /usr/bin/ls. Это позволяет использовать ls без каких-либо параметров, которые могут находиться в псевдониме. Расположение двоичного файла можно найти, выполнив команду which ls.

Запретить сортировку выходных данных ls

При использовании ls с другими командами можно повысить производительность, предотвратив ls сортировку выходных данных в ситуациях, когда вам не нужно заботиться о порядке, возвращающем ls файлы. Сортировка выходных данных добавляет значительные затраты.

Вместо выполнения ls -l | wc -l , чтобы получить общее количество файлов, можно использовать -f или -U параметры, ls чтобы предотвратить сортировку выходных данных. Разница заключается в том, что -f также будут отображаться скрытые файлы и -U не будут.

Например, если вы вызываете двоичный ls файл в Ubuntu напрямую, вы запустите /usr/bin/ls -1f | wc -l или /usr/bin/ls -1U | wc -l.

На следующей диаграмме сравнивается время, необходимое для вывода результатов с использованием неупорядоченных, несортированных и отсортированных lsls.

Граф, сравнивающий общее время в секундах для завершения операции сортировки ls и неортированного.

Операции копирования и резервного копирования файлов

При копировании данных из общей папки или резервного копирования из общих папок в другое расположение рекомендуется использовать моментальный снимок общего ресурса в качестве источника вместо активного ввода-вывода. Приложения резервного копирования должны выполнять команды непосредственно в моментальном снимке. Дополнительные сведения см. в разделе "Использование моментальных снимков общего ресурса" с Файлы Azure.

Поделиться через

Применяется к

Рекомендуемые параметры подключения

actimeo

nconnect

Увеличьте количество хэш-контейнеров

Команды и операции

Использование неоцененных ls

Запретить сортировку выходных данных ls

Операции копирования и резервного копирования файлов

Рекомендации на уровне приложения

См. также

Обратная связь

Дополнительные ресурсы

Поделиться через

Оптимизация производительности общей папки при доступе к большим каталогам из клиентов Linux

Применяется к

Рекомендуемые параметры подключения

actimeo

nconnect

Увеличьте количество хэш-контейнеров

Команды и операции

Использование неоцененных ls

Запретить сортировку выходных данных ls

Операции копирования и резервного копирования файлов

Рекомендации на уровне приложения

См. также

Обратная связь

Дополнительные ресурсы