Objetivos de escalabilidad y rendimiento de Azure Files y Azure File Sync

Artículo
12/19/2024

Azure Files ofrece recursos compartidos de archivos totalmente administrados en la nube, a los que se puede obtener acceso mediante los protocolos del sistema de archivos Bloque de mensajes del servidor (SMB) y Sistema de archivos de red (NFS). En este artículo se explican los objetivos de escalabilidad y rendimiento de Azure Files y Azure File Sync.

Los objetivos enumerados aquí pueden verse afectados por otras variables de la implementación. Por ejemplo, el rendimiento de E/S de un archivo puede verse afectado tanto por el comportamiento del cliente SMB como por el ancho de banda de red disponible. Debe probar el patrón de uso para determinar si la escalabilidad y el rendimiento de Azure Files cumplen sus requisitos.

Se aplica a

Modelo de administración	Modelo de facturación	Nivel multimedia	Redundancia
Microsoft.Storage	Aprovisionado v2	HDD (estándar)	Local (LRS)
Microsoft.Storage	Aprovisionado v2	HDD (estándar)	Zona (ZRS)
Microsoft.Storage	Aprovisionado v2	HDD (estándar)	Geo (GRS)
Microsoft.Storage	Aprovisionado v2	HDD (estándar)	GeoZone (GZRS)
Microsoft.Storage	Aprovisionado v1	SSD (Premium)	Local (LRS)
Microsoft.Storage	Aprovisionado v1	SSD (Premium)	Zona (ZRS)
Microsoft.Storage	Pago por uso	HDD (estándar)	Local (LRS)
Microsoft.Storage	Pago por uso	HDD (estándar)	Zona (ZRS)
Microsoft.Storage	Pago por uso	HDD (estándar)	Geo (GRS)
Microsoft.Storage	Pago por uso	HDD (estándar)	GeoZone (GZRS)

Objetivos de escalabilidad de Azure Files

Los recursos compartidos de archivos de Azure se implementan en cuentas de almacenamiento, que son objetos de nivel superior que representan un grupo compartido de almacenamiento. Este grupo de almacenamiento se puede usar para implementar varios recursos compartidos de archivos. Por tanto, existen tres categorías que se deben tener en cuenta: cuentas de almacenamiento, recursos compartidos de archivo de Azure y archivos individuales.

Objetivos de escalabilidad de la cuenta de almacenamiento

Los objetivos de escalabilidad de la cuenta de almacenamiento se aplican en el nivel de cuenta de almacenamiento. Hay dos tipos principales de cuentas de almacenamiento para Azure Files:

Cuentas de almacenamiento FileStorage: Las cuentas de almacenamiento FileStorage permiten implementar recursos compartidos de archivos de Azure con un modelo de facturación aprovisionado. Las cuentas FileStorage solo se pueden usar para almacenar recursos compartidos de archivos de Azure. No se puede implementar ningún otro recurso de almacenamiento (contenedores de blobs, colas, tablas, etc.) en una cuenta FileStorage.
Cuentas de almacenamiento de uso general versión 2 (GPv2): Las cuentas de almacenamiento de GPv2 permiten implementar recursos compartidos de archivos de pago por uso en hardware basado en HDD. Además de almacenar recursos compartidos de archivos de Azure, las cuentas de almacenamiento de GPv2 pueden almacenar otros recursos de almacenamiento, como contenedores de blobs, colas o tablas.

Attribute	SSD aprovisionado v1	HDD aprovisionado v2	HDD de pago por uso
Tipo de cuenta de almacenamiento	FileStorage	FileStorage	StorageV2
SKU	Premium_LRS Premium_ZRS	StandardV2_LRS StandardV2_ZRS StandardV2_GRS StandardV2_GZRS	Standard_LRS Standard_ZRS Standard_GRS Standard_GZRS
Número de cuentas de almacenamiento por suscripción y región	250	250	250
Capacidad máxima de almacenamiento	100 TiB	4 PiB	5 PiB
Número máximo de recursos compartidos de archivos	1024 (se recomienda usar 50 o menos)	50	Ilimitado (recomendado para usar 50 o menos)
Número máximo de IOPS	102 400 IOPS	50.000 E/S por segundo	20 000 IOPS
Rendimiento máximo	10,340 MiB por segundo	5,120 MiB/s	Seleccione regiones: Entrada: 7,680 MiB/s Salida: 25, 600 MiB/s Valor predeterminado: Entrada: 3,200 MiB/s Salida: 6,400 MiB/s
Número máximo de reglas de red virtual	200	200	200
Número máximo de reglas de dirección IP	200	200	200
Operaciones de lectura de administración	800 por cada 5 minutos	800 por cada 5 minutos	800 por cada 5 minutos
Operaciones de escritura de administración	10 por segundo/1200 por hora	10 por segundo/1200 por hora	10 por segundo/1200 por hora
Operaciones de lista de administración	100 por cada 5 minutos	100 por cada 5 minutos	100 por cada 5 minutos

Regiones seleccionadas con un mayor rendimiento máximo para HDD de pago por uso

Las siguientes regiones tienen un mayor rendimiento máximo para las cuentas de almacenamiento de pago por uso de HDD (StorageV2):

Este de Asia
Sudeste de Asia
Este de Australia
Sur de Brasil
Centro de Canadá
Este de China 2
Norte de China 3
Norte de Europa
Oeste de Europa
Centro de Francia
Centro-oeste de Alemania
Centro de la India
Japón Oriental
JIO del Oeste de la India
Centro de Corea del Sur
Este de Noruega
Norte de Sudáfrica
Centro de Suecia
Norte de Emiratos Árabes Unidos
Sur de Reino Unido 2
Centro de EE. UU.
Este de EE. UU.
Este de EE. UU. 2
US Gov - Virginia
US Gov: Arizona
Centro-Norte de EE. UU
Centro-sur de EE. UU.
Oeste de EE. UU.
Oeste de EE. UU. 2
Oeste de EE. UU. 3

Los objetivos de escalabilidad de los recursos compartidos de archivos de Azure se aplican en el nivel de recurso compartido de archivos.

Attribute	SSD aprovisionado v1	HDD aprovisionado v2	HDD de pago por uso
Unidad de aprovisionamiento de almacenamiento	1 GiB	1 GiB	N/D
Unidad de aprovisionamiento de IOPS	N/D	1 IOPS	N/D
Unidad de aprovisionamiento de rendimiento	N/D	1 MiB/s	N/D
Tamaño mínimo de almacenamiento	100 GiB (aprovisionados)	32 GiB (aprovisionado)	0 bytes
Tamaño máximo de almacenamiento	100 TiB	256 TiB	100 TiB
Número máximo de archivos	Sin límite	Sin límite	Sin límite
Número máximo de IOPS	102 400 IOPS (dependiente del aprovisionamiento)	50 000 IOPS (dependientes del aprovisionamiento)	20 000 IOPS
Rendimiento máximo	10 340 MiB/s (dependiente del aprovisionamiento)	5 120 IOPS (dependientes del aprovisionamiento)	Hasta el límite de la cuenta de almacenamiento
Número máximo de instantáneas de recurso compartido	200 instantáneas	200 instantáneas	200 instantáneas
Longitud máxima del nombre de archivo³ (nombre de ruta de acceso completo, incluidos todos los directorios, nombres de archivo y caracteres de barra diagonal inversa)	2048 caracteres	2048 caracteres	2048 caracteres
La longitud máxima del componente nombre de ruta de acceso individual² (en la ruta de acceso \A\B\C\D, cada letra representa un directorio o archivo que constituye un componente individual)	255 caracteres	255 caracteres	255 caracteres
Límite de vínculo físico (solo NFS)	178	N/D	N/D
Número máximo de canales de SMB multicanal	4	N/D	N/D
Número máximo de directivas de acceso almacenadas por recurso compartido de archivos	5	5	5

³ Azure Files aplica ciertas reglas de nomenclatura para los nombres de los directorios y archivos.

Objetivos de escalabilidad de archivos

Los objetivos de escalabilidad de los archivos se aplican a los archivos individuales almacenados en los recursos compartidos de archivos de Azure.

Attribute	SSD aprovisionado v1	HDD aprovisionado v2	HDD de pago por uso
Tamaño de archivo máximo	4 TiB	4 TiB	4 TiB
Número máximo de IOPS de datos por archivo	8 000 IOPS	1000 IOPS	1000 IOPS
Rendimiento máximo por archivo	1 024 MiB /s	60 MiB/s	60 MiB/s
Número máximo de identificadores simultáneos para el directorio raíz	10 000 identificadores	10 000 identificadores	10 000 identificadores
Número máximo de identificadores simultáneos por archivo y directorio	2000 identificadores	2000 identificadores	2000 identificadores

Guía de ajuste de tamaño de Azure Files para Azure Virtual Desktop

Un caso de uso popular de Azure Files es almacenar contenedores de perfiles de usuario e imágenes de disco para Azure Virtual Desktop, mediante FSLogix o la asociación de aplicaciones. En implementaciones de Azure Virtual Desktop a gran escala, es posible que se quede sin identificadores para el directorio raíz o por archivo o directorio si usa un único recurso compartido de archivos de Azure. En esta sección se describe cómo los diversos tipos de imágenes de disco consumen los identificadores y se proporcionan instrucciones de ajuste de tamaño en función de la tecnología que se use.

FSLogix

Si usa FSLogix con Azure Virtual Desktop, los contenedores de perfiles de usuario son discos duros virtuales (VHD) o discos duros virtuales de Hyper-V (VHDX), y se montan en un contexto de usuario, no en un contexto del sistema. Cada usuario abrirá un único identificador de directorio raíz, que debe ser para el recurso compartido de archivos. Azure Files puede admitir un máximo de 10 000 usuarios suponiendo que tenga el recurso compartido de archivos (\\storageaccount.file.core.windows.net\sharename) + el directorio de perfiles (%sid%_%username%) + el contenedor de perfiles (profile_%username.vhd(x)).

Si alcanza el límite de 10 000 identificadores simultáneos para el directorio raíz o los usuarios experimentan un rendimiento deficiente, pruebe a usar un recurso compartido de archivos de Azure adicional y a distribuir los contenedores entre los recursos compartidos.

Advertencia

Aunque Azure Files puede admitir hasta 10 000 usuarios simultáneos de un único recurso compartido de archivos, es fundamental probar correctamente las cargas de trabajo con respecto al tamaño y el tipo de recurso compartido de archivos que ha creado. Los requisitos pueden variar en función de los usuarios, el tamaño del perfil y la carga de trabajo.

Por ejemplo, si tiene 2400 usuarios simultáneos, necesitará 2400 identificadores en el directorio raíz (uno para cada usuario), que está por debajo del límite de 10 000 identificadores abiertos. En el caso de los usuarios de FSLogix, alcanzar el límite de 2000 identificadores de archivos y directorios abiertos es muy poco probable. Si tiene un único contenedor de perfiles de FSLogix por usuario, solo consumiría dos identificadores de archivo o directorio: uno para el directorio de perfiles y otro para el archivo de contenedor de perfiles. Si los usuarios tienen dos contenedores cada uno (perfil y ODFC), necesitará un identificador adicional para el archivo ODFC.

Asociación de aplicaciones con CimFS

Si usa la asociación de aplicaciones MSIX o la asociación de aplicaciones para asociar aplicaciones dinámicamente, puede utilizar el sistema de archivos de imágenes compuestas (CimFS) o archivos VHD/VHDX para imágenes de disco. En cualquier caso, los límites de escala son por máquina virtual que monta la imagen, no por usuario. El número de usuarios es irrelevante al calcular los límites de escala. Cuando se arranca una máquina virtual, se monta la imagen de disco, incluso si hay cero usuarios.

Si usa la asociación de aplicaciones con CimFS, las imágenes de disco solo consumen identificadores en los archivos de imagen de disco. No consumen identificadores en el directorio raíz ni en el directorio que contiene la imagen de disco. Sin embargo, dado que una imagen CimFS es una combinación del archivo .cim y al menos otros dos archivos, para cada máquina virtual que monta la imagen de disco, necesitará un identificador para cada uno de los tres archivos del directorio. Por lo tanto, si tiene 100 máquinas virtuales, necesitará 300 identificadores de archivo.

Es posible que se queda sin identificadores de archivo si el número de máquinas virtuales por aplicación supera las 2000. En este caso, use un recurso compartido de archivos de Azure adicional.

Asociación de aplicaciones con VHD/VHDX

Si usa la asociación de aplicaciones con archivos VHD/VHDX, los archivos se montan en un contexto del sistema, no en un contexto de usuario, y son compartidos y de solo lectura. Un sistema de conexión puede consumir más de un identificador en el archivo VHDX. Para mantenerse dentro de los límites de escala de Azure Files, el número de máquinas virtuales multiplicado por el número de aplicaciones debe ser inferior a 10 000, y el número de máquinas virtuales por aplicación no puede superar las 2000. Por lo tanto, la restricción es la que se alcance primero.

En este escenario, podría alcanzar el límite por archivo o directorio con 2000 montajes de un único VHD/VHDX. O bien, si el recurso compartido contiene varios archivos VHD/VHDX, podría alcanzar primero el límite del directorio raíz. Por ejemplo, 100 máquinas virtuales que montan 100 archivos VHDX compartidos alcanzarán el límite de 10 000 identificadores de directorio raíz.

En otro ejemplo, 100 máquinas virtuales que acceden a 20 aplicaciones requerirán 2000 identificadores de directorio raíz (100 x 20 = 2000), que está bien dentro del límite de 10 000 identificadores de directorio raíz. También necesitará un identificador de archivo y un identificador de directorio o carpeta para cada máquina virtual que monte la imagen VHD(X), por lo que 200 identificadores en este caso (100 identificadores de archivo + 100 identificadores de directorio), que está cómodamente por debajo del límite de 2000 identificadores por archivo o directorio.

Si alcanza los límites de los identificadores simultáneos máximos para el directorio raíz o por archivo o directorio, use un recurso compartido de archivos de Azure adicional.

Objetivos de escalabilidad de Azure File Sync

En la tabla siguiente, se indica qué destinos son flexibles, que representan el límite probado por Microsoft, y qué destinos son rígidos, lo que indica un máximo obligatorio:

Recurso	Destino	Límite máximo
Servicios de sincronización de almacenamiento por región	100 servicios de sincronización de Storage	Sí
Servicios de sincronización de almacenamiento por suscripción	15 servicios de sincronización de almacenamiento	Sí
Grupos de sincronización por servicio de sincronización de almacenamiento	200 grupos de sincronización	Sí
Servidores registrados por servicio de sincronización de almacenamiento	100 Servidores	Sí
Puntos de conexión privados por servicio de sincronización de almacenamiento	100 puntos de conexión privados	Sí
Puntos de conexión en la nube por grupo de sincronización	1 punto de conexión en la nube	Sí
Puntos de conexión del servidor por grupo de sincronización	100 puntos de conexión de servidor	Sí
Puntos de conexión del servidor por servidor	30 puntos de conexión de servidor	Sí
Objetos del sistema de archivos (archivos y directorios) por grupo de sincronización	100 millones de objetos	No
Número máximo de objetos del sistema de archivos (directorios y archivos) en un directorio (no recursivo)	5 millones de objetos	Sí
Tamaño máximo del descriptor de seguridad de (archivos y directorios) del objeto	64 KiB	Sí
Tamaño de archivo	100 GiB	No
Tamaño mínimo de un archivo que se va a organizar en niveles	basado en el tamaño del clúster del sistema de archivos (tamaño del clúster del sistema de archivos doble). Por ejemplo, si el tamaño del clúster del sistema de archivos es 4 KiB, el tamaño mínimo del archivo será de 8 KiB.	Sí

Nota

Un punto de conexión de Azure File Sync puede escalar verticalmente hasta el tamaño de un recurso compartido de archivos de Azure. Si se alcanza el límite de tamaño de recurso compartido de archivos de Azure, la sincronización no podrá funcionar.

Métricas de rendimiento de Azure File Sync

Dado que el agente de Azure File Sync se ejecuta en una máquina Windows Server que se conecta a los recursos compartidos de archivos de Azure, el rendimiento de sincronización eficaz depende de varios factores en la infraestructura: Windows Server y la configuración del disco subyacente, el ancho de banda de red entre el servidor y el almacenamiento de Azure, el tamaño del archivo, el tamaño total del conjunto de datos y la actividad del conjunto de datos. Dado que Azure File Sync funciona en el nivel de archivo, las características de rendimiento de una solución basada en Azure File Sync se debe medir según el número de objetos (archivos y directorios) que se procesan por segundo.

En el caso de Azure File Sync, el rendimiento es fundamental en dos fases:

Aprovisionamiento inicial que se realiza una sola vez: para optimizar el rendimiento del aprovisionamiento inicial, consulte Incorporación con Azure File Sync, donde obtendrá los detalles de una implementación óptima.
Sincronización en curso: después de que los datos se inicializan en los recursos compartidos de archivos de Azure, Azure File Sync mantiene varios puntos de conexión sincronizados.

Nota:

Cuando muchos puntos de conexión de servidor del mismo grupo de sincronización se están sincronizando al mismo tiempo, se enfrentan a recursos de servicio en la nube. Como resultado, el rendimiento de la carga se ve afectado. En casos extremos, algunas sesiones de sincronización no podrán acceder a los recursos y se producirá un error. Sin embargo, esas sesiones de sincronización se reanudarán en breve y finalmente se realizarán correctamente una vez que se reduzca la congestión.

Resultados de las pruebas internas

Para ayudarle a planear la implementación para cada una de las fases (aprovisionamiento único inicial y sincronización continua), estos son los resultados observados durante las pruebas internas en un sistema con la siguiente configuración:

Configuración del sistema	Detalles
CPU	64 núcleos virtuales con una memoria caché L3 de 64 MiB
Memoria	128 GB
Disco	Discos SAS con RAID 10 con caché con respaldo de batería
Red	Red de 1 Gbps
Carga de trabajo	Servidor de archivos de uso general

Aprovisionamiento inicial que se realiza una sola vez

Aprovisionamiento inicial que se realiza una sola vez	Detalles
Número de objetos	25 millones de objetos
Tamaño del conjunto de datos	~4,7 TiB
Tamaño de archivo medio	~200 KiB (archivo más grande: 100 GiB)
Enumeración inicial de cambios de nube	80 objetos por segundo
Rendimiento de carga	20 objetos por segundo por grupo de sincronización
Rendimiento de descarga de espacio de nombres	400 objetos por segundo

Enumeración inicial de cambios en la nube: Cuando se crea un nuevo grupo de sincronización, la enumeración inicial de cambios en la nube es el primer paso que se ejecuta. En este proceso, el sistema enumerará todos los elementos del recurso compartido de archivos de Azure. Durante este proceso, no habrá ninguna actividad de sincronización. No se descargará ningún elemento del punto de conexión en la nube al punto de conexión de servidor y no se cargará ningún elemento desde el punto de conexión de servidor al punto de conexión en la nube. La actividad de sincronización se reanudará una vez que se complete la enumeración inicial de cambios en la nube.

La tasa de rendimiento es de 80 objetos por segundo. Puede calcular el tiempo que tardará en completar la enumeración inicial de cambios en la nube mediante la determinación del número de elementos del recurso compartido en la nube y el uso de las fórmulas siguientes para obtener el tiempo en días.

Tiempo (en días) para la enumeración inicial en la nube = (número de objetos en el punto de conexión de nube)/(80*60*60*24)

Sincronización inicial de datos de Windows Server con un recurso compartido de archivos de Azure: muchas implementaciones de Azure File Sync comienzan con un recurso compartido de archivos de Azure vacío porque todos los datos están en el servidor de Windows. En estos casos, la enumeración inicial de cambios en la nube es rápida y la mayor parte del tiempo se dedica a sincronizar los cambios de Windows Server con los recursos compartidos de archivos de Azure.

Aunque la sincronización carga datos en el recurso compartido de archivos de Azure, no hay tiempo de inactividad en el servidor de archivos local y los administradores pueden configurar los límites de red para restringir la cantidad de ancho de banda usado para la carga de datos en segundo plano.

La sincronización inicial suele estar limitada por la velocidad de carga inicial de 20 archivos por segundo/por grupo de sincronización. Los clientes pueden calcular el tiempo de carga de todos sus datos en Azure con las siguientes fórmulas para obtener el tiempo en días:

Tiempo (en días) para la carga de archivos en un grupo de sincronización = (número de objetos en el punto de conexión del servidor)/(20*60*60*24)

Dividir los datos en varios puntos de conexión de servidor y grupos de sincronización puede acelerar esta carga de datos inicial, ya que la operación puede realizarse en paralelo con varios grupos de sincronización a una velocidad de 20 elementos por segundo. Por lo tanto, se ejecutarían dos grupos de sincronización con una tasa combinada de 40 elementos por segundo. El tiempo total para terminar la operación sería el tiempo estimado del grupo de sincronización con el mayor número de archivos que se van a sincronizar.

Rendimiento de descarga del espacio de nombres: Cuando se agrega un nuevo punto de conexión de servidor a un grupo de sincronización existente, el agente de Azure File Sync no descarga ningún contenido del archivo desde el punto de conexión de nube. En primer lugar sincroniza el espacio de nombres completo y, después, desencadena la recuperación en segundo plano para descargar los archivos, ya sea en su totalidad o, si está habilitada la organización en niveles en la nube, la directiva de niveles en la nube establecida en el punto de conexión del servidor.

Sincronización en curso

Sincronización en curso	Detalles
Número de objetos sincronizados	125 000 objetos (renovación ~ 1 %)
Tamaño del conjunto de datos	50 GiB
Tamaño de archivo medio	~500 KiB
Rendimiento de carga	20 objetos por segundo por grupo de sincronización
Rendimiento de descarga completa*	60 objetos por segundo

*Si la nube por niveles está habilitada, es probable que observe un mejor rendimiento, ya que solo se descargan algunos de los datos de archivo. Azure File Sync solo descarga los datos de los archivos almacenados en caché cuando se cambian en cualquiera de los puntos de conexión. En el caso de los archivos en capas o recién creados, el agente no descarga los datos del archivo y, en su lugar, solo sincroniza el espacio de nombres con todos los puntos de conexión del servidor. El agente también admite descargas parciales de archivos en capas a medida que el usuario accede a ellos.

Nota:

Estos números no son una indicación del rendimiento que experimentará. El rendimiento real depende de varios factores como se describe al principio de esta sección.

Como guía general para la implementación, tenga en cuenta algunas cosas:

El rendimiento de los objetos se escala aproximadamente en proporción al número de grupos de sincronización del servidor. La división de los datos en varios grupos de sincronización en un servidor mejora el rendimiento, que también está limitado por el servidor y la red.
El rendimiento de los objetos es inversamente proporcional al rendimiento de MiB por segundo. En el caso de los archivos más pequeños, experimentará un mayor rendimiento en términos del número de objetos procesados por segundo, pero menor rendimiento de MiB por segundo. Por el contrario, para los archivos más grandes, obtendrá menos objetos procesados por segundo, pero un mayor rendimiento de MiB por segundo. El rendimiento en MiB por segundo está limitado por los destinos del escalado de Azure Files.

Compartir vía

Objetivos de escalabilidad y rendimiento de Azure Files y Azure File Sync

Se aplica a

Objetivos de escalabilidad de Azure Files

Objetivos de escalabilidad de la cuenta de almacenamiento

Regiones seleccionadas con un mayor rendimiento máximo para HDD de pago por uso

Objetivos de escalabilidad de archivos

Guía de ajuste de tamaño de Azure Files para Azure Virtual Desktop

FSLogix

Asociación de aplicaciones con CimFS

Asociación de aplicaciones con VHD/VHDX

Objetivos de escalabilidad de Azure File Sync

Métricas de rendimiento de Azure File Sync

Resultados de las pruebas internas

Aprovisionamiento inicial que se realiza una sola vez

Sincronización en curso

Consulte también

Comentarios

Recursos adicionales

Compartir vía

Objetivos de escalabilidad y rendimiento de Azure Files y Azure File Sync

Se aplica a

Objetivos de escalabilidad de Azure Files

Objetivos de escalabilidad de la cuenta de almacenamiento

Regiones seleccionadas con un mayor rendimiento máximo para HDD de pago por uso

Objetivos de escala de recursos compartidos de archivos de Azure

Objetivos de escalabilidad de archivos

Guía de ajuste de tamaño de Azure Files para Azure Virtual Desktop

FSLogix

Asociación de aplicaciones con CimFS

Asociación de aplicaciones con VHD/VHDX

Objetivos de escalabilidad de Azure File Sync

Métricas de rendimiento de Azure File Sync

Resultados de las pruebas internas

Aprovisionamiento inicial que se realiza una sola vez

Sincronización en curso

Consulte también

Comentarios

Recursos adicionales