Considérations relatives aux performances pour le stockage Azure NetApp Files avec un accès sporadique
Les jeux de données ne sont pas toujours utilisés activement. Jusqu’à 80 % des données d’un jeu peuvent être considérées comme « sporadique », ce qui signifie qu’elles ne sont pas actuellement utilisées ou n’ont pas été consultées récemment. Lors du stockage de données sur un stockage hautes performances comme Azure NetApp Files, l’argent dépensé sur la capacité utilisée est essentiellement gaspiller, car les données sporadiques ne nécessitent pas de stockage hautes performances tant qu’elles n’ont pas été consultées à nouveau.
Le stockage Azure NetApp Files avec accès sporadique est destiné à réduire les coûts de stockage cloud dans Azure. Il existe des considérations sur les performances dans des cas d’usage spécifiques qui doivent être pris en compte.
L’accès aux données déplacées vers les niveaux d’accès sporadique entraîne davantage de latence, en particulier pour les E/S aléatoires. Dans le pire des cas, toutes les données accessibles peuvent se trouver sur le niveau sporadique. Chaque demande doit donc effectuer une récupération des données. Il est rare que toutes les données d’un jeu de données utilisé activement soient dans le niveau sporadique. Il est donc peu probable d’observer une telle latence.
Lorsque la stratégie de récupération d’accès sporadique par défaut est sélectionnée, les lectures d’E/S séquentielles sont traitées directement à partir du niveau d’accès sporadique et ne sont pas renseignées dans le niveau d’accès chaud. Les données lues de façon aléatoire sont remplies à nouveau dans le niveau d’accès chaud, ce qui augmente les performances des lectures suivantes. Les optimisations pour les charges de travail séquentielles réduisent souvent la latence engendrée par la récupération cloud par rapport aux lectures aléatoires et améliorent les performances globales.
Dans un test récent effectué à l’aide du stockage Standard avec un accès sporadique pour Azure NetApp Files, les résultats suivants ont été obtenus.
Remarque
Tous les résultats publiés sont uniquement à des fins de référence. Les résultats ne sont pas garantis, car les performances des charges de travail de production peuvent varier en raison de nombreux facteurs.
Lectures séquentielles de 100 % sur le niveau d’accès chaud/sporadique (travail unique)
Dans le scénario suivant, un seul travail sur une machine virtuelle D32_V5 a été utilisé sur un volume Azure NetApp Files de 50 Tio à l’aide du niveau de performances Ultra. Différentes tailles de bloc ont été utilisées pour tester les performances sur les niveaux d’accès chaud et sporadique.
Remarque
Le maximum pour le niveau de service Ultra est de 128 Mio/s par tébioctet de capacité allouée. Un volume standard Azure NetApp Files peut gérer un débit pouvant atteindre environ 5 000 Mio/s.
Le graphique suivant montre les performances de niveau d’accès sporadique pour ce test à l’aide d’une variété de profondeurs de file d’attente. Le débit maximal d’une seule machine virtuelle était d’environ 400 Mio/s.
Les performances de niveau d’accès chaud étaient environ 2,75x meilleures, plafonnant approximativement à 1 180 Mio/s.
Ce graphique montre une comparaison côte à côte des performances de niveau d’accès sporadique et chaud avec une taille de bloc de 256 Ko.
Quelles sont les causes de la latence dans les niveaux d’accès chaud et sporadique ?
La latence dans le niveau d’accès d’accès chaud est un facteur du système de stockage lui-même, où les ressources système sont épuisées lorsque plus d’E/S sont envoyées au service que peuvent être gérées à tout moment. Par conséquent, les opérations doivent être mises en file d’attente jusqu’à ce que les opérations précédemment envoyées puissent être terminées.
La latence dans le niveau d’accès sporadique est généralement observée avec les opérations de récupération cloud : les requêtes sur le réseau pour les E/S vers le magasin d’objets (charges de travail séquentielles) ou la réactivation de bloc d’accès sporadique dans le niveau d’accès chaud (charges de travail aléatoires).
Résumé des résultats
- Lorsqu’une charge de travail est séquentielle de 100 %, le débit du niveau d’accès sporadique diminue d’environ 47 % par rapport au niveau d’accès chaud (3330 Mio/s par rapport à 1742 Mio/s).
- Lorsqu’une charge de travail est aléatoire de 100 %, le débit du niveau d’accès sporadique diminue d’environ 88 % par rapport au niveau d’accès (2 479 Mio/s par rapport à 280 Mio/s).
- La baisse des performances pour le niveau d’accès chaud lors de l’exécution de charges de travail séquentielles de 100 % (3 330 Mio/s) et de 100 % aléatoires (2 479 Mio/s) était d’environ 25 %. La baisse des performances du niveau d’accès sporadique lors de l’exécution de charges de travail séquentielles de 1 742 Mio/s et de 100 % aléatoires (280 Mio/s) était d’environ 88 %.
- Lorsqu’une charge de travail contient un pourcentage d’E/S aléatoires, le débit global du niveau d’accès sporadique est plus proche de 100 % aléatoire que 100 % séquentiel.
- Les lectures du niveau d’accès sporadique ont chuté d’environ 50 % lors du passage de 100 % séquentiel à un mélange séquentiel/aléatoire de 80/20.
- Les E/S séquentielles peuvent tirer parti d’un cache
readahead
dans Azure NetApp Files qui n’effectue pas d’E/S aléatoires. Cet avantage pour les E/S séquentielles permet de réduire les différences globales de performances entre les niveaux d’accès chaud et sporadique.
Remarques et recommandations
- Si votre charge de travail modifie fréquemment les modèles d’accès de manière imprévisible, l’accès d’accès sporadique peut ne pas être idéal en raison des différences de performances entre les niveaux d’accès chaud et sporadique.
- Si votre charge de travail contient un pourcentage d’E/S aléatoires, les attentes en matière de performances lors de l’accès aux données sur le niveau d’accès sporadique doivent être ajustées en conséquence.
- Configurez la fenêtre de refroidissement et les paramètres de récupération d’accès sporadique pour qu’ils correspondent à vos modèles de charge de travail et pour réduire la quantité de récupération de niveau d’accès sporadique.
- Les performances de l’accès froid peuvent varier en fonction du jeu de données et de la charge système où l’application est en cours d’exécution. Il est recommandé d’effectuer des tests pertinents avec votre jeu de données pour comprendre et tenir compte de la variabilité des performances de l’accès froid.