Partager via


Efficacité des performances pour le lakehouse de données

Cet article traite des principes architecturaux du pilier efficacité des performances, en se référant à la capacité d’un système à s’adapter aux changements de charge.

Diagramme d’architecture de Lakehouse d’efficacité des performances pour Databricks.

Principes de l’efficacité des performances

  1. Utiliser des architectures sans serveur (serverless)

    Les architectures serverless ne nécessitent pas que les clients exploitent et gèrent l’infrastructure informatique dans le cloud. Cette exception élimine la surcharge opérationnelle de la gestion de l’infrastructure cloud et réduit les coûts de transaction, car les services managés fonctionnent à l’échelle du cloud. Ces services fournissent également une disponibilité immédiate, une sécurité prête à l’emploi et nécessitent une configuration ou une administration minimales.

  2. Concevoir des charges de travail pour optimiser le niveau de performance

    Pour les charges de travail répétées comme les pipelines d’ingénierie des données, les performances ne doivent jamais être négligées. Les données doivent être les suivantes :

    • Lecture efficace à partir de la mémoire de l’objet.
    • Transformé efficacement.
    • Publié efficacement pour la consommation.

    En outre, la plupart des pipelines ou des modes de consommation utilisent une chaîne de systèmes. Pour obtenir les meilleures performances possible, l’ensemble de la chaîne doit être considéré et sélectionné pour obtenir les meilleures performances.

  3. Exécuter des tests de performances dans l’étendue de développement

    Chaque charge de travail de développement doit subir des tests de performances continus. Les tests garantissent que toute modification apportée à la base de code n’affecte pas les performances de la charge de travail. Établissez une planification régulière pour l’exécution de tests. Exécutez le test dans le cadre d’un événement programmé ou d’un pipeline de build d’intégration continue.

    Établissez des références de performance et déterminez l’efficacité actuelle des charges de travail et de l’infrastructure de soutien. La mesure des performances par rapport à des valeurs de référence permet d’élaborer des stratégies d’amélioration et de déterminer si l’application répond aux objectifs stratégiques.

    Identifiez les goulots d’étranglement susceptibles d’affecter les performances. Ces goulots d’étranglement peuvent être causés par des erreurs de code ou une mauvaise configuration d’un service. En règle générale, les goulots d’étranglement s’aggravent à mesure que la charge augmente.

  4. Superviser les performances

    Assurez-vous que les ressources et les services restent accessibles et que les performances répondent aux attentes des utilisateurs ou aux exigences de charge de travail. La surveillance peut vous aider à identifier les goulots d’étranglement ou les ressources insuffisantes, à optimiser les configurations et à détecter les erreurs de pipeline/charge de travail.

Suivant : Bonnes pratiques en matière d’efficacité des performances

Consultez Bonnes pratiques en matière d’efficacité des performances.