À quel moment utiliser Azure HDInsight

Effectué

HDInsight vous permet de traiter des Big Data dans de nombreux scénarios, à l’aide de données historiques ou en temps réel. Mais est-ce la chose à faire dans votre cas ? Le plus gros point fort de HDInsight tient à l’éventail complet de configurations qu’il fournit. Dans cette unité, vous allez déterminer si HDInsight est le bon choix pour votre organisation. Vous allez analyser les critères suivants pour vous aider à décider :

  • Plage de charges de travail
  • Extensibilité
  • Tolérance de panne
  • Sécurité

Critères de décision

Pour déterminer si HDInsight répond aux besoins de Big Data de votre organisation, appliquez les critères décrits dans le tableau suivant :

Critères Analyse
Plage de charges de travail Si différentes charges de travail doivent être prises en charge, il vous faut une plateforme capable de répondre à ces exigences.
Scalabilité Votre organisation a-t-elle besoin d’évoluer en fonction des augmentations du volume de données et de la vélocité des données ? Il est important de choisir une plateforme qui peut évoluer automatiquement et prendre en charge la mise à l’échelle du calcul et du stockage indépendamment.
Tolérance de panne Si votre analyse de données doit continuer en dépit de l’échec d’un composant, vous devez choisir une plateforme à tolérance de pannes.
Sécurité La plupart des organisations s’attendent à ce que les données qu’elles manipulent soient sécurisées au repos et en transit. Il est aussi important pour presque toutes les organisations de respecter les normes de conformité de l’État.

Appliquer les critères

Réfléchissez à la façon dont votre organisation souhaite utiliser du Big Data. À présent, appliquez les critères de décision pour déterminer si HDInsight est un bon choix :

  • Éventail de charges de travail : HDInsight vous permet de gérer un large éventail de charges de travail. Ces charges de travail peuvent aller du traitement de données par lots à l’utilisation de données de streaming, en passant par la gestion des entrepôts de données et/ou des charges de travail de science des données. Cette fonctionnalité fait de HDInsight un choix intéressant, en particulier si votre processus métier contient plusieurs charges de travail.

  • Scalabilité : HDInsight prend en charge le stockage et le calcul scalables indépendamment. En outre, les nœuds Worker peuvent être mis à l’échelle automatiquement en fonction de la charge de travail ou de la planification.

    Conseil

    Des optimisations de coût significatives peuvent résulter de la séparation du calcul et du stockage et de la mise à l’échelle automatique du cluster.

  • Tolérance de panne : les nœuds principaux de HDInsight sont résilients aux défaillances et sauvegardés par des machines virtuelles à tolérance de panne. Cela en fait un service hautement disponible affichant un SLA de 99,9 %.

  • Sécurité : L’intégration de Microsoft Entra fournit l’authentification et l’autorisation essentielles à la sécurité d’entreprise. Ces fonctionnalités, en plus du chiffrement et la prise en charge de réseaux virtuels, vous permettent de contrôler précisément qui peut accéder à vos données.

En résumé, envisagez d’utiliser HDInsight quand vous souhaitez :

  • Rassembler de grandes quantités de données à grande échelle et :

    • Obtenir des insights en temps réel.
    • Traiter les données avec des coûts optimisés, un effort minimal et une sécurité renforcée.
  • Migration :

    • Une distribution de Hadoop locale, OSS et empaquetée par le fournisseur vers le cloud, avec un coût et un effort aussi réduits que possible.
    • Un service de Big Data proposé sous forme de logiciel open source par une offre cloud concurrente d’Azure.