Partager via


Scénarios open source Apache sur Azure

Microsoft est fier de prendre en charge des projets, des initiatives et des fondations open source et de contribuer à des milliers de communautés open source. En utilisant des technologies open source sur Azure, vous pouvez exécuter les applications à votre manière tout en optimisant vos investissements.

Cet article récapitule les architectures et les solutions qui utilisent Azure avec les solutions open source Apache.

Apache®, Apache Ignite, Ignite et le logo de la flamme sont soit des marques déposées, soit des marques commerciales d’Apache Software Foundation aux États-Unis et/ou dans d’autres pays. L’utilisation de ces marques n’implique aucune approbation de l’Apache Software Foundation.

Apache Cassandra

Architecture Résumé Focus sur la technologique
Recommandations en matière de partitionnement des données Consulter des recommandations concernant le fractionnement de partitions de données pour une gestion et un accès distincts. Comprendre les stratégies de partitionnement horizontal, vertical et fonctionnel. Cassandra convient parfaitement au partitionnement vertical. Bases de données
Application multiniveau avec Apache Cassandra Déployez des machines virtuelles Linux et un réseau virtuel configuré pour une architecture multiniveau avec Apache Cassandra. Bases de données
Données non relationnelles et NoSQL Découvrez les bases de données non relationnelles qui stockent les données sous forme de paires clé-valeur, de graphiques, de séries chronologiques, d’objets et d’autres modèles de stockage adaptés aux besoins spécifiques en matière de données. Azure Cosmos DB for Apache Cassandra est un service Azure recommandé. Bases de données
Exécuter Apache Cassandra sur des machines virtuelles Azure Examinez les considérations relatives aux performances pour l’exécution d’Apache Cassandra sur des machines virtuelles Azure. Utilisez ces recommandations comme base de référence pour effectuer des tests sur votre charge de travail. Bases de données
Traitement de flux de données avec des moteurs de données open source complètement managés Diffusez des événements en utilisant des services de données Azure complètement managés. Utilisez des technologies open source telles que Kafka, Kubernetes, Cassandra, PostgreSQL et des composants Redis. Analytics

Apache CouchDB

Architecture Résumé Focus sur la technologique
Application Web de base avec redondance de zone Utilisez les pratiques éprouvées de cette architecture de référence pour améliorer la redondance, la scalabilité et le niveau de performance d’une application web Azure App Service. CouchDB est une base de données de documents recommandée. Web

Apache Hadoop

Architecture Résumé Focus sur la technologique
Architectures de Big Data Découvrez des architectures Big Data capables de gérer l’ingestion, le traitement et l’analyse de données trop volumineuses ou complexes pour les systèmes de base de données traditionnels. Les clusters Azure HDInsight Hadoop peuvent être utilisés pour le traitement par lots. Bases de données
Choisir une technologie de transfert de données Découvrez les options de transfert de données Azure comme Azure Import/Export, Azure Data Box, Azure Data Factory, et les outils de ligne de commande et d’interface graphique. L’écosystème Hadoop fournit des outils pour le transfert de données. Bases de données
IA citoyenne avec Power Platform Découvrez comment utiliser Azure Machine Learning et Power Platform pour créer rapidement une preuve de concept de Machine Learning et une version de production. Azure Data Lake, un système de fichiers compatible Hadoop, stocke les données. Intelligence artificielle
Considérations relatives aux données pour les microservices En savoir plus sur la gestion des données dans une architecture de microservices. Voir un exemple de l’utilisation d’Azure Data Lake Store, un système de fichiers Hadoop. Microservices
Extraction, transformation et chargement (extract, transform, load) Découvrez les pipelines de transformation de données ETL (extract-transform-load) et ELT (extract-load-transform), et apprenez à utiliser les flux de contrôle et les flux de données. Hadoop peut être utilisé comme banque de données de destination dans les processus ELT. Analytics
Modèle de vue matérialisée Générez des vues préremplies sur les données d’un ou de plusieurs magasins de données lorsque les données ne sont pas adéquatement formatées pour les opérations de requête requises. Utiliser Hadoop comme mécanisme de stockage Big Data prenant en charge l’indexation. Bases de données
Prédiction des pertes sèches sur prêt avec HDInsight Spark Utiliser Azure HDInsight et le Machine Learning pour prédire la probabilité que des prêts fassent l’objet d’une perte sèche. HDInsight prend en charge Hadoop. Bases de données

Apache HBase

Architecture Résumé Focus sur la technologique
Architectures de Big Data Découvrez des architectures Big Data capables de gérer l’ingestion, le traitement et l’analyse de données trop volumineuses ou complexes pour les systèmes de base de données traditionnels. Vous pouvez utiliser HBase pour la présentation des données dans ces scénarios. Bases de données
Sélectionner une technologie de stockage Big Data Comparer les technologies de stockage Big Data dans Azure. Comprend une discussion sur HBase sur HDInsight. Bases de données
Choisir un magasin de données analytiques Découvrez comment utiliser HBase pour un accès aléatoire et une forte cohérence sur de grandes quantités de données non structurées et semi-structurées. Analytics
Recommandations en matière de partitionnement des données Consultez les conseils pour séparer les partitions de données afin qu’elles puissent être gérées et accessibles séparément. Comprendre les stratégies de partitionnement horizontal, vertical et fonctionnel. HBase convient parfaitement au partitionnement vertical. Bases de données
Données non relationnelles et NoSQL Découvrez les bases de données non relationnelles qui stockent les données sous forme de paires clé-valeur, de graphiques, de séries chronologiques, d’objets et d’autres modèles de stockage adaptés aux besoins spécifiques en matière de données. HBase peut être utilisé pour les données de séries chronologiques et en colonne. Bases de données

Apache Hive

Architecture Résumé Focus sur la technologique
Architectures de Big Data Découvrez des architectures Big Data capables de gérer l’ingestion, le traitement et l’analyse de données trop volumineuses ou complexes pour les systèmes de base de données traditionnels. Dans ces scénarios, vous pouvez utiliser Hive pour le traitement par lots et la présentation des données. Bases de données
Choisir une technologie de traitement par lots Comparer les choix technologiques pour le traitement par lots Big Data dans Azure. En savoir plus sur les fonctionnalités de Hive. Analytics
Choisir un magasin de données analytiques Évaluer les différents magasins de données analytiques pour le Big Data dans Azure. En savoir plus sur les fonctionnalités de Hive. Analytics
Extraction, transformation et chargement (extract, transform, load) Découvrez les pipelines de transformation de données ETL et ELT, et apprenez à utiliser les flux de contrôle et les flux de données. Dans ELT, vous pouvez utiliser Hive pour interroger les données sources. Vous pouvez également l’utiliser conjointement avec Hadoop en tant que magasin de données. Bases de données
Prédiction des pertes sèches sur prêt avec des clusters HDInsight Spark Utiliser Azure HDInsight et le Machine Learning pour prédire la probabilité que des prêts fassent l’objet d’une perte sèche. Les résultats de l’analyse sont stockés dans des tables Hive. Analytics

Apache JMeter

Architecture Résumé Focus sur la technologique
Transformation cloud d’un système bancaire sur Azure Utilisez des applications simulées et réelles, ainsi que des charges de travail existantes, pour superviser la réaction de l’infrastructure d’une solution en termes de scalabilité et de performances. Une solution JMeter personnalisée est utilisée pour le test de charge. Migration
Modèles et implémentations pour une transformation cloud bancaire En savoir plus sur les modèles et les implémentations utilisés pour transformer un système bancaire pour le Cloud. JMeter est utilisé pour le test de charge. Migration
Applications cloud évolutives et SRE Créez des applications cloud évolutives à l’aide d’une modélisation des performances et d’autres principes et pratiques d’ingénierie de fiabilité du site (SRE). JMeter est utilisé pour le test de charge. Web

Apache Kafka

Architecture Résumé Focus sur la technologique
Protection des données d’application pour les charges de travail AKS sur Azure NetApp Files Déployez Astra Control Service avec Azure NetApp Files pour la protection des données, la récupération d’urgence et la mobilité des applications Azure Kubernetes Service (AKS), dont les applications Kafka. Conteneurs
Options de messagerie asynchrone En savoir plus sur les options de messagerie asynchrone dans Azure, y compris le support des clients Kafka. Intégration
Contrôle d’une flotte de véhicules guidés automatisés Découvrez une approche de bout en bout pour un fabricant d’équipement d’origine (OEM). Comprend plusieurs bibliothèques open source que vous pouvez réutiliser. Les services back-end dans cette architecture peuvent se connecter à Kafka. Web
Transformation cloud d’un système bancaire sur Azure Utilisez des applications simulées et réelles, ainsi que des charges de travail existantes, pour superviser la réaction de l’infrastructure d’une solution en termes de scalabilité et de performances. Événements de Event Hubs pour le flux Kafka dans le système. Conteneurs
Sélectionner une technologie de traitement de flux Comparez les options de traitement du flux de messages en temps réel dans Azure, y compris l’API Kafka Streams. Analytics
Modèle Réclamation-vérification Examinez le modèle de réclamation-vérification, qui divise un message volumineux en une vérification des revendications et une charge utile pour éviter de surcharger un bus de messages. Découvrez un exemple qui utilise Kafka pour générer la vérification des revendications. Intégration
Streaming des données avec AKS Utilisez AKS pour ingérer et traiter facilement un flux de données en temps réel avec des millions de points de données collectés via des capteurs. Kafka stocke les données à des fins d’analyse. Conteneurs
Pipelines d’ingestion, ETL et de traitement de flux avec Azure Databricks Créez des pipelines ETL pour les données Batch et les données de streaming avec Azure Databricks afin de simplifier l’ingestion des lacs de données, quelle que soit l’échelle. Kafka est une option permettant d’ingérer des données. Analytics
Intégration d’Event Hubs à Azure Functions Découvrez comment créer, développer et déployer un code efficace et évolutif qui s’exécute sur Azure Functions et réagit aux événements Azure Event Hubs. Découvrez comment les événements peuvent être persistants dans les rubriques Kafka. Sans serveur
Analytique IoT avec Azure Data Explorer Utilisez Azure Data Explorer pour l’analytique de la télémétrie IoT en quasi-temps réel sur des données diffusées en continu rapidement, à un volume élevé, à partir de plusieurs appareils IoT, dont Kafka. Analytics
Réplication de données mainframe et midrange vers Azure à l’aide de Qlik Utiliser Qlik Replicate pour migrer des systèmes mainframe et milieu de gamme vers le cloud, ou pour étendre ces systèmes avec des applications cloud. Dans cette solution, Kafka stocke les informations de journal des modifications utilisées pour répliquer les magasins de données. Macroordinateur
Modèles et implémentations pour une transformation cloud bancaire En savoir plus sur les modèles et les implémentations utilisés pour transformer un système bancaire pour le Cloud. Un outil de mise à l’échelle Kafka est utilisé pour détecter si la solution doit activer ou désactiver le déploiement de l’application. Sans serveur
Modèle éditeur-abonné En savoir plus sur le modèle éditeur-abonné, qui permet à une application d’annoncer des événements à de nombreux consommateurs intéressés de manière asynchrone. Kafka est recommandé pour la messagerie. Intégration
Modèle de limitation de débit Utiliser un modèle de limitation de débit pour éviter ou réduire les erreurs de limitation de bande passante. Ce modèle peut implémenter Kafka pour la messagerie. Intégration
Refactoriser les applications mainframe avec Advanced Découvrez comment utiliser la solution de refactorisation automatisée et avancée COBOL d’Advanced afin de moderniser vos applications COBOL mainframe, de les exécuter sur Azure et de réduire les coûts. Kafka peut être utilisé comme une source de données. Macroordinateur
Traitement de flux de données avec des moteurs de données open source complètement managés Diffusez des événements en utilisant des services de données Azure complètement managés. Utilisez des technologies open source telles que Kafka, Kubernetes, Cassandra, PostgreSQL et des composants Redis. Analytics

Apache MapReduce

Architecture Résumé Focus sur la technologique
Options de messagerie asynchrone En savoir plus sur les options de messagerie asynchrone dans Azure. Vous pouvez utiliser MapReduce pour générer des rapports sur les événements capturés par Event Hubs. Intégration
Architectures de Big Data Découvrez des architectures Big Data capables de gérer l’ingestion, le traitement et l’analyse de données trop volumineuses ou complexes pour les systèmes de base de données traditionnels. Vous pouvez utiliser MapReduce pour le traitement par lots ainsi que pour fournir des fonctionnalités pour les opérations parallèles dans ces scénarios. Bases de données
Choisir une technologie de traitement par lots Découvrez les technologies de traitement par lots Big Data dans Azure, notamment HDInsight avec MapReduce. Analytics
Le modèle Geode Déployez des services back-end dans un ensemble de nœuds géographiques, chacun pouvant traiter une requête client dans n’importe quelle région. Ce modèle est rencontré dans les architectures Big Data qui utilisent MapReduce pour consolider les résultats sur plusieurs machines. Bases de données
Minimiser la coordination Suivez ces recommandations pour améliorer la scalabilité en limitant la coordination entre les services d’application. Utiliser MapReduce pour fractionner le travail en tâches indépendantes. Bases de données

Apache Oozie

Architecture Résumé Focus sur la technologique
Architectures de Big Data Découvrez des architectures Big Data capables de gérer l’ingestion, le traitement et l’analyse de données trop volumineuses ou complexes pour les systèmes de base de données traditionnels. Dans ces scénarios, vous pouvez utiliser Oozie pour l’orchestration. Bases de données
Choisir une technologie d'orchestration de pipeline de données En savoir plus sur les principales fonctionnalités d’orchestration de Oozie. Bases de données

Apache Solr

Architecture Résumé Focus sur la technologique
Choisir un magasin de données de recherche Découvrez les capacités des magasins de données de recherche dans Azure et les principaux critères pour choisir celui qui correspond le mieux à vos besoins. En savoir plus sur les principales fonctionnalités de HDInsight avec Solr. Bases de données

Apache Spark

Architecture Résumé Focus sur la technologique
Analytique de bout en bout avec Azure Synapse Apprenez à utiliser Azure Data Services pour créer une plateforme d’analyse moderne, capable de relever les défis les plus courants en matière de données. Le moteur d’analyse des pools Spark est disponible dans les espaces de travail Azure Synapse. Analytics
Scoring par lots de Spark sur Azure Databricks Créez une solution évolutive pour le scoring par lots d’un modèle de classification Apache Spark. Intelligence artificielle
Architectures de Big Data Découvrez des architectures Big Data capables de gérer l’ingestion, le traitement et l’analyse de données trop volumineuses ou complexes pour les systèmes de base de données traditionnels. Vous pouvez utiliser Spark pour le traitement par lots ou de flux et en tant que magasin de données analytiques. Bases de données
Choisir une technologie de traitement par lots Comparez les différentes technologiques pour le traitement par lots Big Data dans Azure, y compris les options d’implémentation de Spark. Analytics
Sélectionner une technologie de traitement de flux Comparez les options de traitement du flux de messages en temps réel dans Azure, y compris les options d’implémentation de Spark. Analytics
Choisir un magasin de données analytiques Évaluer les différents magasins de données analytiques pour le Big Data dans Azure. En savoir plus sur les fonctionnalités des pools Spark dans Azure Synapse. Analytics
Extraction, transformation et chargement (extract, transform, load) Découvrez les pipelines de transformation de données ETL (extract-transform-load) et ELT (extract-load-transform), et apprenez à utiliser les flux de contrôle et les flux de données. Avec l’approche ELT, vous pouvez utiliser Spark pour interroger les données sources. Vous pouvez également l’utiliser conjointement avec Hadoop en tant que magasin de données. Bases de données
Prédiction des pertes sèches sur prêt avec HDInsight Spark Utiliser Azure HDInsight et le Machine Learning pour prédire la probabilité que des prêts fassent l’objet d’une perte sèche. Bases de données
Nombreux modèles Machine Learning avec Spark En savoir plus sur les nombreux modèles Machine Learning avec Azure. Intelligence artificielle
Produits Microsoft de Machine Learning Comparez les options de création, de déploiement et de gestion de vos modèles d’apprentissage automatique, y compris la plateforme d’analyse basée sur Azure Databricks Spark et SynapseML. Intelligence artificielle
Entrepôt de données moderne pour les PME/TPE Utiliser Azure Synapse, Azure SQL Database et Azure Data Lake Storage pour moderniser les données locales et héritées des PME. Les outils de l’espace de travail Azure Synapse peuvent utiliser les fonctionnalités de calcul Spark pour traiter les données. Analytics
Technologie de traitement du langage naturel Choisissez un service de traitement en langage naturel pour l’analyse des sentiments, la détection de rubriques, la détection de la langue, l’extraction de phrases clés et la classification de documents. En savoir plus sur les principales fonctionnalités d’Azure HDInsight avec Spark. Intelligence artificielle
Métriques et des modèles d’observabilité Découvrez comment utiliser des métriques et des modèles d’observabilité pour améliorer les performances de traitement d’un système Big Data à l’aide d’Azure Databricks. La bibliothèque d’analyse Azure Databricks diffuse en continu les événements Spark et les métriques Spark Structured Streaming des tâches. Bases de données
Traitement de flux de données avec des moteurs de données open source complètement managés Diffusez des événements en utilisant des services de données Azure complètement managés. Utiliser des technologies open source telles que Spark, Kafka, Kubernetes, Cassandra, PostgreSQL et des composants Redis. Analytics

Apache Sqoop

Architecture Résumé Focus sur la technologique
Architectures de Big Data Découvrez des architectures Big Data capables de gérer l’ingestion, le traitement et l’analyse de données trop volumineuses ou complexes pour les systèmes de base de données traditionnels. Dans ces scénarios, vous pouvez utiliser Sqoop pour automatiser les workflows d’orchestration. Bases de données
Choisir une technologie de transfert de données Découvrez les options de transfert de données comme Azure Import/Export, Data Box et Sqoop. Bases de données

Apache ZooKeeper

Architecture Résumé Focus sur la technologique
Modèle de limitation de débit Utiliser un modèle de limitation de débit pour éviter ou réduire les erreurs de limitation de bande passante. Dans ce scénario, vous pouvez utiliser ZooKeeper pour créer un système qui accorde des baux temporaires à la capacité. Intégration