Este artigo mostra como implementar o padrão de Aplicativo Web Moderno. O padrão de Aplicativo Web Moderno define como você deve modernizar aplicativos Web na nuvem e introduzir uma arquitetura voltada para serviços. O padrão de Aplicativo Web Moderno fornece diretrizes prescritivas de arquitetura, código e configuração que se alinham aos princípios do Azure Well-Architected Framework e se baseiam no padrão de Aplicativo Web Confiável.
Por que usar o padrão de Aplicativo Web Moderno?
O padrão de Aplicativo Web Moderno ajuda a otimizar áreas de alta demanda do seu aplicativo Web. Ele oferece orientação detalhada para dividir essas áreas, permitindo o dimensionamento independente para otimização de custos. Essa abordagem permite alocar recursos dedicados a componentes críticos, o que melhora a performance geral. O desacoplamento de serviços separáveis pode melhorar a confiabilidade, impedindo que a lentidão em uma parte do aplicativo afete outras e habilite o controle de versão de componentes individuais do aplicativo de forma independente.
Como implementar o padrão de Aplicativo Web Moderno
Este artigo inclui orientações de arquitetura, código e configuração para implementar o padrão de Aplicativo Web Moderno. Use os links a seguir para navegar até as orientações de que você precisa:
- Diretrizes de arquitetura: saiba como modularizar componentes de aplicativos Web e selecionar soluções de PaaS (plataforma como serviço) apropriadas.
- Orientações de código: implemente quatro padrões de design para otimizar os componentes desacoplados: Estrangulador Fig, Nivelamento de Carga Baseado em Fila, Consumidores concorrentes, Monitoramento de ponto de extremidade de integridade.
- Orientações de configuração: configure a autenticação, a autorização, o dimensionamento automático e a conteinerização para os componentes divididos.
Dica
Há uma implementação de referência (aplicativo de amostra) do padrão de Aplicativo Web Moderno. Ele representa o estado final da implementação do Aplicativo Web Moderno. Trata-se de um aplicativo Web de nível de produção que apresenta todas as atualizações de código, arquitetura e configuração discutidas neste artigo. Implante e use a implementação de referência para orientar sua implementação do padrão de Aplicativo Web Modern.
Diretrizes para arquitetura
O padrão de Aplicativo Web Moderno baseia-se no padrão de Aplicativo Web Confiável. Requer alguns componentes arquitetônicos extras para implementar. Você precisa de uma fila de mensagens, plataforma de contêiner, serviço de armazenamento e um registro de contêiner (consulte a figura 1).
Figura 1. Elementos arquitetônicos essenciais do padrão de Aplicativo Web Moderno.
Para um SLO (objetivo de nível de serviço) mais alto, é possível adicionar uma segunda região à arquitetura do aplicativo Web. Configure o load balancer para rotear o tráfego para a segunda região para oferecer suporte a uma configuração ativa-ativa ou ativa-passiva, dependendo da necessidade da sua empresa. As duas regiões exigem os mesmos serviços, exceto que uma região tem uma rede virtual de hub que se conecta. Adote uma topologia de rede hub-and-spoke para centralizar e compartilhar recursos, como um firewall de rede. Acesse o repositório de contêiner por meio da rede virtual do hub. Se você tiver máquinas virtuais, adicione um host bastion à rede virtual do hub para gerenciá-las com segurança (consulte a figura 2).
Figura 2. A arquitetura de padrão do Aplicativo Web Moderno com segunda região topologia de e rede hub-and-spoke.
Dividir arquitetura
Para implementar o padrão de Aplicativo Web Moderno, você precisa dividir a arquitetura de aplicativo Web existente. O desacoplamento da arquitetura envolve a divisão de um aplicativo monolítico em serviços menores e independentes, cada um responsável por um recurso ou funcionalidade específica. Esse processo envolve a avaliação do aplicativo Web atual, modificação da arquitetura e, por fim, extração do código do aplicativo Web para uma plataforma de contêiner. O objetivo é identificar e extrair sistematicamente os serviços de aplicativos que mais se beneficiam com o desacoplamento. Para dividir sua arquitetura, siga estas recomendações:
Identifique os limites do serviço Aplique princípios de design controlados por domínio para identificar contextos limitados em seu aplicativo monolítico. Cada contexto limitado representa um limite lógico e pode ser um candidato para um serviço separado. Os serviços que representam funções de negócios distintas e têm menos dependências são bons candidatos para a divisão.
Avalie os benefícios do serviço. Concentre-se nos serviços que mais se beneficiam do dimensionamento independente. Por exemplo, uma dependência externa, como um provedor de serviços de email em um aplicativo LOB, pode exigir mais isolamento contra falhas. Considere os serviços que passam por atualizações ou alterações frequentes. O desacoplamento desses serviços permite a implantação independente e reduz o risco de afetar outras partes do aplicativo.
Avalie a viabilidade técnica. Examine a arquitetura atual para identificar restrições técnicas e dependências que possam afetar o processo de divisão. Planeje a forma como os dados são gerenciados e compartilhados entre os serviços. Os serviços divididos devem gerenciar seus próprios dados e minimizar o acesso direto ao banco de dados entre os limites do serviço.
Implante os serviços do Azure. Selecione e implante os serviços do Azure necessários para dar suporte ao serviço de aplicativo Web que você pretendia extrair. Use a seção Selecione os serviços certos do Azure a seguir para ver orientações.
Divida o serviço de aplicativo Web. Defina interfaces e APIs claras para que os serviços de aplicativo Web recém-extraídos interajam com outras partes do sistema. Projete uma estratégia de gerenciamento de dados que permita que cada serviço gerencie seus próprios dados, garantindo consistência e integridade. Para obter estratégias de implementação específicas e padrões de design que podem ser usados durante esse processo de extração, consulte a seção Orientações de código.
Use o armazenamento independente para serviços divididos. Cada serviço desacoplado deve ter seus próprios armazenamentos de dados para facilitar o controle de versão e a implantação. Por exemplo, a implementação de referência separa o serviço de email do aplicativo Web e elimina a necessidade de o serviço acessar o banco de dados. Em vez disso, o serviço comunica o status de entrega de email de volta ao aplicativo Web por meio de uma mensagem do Barramento de Serviço do Azure e o aplicativo Web salva uma observação em seu banco de dados.
Implemente pipelines de implantação separados para cada serviço dividido. Pipelines de implantação separados permitem que cada serviço seja atualizado no seu próprio ritmo. Caso equipes ou organizações diferentes na sua empresa possuam serviços diferentes, o uso de pipelines de implantação separados dará a cada equipe controle sobre suas próprias implantações. Use ferramentas de CI/CD (integração contínua e entrega contínua), como Jenkins, GitHub Actions ou Azure Pipelines, para configurar esses pipelines.
Revise os controles de segurança. Certifique-se de que seus controles de segurança estejam atualizados para acomodar a nova arquitetura, incluindo regras de firewall e controles de acesso.
Selecione os serviços certos do Azure
Para cada serviço do Azure na sua arquitetura, consulte o Guia de serviço do Azure relevante no Well-Architected Framework. Para o padrão de Aplicativo Web Moderno, é necessário um sistema de mensagens para dar suporte a mensagens assíncronas, uma plataforma de aplicativo que dê suporte à conteinerização e um repositório de imagens de contêiner.
Escolha uma fila de mensagens. Uma fila de mensagens é uma parte importante das arquiteturas voltadas para serviços. Ele separa remetentes e destinatários de mensagens para habilitar mensagens assíncronas. Use as orientações sobre como escolher um serviço de mensagens do Azure para escolher um sistema de mensagens do Azure que dê suporte às suas necessidades de design. O Azure tem três serviços de mensagens: Grade de Eventos do Azure, Hubs de Eventos do Azure e Barramento de Serviço. Comece com o Barramento de Serviço como a opção padrão e use as outras duas opções se o Barramento de Serviço não atender às suas necessidades.
Serviço Caso de uso Barramento de Serviço Escolha o Barramento de Serviço para entrega confiável, ordenada e possivelmente transacional de mensagens de alto valor em aplicativos empresariais. Grade de Eventos Escolha a Grade de Eventos quando precisar lidar com um grande número de eventos discretos com eficiência. A Grade de Eventos é escalonável para aplicativos controlados por eventos em que muitos eventos pequenos e independentes (como alterações de estado de recurso) precisam ser roteados para assinantes em um modelo de publicação-assinatura de baixa latência. Hubs de Eventos Escolha Hubs de Eventos para ingestão de dados massiva e de alta taxa de transferência, como telemetria, logs ou análise em tempo real. Os Hubs de Eventos são otimizados para cenários de streaming em que os dados em massa precisam ser ingeridos e processados continuamente. Implemente um serviço de contêiner. Para as partes do aplicativo que você deseja conteinerizar, é necessário uma plataforma de aplicativo que dê suporte a contêineres. Use as orientações Escolher um serviço de contêiner do Azure para ajudar a tomar sua decisão. O Azure tem três serviços de contêiner principais: Aplicativos de Contêiner do Azure, AKS (Serviço de Kubernetes do Azure) e Serviço de Aplicativo do Azure. Comece com os Aplicativos de Contêiner como a opção padrão e use as outras duas opções se os Aplicativos de Contêiner não atenderem às suas necessidades.
Serviço Caso de uso Aplicativos de Contêiner Escolha Aplicativos de Contêiner se você precisar de uma plataforma sem servidor que dimensione e gerencie automaticamente contêineres em aplicativos controlados por eventos. AKS Escolha o AKS se precisar de controle detalhado sobre as configurações do Kubernetes e recursos avançados para dimensionamento, rede e segurança. Aplicativos Web para Contêiner Escolha Aplicativo Web para Contêineres no Serviço de Aplicativo para obter a experiência de PaaS mais simples. Implemente um repositório de contêiner. Ao usar qualquer serviço de computação baseado em contêiner, é necessário ter um repositório para armazenar as imagens de contêiner. Você pode usar um registro de contêiner público, como o Docker Hub, ou um registro gerenciado, como o Registro de Contêiner do Azure. Use as orientações de Introdução aos registros de contêiner no Azure para ajudar a tomar sua decisão.
Orientações de código
Para dividir e extrair com êxito um serviço independente, é necessário atualizar o código do aplicativo Web com os seguintes padrões de design: o padrão Estrangulador Fig, o padrão Nivelamento de Carga Baseado em Fila, o padrão Consumidores Concorrentes, o padrão Monitoramento de Ponto de Extremidade de Integridade e o padrão Repetição.
Figura 3. Papel dos padrões de design.
Padrão Estrangulador Fig: o padrão Estrangulador Fig migra de forma incremental a funcionalidade de um aplicativo monolítico para o serviço dividido. Implemente esse padrão no aplicativo Web principal para migrar gradualmente a funcionalidade para serviços independentes, direcionando o tráfego com base em pontos de extremidade.
Padrão de Nivelamento de Carga Baseado em Fila: o padrão de Nivelamento de Carga Baseado em Fila gerencia o fluxo de mensagens entre o produtor e o consumidor usando uma fila como buffer. Implemente esse padrão na parte do produtor do serviço dividido para gerenciar o fluxo de mensagens de forma assíncrona usando uma fila.
Padrão Consumidores Concorrentes: o padrão Consumidores Concorrentes permite que várias instâncias do serviço dividido leiam de maneira independente da mesma fila de mensagens e concorram para processar mensagens. Implemente esse padrão no serviço dividido para distribuir tarefas em várias instâncias.
Padrão Monitoramento de Ponto de Extremidade de Integridade: o padrão de Monitoramento de Ponto de Extremidade de Integridade expõe pontos de extremidade para monitorar o status e a integridade de diferentes partes do aplicativo Web. (4a) Implemente esse padrão no aplicativo Web principal. (4b) Implemente-o também no serviço dividido para rastrear a integridade dos pontos de extremidade.
Padrão Repetição: o padrão Repetição lida com falhas transitórias repetindo operações que podem falhar intermitentemente. (5a) Implemente esse padrão em todas as chamadas de saída para outros serviços do Azure no aplicativo Web principal, como chamadas para fila de mensagens e pontos de extremidade privados. (5b) Implemente também esse padrão no serviço dividido para lidar com falhas transitórias em chamadas para os pontos de extremidade privados.
Cada padrão de design fornece benefícios que se alinham a um ou mais pilares do Well-Architected Framework (consulte a tabela a seguir).
Padrão de design | Local de implementação | Confiabilidade (RE) | Segurança (SE) | Otimização de custo (CO) | Excelência operacional (OE) | Eficiência de performance (PE) | Suporte aos princípios do Well-Architected Framework |
---|---|---|---|---|---|---|---|
Padrão de Estrangulador Fig | Aplicativo Web principal | ✔ | ✔ | ✔ | RE:08 CO:07 CO:08 OE:06 OE:11 |
||
Padrão de nivelamento de carga baseado em fila | Produtor de serviço dividido | ✔ | ✔ | ✔ | RE:06 RE:07 CO:12 PE:05 |
||
Padrão de Consumidores Concorrentes | Serviço dividido | ✔ | ✔ | ✔ | RE:05 RE:07 CO:05 CO:07 PE:05 PE:07 |
||
Padrão de monitoramento de ponto de extremidade de integridade | Aplicativo Web principal e serviço dividido | ✔ | ✔ | ✔ | RE:07 RE:10 OE:07 PE:05 |
||
Padrão de repetição | Aplicativo Web principal e serviço dividido | ✔ | RE:07 |
Implementar o padrão Estrangualdor Fig
Use o padrão Strangler fig para migrar gradualmente a funcionalidade da base de código monolítica para novos serviços independentes. Extraia novos serviços da base de código monolítico existente e modernize lentamente partes críticas do aplicativo Web. Para implementar o padrão Estrangulador Fig, siga estas recomendações:
Configure uma camada de roteamento. Na base de código do aplicativo Web monolítico, implemente uma camada de roteamento que direcione o tráfego com base em pontos de extremidade. Use a lógica de roteamento personalizada conforme necessário para lidar com regras de negócios específicas para direcionar o tráfego. Por exemplo, se você tiver um
/users
endpoint em seu aplicativo monolítico e tiver movido essa funcionalidade para o serviço desacoplado, a camada de roteamento direcionará todas as solicitações para/users
o novo serviço.Gerenciar a distribuição de recursos. Implemente sinalizadores de recursos e distribuição em etapas para distribuir gradualmente os serviços desacoplados. O roteamento de aplicativo monolítico existente deve controlar quantas solicitações os serviços desacoplados recebem. Comece com uma porcentagem pequena de solicitações e aumente o uso ao longo do tempo à medida que ganhar confiança em sua estabilidade e performance.
Por exemplo, a implementação de referência extrai a funcionalidade de entrega de email em um serviço autônomo, que pode ser introduzido gradualmente para lidar com uma parte maior das solicitações de envio de emails contendo guias de suporte da Contoso. À medida que o novo serviço prova sua confiabilidade e desempenho, ele pode eventualmente assumir todo o conjunto de responsabilidades de e-mail do monólito, completando a transição.
Use um serviço de fachada (se necessário). Um serviço de fachada é útil quando uma única solicitação precisa interagir com vários serviços ou quando você deseja ocultar a complexidade do sistema subjacente do cliente. No entanto, se o serviço desacoplado não tiver nenhuma API voltada para o público, um serviço de fachada poderá não ser necessário.
Na base de código do aplicativo Web monolítico, implemente um serviço de fachada para rotear solicitações para o back-end apropriado (monólito ou microsserviço). No novo serviço dividido, certifique-se de que o novo serviço possa lidar com solicitações de forma independente quando acessado por meio da fachada.
Implementar o Padrão de nivelamento de carga baseado em fila
Implemente o padrão de Nivelamento de Carga Baseado em Fila na parte do produtor do serviço desacoplado para lidar de forma assíncrona com tarefas que não precisam de respostas imediatas. Esse padrão aprimora a capacidade de resposta e a escalabilidade geral do sistema usando uma fila para gerenciar a distribuição da carga de trabalho. Ele permite que o serviço dividido processe solicitações a uma taxa consistente. Para implementar esse padrão de forma eficaz, siga estas recomendações:
Use o serviço de enfileiramento de mensagens sem bloqueio. Verifique se o processo que envia mensagens para a fila não bloqueia outros processos enquanto aguarda que o serviço dividido lide com mensagens na fila. Se o processo exigir o resultado da operação de serviço desacoplado, implemente uma maneira alternativa de lidar com a situação enquanto aguarda a conclusão da operação enfileirada. Por exemplo, no Spring Boot, você pode usar a
StreamBridge
classe para publicar mensagens de forma assíncrona na fila sem bloquear o thread de chamada (consulte o código de exemplo):private final StreamBridge streamBridge; public SupportGuideQueueSender(StreamBridge streamBridge) { this.streamBridge = streamBridge; } // Asynchronously publish a message without blocking the calling thread @Override public void send(String to, String guideUrl, Long requestId) { EmailRequest emailRequest = EmailRequest.newBuilder() .setRequestId(requestId) .setEmailAddress(to) .setUrlToManual(guideUrl) .build(); log.info("EmailRequest: {}", emailRequest); var message = emailRequest.toByteArray(); streamBridge.send(EMAIL_REQUEST_QUEUE, message); log.info("Message sent to the queue"); }
Este exemplo Java usa
StreamBridge
para enviar mensagens de forma assíncrona. Essa abordagem garante que o aplicativo principal permaneça responsivo e consiga lidar com outras tarefas simultaneamente, enquanto o serviço dividido processa as solicitações enfileiradas a uma taxa gerenciável.Implemente a repetição e a remoção de mensagens. Implemente um mecanismo para repetir o processamento de mensagens enfileiradas que não podem ser processadas com êxito. Se as falhas persistirem, essas mensagens deverão ser removidas da fila. Por exemplo, o Barramento de Serviço tem recursos internos de repetição e fila de devoluções.
Configure processamento de mensagens idempotentes. A lógica que processa mensagens da fila deve ser idempotente para lidar com casos em que uma mensagem pode ser processada mais de uma vez. No Spring Boot, você pode usar
@StreamListener
ou@KafkaListener
com um identificador de mensagem exclusivo para evitar o processamento duplicado. Ou você pode organizar o processo de negócios para operar em uma abordagem funcional com o Spring Cloud Stream, em que oconsume
método é definido de uma forma que produz o mesmo resultado quando é executado repetidamente. Leia Spring Cloud Stream com Service Bus para obter mais informações sobre a lista de configurações que gerenciam o comportamento de como as mensagens são consumidas.Gerencie as alterações na experiência. O processamento assíncrono pode fazer com que as tarefas não sejam concluídas imediatamente. Os usuários devem estar cientes quando sua tarefa ainda estiver sendo processada para definir as expectativas corretas e evitar confusão. Use sinalizações visuais ou mensagens para indicar que uma tarefa está em andamento. Dê aos usuários a opção de receber notificações quando sua tarefa for concluída, como um email ou notificação por push.
Implementar o padrão Consumidores Concorrentes
Implemente o padrão Consumidores Concorrentes no serviço desacoplado para gerenciar tarefas de entrada da fila de mensagens. Esse padrão envolve a distribuição de tarefas em várias instâncias de serviços divididos. Esses serviços processam mensagens da fila, aprimorando o balanceamento de carga e aumentando a capacidade do sistema de lidar com solicitações simultâneas. O padrão Consumidores Concorrentes é eficaz quando:
- A sequência de processamento de mensagens não é essencial.
- A fila permanece não afetada por mensagens malformadas.
- A operação de processamento é idempotente, o que significa que ela pode ser aplicada várias vezes sem alterar o resultado além da aplicação inicial.
Para implementar o padrão Consumidores Concorrentes, siga estas recomendações:
Lide com mensagens simultâneas. Ao receber mensagens de uma fila, certifique-se de que seu sistema seja dimensionado de forma previsível configurando a simultaneidade para corresponder ao design do sistema. Os resultados do teste de carga ajudam você a decidir o número apropriado de mensagens simultâneas a serem tratadas e você pode começar a partir de uma para medir o desempenho do sistema.
Desative a pré-busca. Desabilite a pré-busca de mensagens para que os consumidores busquem mensagens apenas quando estiverem prontas.
Use modos confiáveis de processamento de mensagens. Use um modo de processamento confiável, como PeekLock (ou equivalente), que repete automaticamente as mensagens que falham no processamento. Esse modo aumenta a confiabilidade em comparação aos métodos de exclusão primeiro. Se um trabalhador não conseguir lidar com uma mensagem, outro deverá ser capaz de processá-la sem erros, mesmo que a mensagem seja processada várias vezes.
Implemente tratamento de erros. Roteie mensagens malformadas ou não processáveis para uma fila separada de mensagens mortas. Esse design evita o processamento repetitivo. Por exemplo, você pode capturar exceções durante o processamento de mensagens e mover a mensagem problemática para a fila separada. Para o Barramento de Serviço, as mensagens são movidas para a fila de dead-leter após um número especificado de tentativas de entrega ou em rejeição explícita pelo aplicativo.
Lide com mensagens fora de ordem. Projete os consumidores para que processem mensagens que chegam fora de sequência. Vários consumidores paralelos significam que eles podem processar mensagens fora de ordem.
Dimensione com base no comprimento da fila. Os serviços que consomem mensagens de uma fila devem ser escalados automaticamente com base no comprimento da fila. O dimensionamento automático baseado em escala permite o processamento eficiente de picos de mensagens recebidas.
Use a fila mensagem-resposta. Se o sistema exigir notificações para processamento pós-mensagem, configure uma resposta dedicada ou uma fila de respostas. Essa configuração separa as mensagens operacionais dos processos de notificação.
Use serviços sem estado. Considere o uso de serviços sem estado para processar solicitações de uma fila. Isso permite dimensionamento fácil e uso eficiente de implantes.
Configure o registro em log. Integre o registro em log e o tratamento de exceções específicas no fluxo de trabalho de processamento de mensagens. Concentre-se em capturar erros de serialização e direcionar essas mensagens problemáticas para um mecanismo de mensagens mortas. Esses logs fornecem informações valiosas para a solução de problemas.
Por exemplo, a implementação de referência usa o padrão Consumidores Concorrentes em um serviço sem estado em execução em Aplicativos de Contêiner para processar as solicitações de entrega de email de uma fila do Barramento de Serviço.
O processador registra detalhes de processamento de mensagens, auxiliando na solução de problemas e no monitoramento. Ele captura erros de desserialização e fornece insights necessários ao depurar o processo. O serviço é dimensionado no nível do contêiner, permitindo o tratamento eficiente de picos de mensagens com base no comprimento da fila (consulte o código a seguir).
@Configuration
public class EmailProcessor {
private static final Logger log = LoggerFactory.getLogger(EmailProcessor.class);
@Bean
Function<byte[], byte[]> consume() {
return message -> {
log.info("New message received");
try {
EmailRequest emailRequest = EmailRequest.parseFrom(message);
log.info("EmailRequest: {}", emailRequest);
EmailResponse emailResponse = EmailResponse.newBuilder()
.setEmailAddress(emailRequest.getEmailAddress())
.setUrlToManual(emailRequest.getUrlToManual())
.setRequestId(emailRequest.getRequestId())
.setMessage("Email sent to " + emailRequest.getEmailAddress() + " with URL to manual " + emailRequest.getUrlToManual())
.setStatus(Status.SUCCESS)
.build();
return emailResponse.toByteArray();
} catch (InvalidProtocolBufferException e) {
throw new RuntimeException("Error parsing email request message", e);
}
};
}
}
Implementar o padrão Monitoramento do Ponto de Extremidade de Integridade
Implemente o padrão Monitoramento de Ponto de Extremidade de Integridade no código do aplicativo principal e no código de serviço dividido para acompanhar a integridade dos pontos de extremidade do aplicativo. Orquestradores como AKS ou Aplicativos de Contêiner podem sondar esses pontos de extremidade para verificar a integridade do serviço e reiniciar instâncias não íntegras. O Spring Boot fornece suporte interno para verificações de integridade com o Spring Boot Actuator, que pode expor pontos de extremidade de verificação de integridade para dependências importantes, como bancos de dados, agentes de mensagens e sistemas de armazenamento. Para implementar o padrão Monitoramento de Ponto de Extremidade de Integridade, siga estas recomendações:
Implemente verificações de integridade. Use o Spring Boot Actuator para fornecer endpoints de verificação de integridade. O Spring Boot Actuator expõe um endpoint
/actuator/health
que inclui indicadores de integridade integrados e verificações personalizadas para várias dependências. Para habilitar o ponto de extremidade de integridade, adicione aspring-boot-starter-actuator
dependência em seupom.xml
arquivo orbuild.gradle
.<!-- Add Spring Boot Actuator dependency --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-actuator</artifactId> </dependency>
Configure o ponto de extremidade de integridade conforme
application.properties
mostrado na implementação de referência:txt management.endpoints.web.exposure.include=metrics,health,info,retry,retryevents
Valide dependências. O Spring Boot Actuator inclui indicadores de integridade para várias dependências, como bancos de dados, agentes de mensagens (RabbitMQ ou Kafka) e serviços de armazenamento. Para validar a disponibilidade de serviços do Azure, como o Armazenamento de Blobs do Azure ou o Barramento de Serviço, use plug-ins da comunidade, como o Azure Spring Apps ou as integrações do Micrometer, que fornecem indicadores de integridade para esses serviços. Se forem necessárias verificações personalizadas, você poderá implementá-las criando um bean personalizado
HealthIndicator
.import org.springframework.boot.actuate.health.Health; import org.springframework.boot.actuate.health.HealthIndicator; import org.springframework.stereotype.Component; @Component public class CustomAzureServiceBusHealthIndicator implements HealthIndicator { @Override public Health health() { // Implement your health check logic here (e.g., ping Service Bus) boolean isServiceBusHealthy = checkServiceBusHealth(); return isServiceBusHealthy ? Health.up().build() : Health.down().build(); } private boolean checkServiceBusHealth() { // Implement health check logic (pinging or connecting to the service) return true; // Placeholder, implement actual logic } }
Configure implantes do Azure. Configure o recurso do Azure para usar as URLs de verificação de integridade do aplicativo para confirmar a atividade e a preparação. Por exemplo, você pode usar o Terraform para usar as URLs de verificação de integridade para confirmar a atividade e a preparação dos aplicativos implantados nos Aplicativos de Contêiner. Para obter mais informações, consulte Investigações de integridade em Aplicativos de Contêiner.
Implementar o padrão Repetição
O padrão Repetição permite que os aplicativos se recuperem de falhas transitórias. O padrão Repetição é fundamental para o padrão de Aplicativo Web Confiável, portanto, seu aplicativo Web já deve estar usando o padrão Repetição. Aplique o padrão Repetição às solicitações aos sistemas de mensagens e às solicitações emitidas pelos serviços divididos extraídos do aplicativo Web. Para implementar o padrão Repetição, siga estas recomendações:
Configure opções de repetição. Ao integrar com uma fila de mensagens, certifique-se de configurar o cliente responsável pelas interações com a fila com as configurações de repetição apropriadas. Especifique parâmetros, tais como o número máximo de tentativas, o atraso entre as tentativas e o atraso máximo.
Use retirada exponencial. Implemente a estratégia de retirada exponencial para tentativas de repetição. Isso significa aumentar exponencialmente o tempo entre cada tentativa, o que ajuda a reduzir a carga no sistema durante períodos de altas taxas de falha.
Use a funcionalidade de repetição do SDK. Para serviços com SDKs especializados, como o Barramento de Serviço ou o Armazenamento de Blobs, use os mecanismos internos de repetição. Os mecanismos de repetição integrados são otimizados para os casos de uso típicos do serviço e podem lidar com novas tentativas de forma mais eficaz com menos configuração necessária de sua parte.
Adote bibliotecas de resiliência padrão para clientes HTTP. Para clientes HTTP, você pode usar o Resilience4* junto com o RestTemplate ou WebClient do Spring para lidar com novas tentativas em comunicações HTTP. O RestTemplate do Spring pode ser encapsulado com a lógica de repetição do Resilience4j para lidar com erros HTTP transitórios de forma eficaz.
Trate o bloqueio de mensagens. Para sistemas baseados em mensagens, implemente estratégias de tratamento de mensagens que ofereçam suporte a novas tentativas sem perda de dados, como o uso de modos de "bloqueio de inspeção", quando disponíveis. Certifique-se de que as mensagens com falha sejam repetidas de forma eficaz e movidas para uma fila de mensagens mortas após repetidas falhas.
Orientações de configuração
As seções a seguir fornecem orientações sobre como implementar as atualizações de configuração. Cada seção alinha-se a um ou mais pilares do Well-Architected Framework.
Configuração | Confiabilidade (RE) | Segurança (SE) | Otimização de custo (CO) | Excelência operacional (OE) | Eficiência de performance (PE) | Suporte aos princípios do Well-Architected Framework |
---|---|---|---|---|---|---|
Configurar a autenticação e a autorização | ✔ | ✔ | SE:05 OE:10 |
|||
Implementar o dimensionamento automático independente | ✔ | ✔ | ✔ | RE:06 CO:12 PE:05 |
||
Conteinerizar a implantação de serviço | ✔ | ✔ | CO:13 PE:09 PE:03 |
Configurar a autenticação e a autorização
Para configurar a autenticação e a autorização em qualquer novo serviço do Azure (identidades de carga de trabalho) que você adicionar ao aplicativo Web, siga estas recomendações:
Use identidades gerenciadas para cada serviço novo. Cada serviço independente deve ter sua própria identidade e usar identidades gerenciadas para autenticação de serviço a serviço. As identidades gerenciadas eliminam a necessidade de gerenciar credenciais em seu código e reduzem o risco de vazamento de credenciais. Ele ajuda a evitar colocar informações confidenciais, como cadeias de conexão, em seu código ou arquivos de configuração.
Conceda privilégios mínimos a cada serviço novo. Atribua somente as permissões necessárias a cada identidade de serviço nova. Por exemplo, se uma identidade só precisar ser enviada por push para um registro de contêiner, não conceda permissões de pull. Revise essas permissões regularmente e ajuste conforme necessário. Use identidades diferentes para funções diferentes, como implantação e aplicativo. Isso limita o dano possível caso uma identidade seja comprometida.
Adote uma IaC (infraestrutura como código). Use o Bicep ou ferramentas de IaC semelhantes, como o Terraform, para definir e gerenciar seus recursos de nuvem. A IaC garante a aplicação consistente de configurações de segurança em suas implantações e permite que você controle a versão da configuração da infraestrutura.
Para configurar a autenticação e a autorização em usuários (identidades de usuário), siga estas recomendações:
Conceda privilégios mínimos aos usuários. Assim como nos serviços, certifique-se de que os usuários recebam somente as permissões necessárias para executar suas tarefas. Revise e ajuste regularmente essas permissões.
Realize auditorias de segurança regularmente. Revise e audite regularmente sua configuração de segurança. Procure por configurações incorretas ou permissões desnecessárias e corrija-as imediatamente.
A implementação de referência usa a IaC para atribuir identidades gerenciadas a serviços adicionados e funções específicas a cada identidade. Ele define funções e permissões de acesso para implantação definindo funções para push e pull do Container Registry (consulte o código a seguir).
resource "azurerm_role_assignment" "container_app_acr_pull" {
principal_id = var.aca_identity_principal_id
role_definition_name = "AcrPull"
scope = azurerm_container_registry.acr.id
}
resource "azurerm_user_assigned_identity" "container_registry_user_assigned_identity" {
name = "ContainerRegistryUserAssignedIdentity"
resource_group_name = var.resource_group
location = var.location
}
resource "azurerm_role_assignment" "container_registry_user_assigned_identity_acr_pull" {
scope = azurerm_container_registry.acr.id
role_definition_name = "AcrPull"
principal_id = azurerm_user_assigned_identity.container_registry_user_assigned_identity.principal_id
}
# For demo purposes, allow current user access to the container registry
# Note: when running as a service principal, this is also needed
resource "azurerm_role_assignment" "acr_contributor_user_role_assignement" {
scope = azurerm_container_registry.acr.id
role_definition_name = "Contributor"
principal_id = data.azuread_client_config.current.object_id
}
Configurar o dimensionamento automático independente
O padrão do Aplicativo Web Moderno começa a dividir a arquitetura monolítica e introduz a divisão de serviço. Ao dividir uma arquitetura de aplicativo Web, você pode dimensionar serviços divididos de forma independente. Ao dimensionar os serviços do Azure para dar suporte a um serviço de aplicativo Web independente, em vez de um aplicativo Web inteiro, você otimiza os custos de dimensionamento enquanto atende às demandas. Para escalar contêineres automaticamente, siga estas recomendações:
Use serviços sem estado. Certifique-se de que seus serviços sejam sem estado. Se o aplicativo Web contiver o estado de sessão em processo, externalize-o para um cache distribuído como o Redis ou um banco de dados como o SQL Server.
Configure regras de dimensionamento automático. Use as configurações de dimensionamento automático que forneçam o controle mais econômico de seus serviços. Para serviços em contêineres, o dimensionamento baseado em eventos, como o Kubernetes Event-Driven Autoscaler (KEDA), geralmente fornece controle granular, permitindo que você dimensione com base em métricas de eventos. Os Aplicativos de Contêiner e o AKS dão suporte ao KEDA. Para serviços que não dão suporte ao KEDA, como o Serviço de Aplicativo, use os recursos de dimensionamento automático fornecidos pela própria plataforma. Esses recursos geralmente incluem dimensionamento com base em regras baseadas em métricas ou tráfego HTTP.
Configure réplicas mínimas. Para evitar uma inicialização a frio, defina as configurações de dimensionamento automático para que mantenham no mínimo uma réplica. Uma inicialização a frio é quando você inicializa um serviço a partir de um estado parado, o que geralmente causa uma resposta atrasada. Se a minimização de custos for uma prioridade e você puder tolerar os atrasos da inicialização a frio, defina a contagem mínima de réplicas como 0 ao configurar o dimensionamento automático.
Configure um período de resfriamento. Aplique um período de resfriamento apropriado para introduzir um atraso entre os eventos de dimensionamento. O objetivo é evitar atividades de dimensionamento excessivas acionadas por picos de carga temporários.
Configure o dimensionamento baseado em fila. Se o aplicativo usar uma fila de mensagens como o Barramento de Serviço, defina as configurações de dimensionamento automático para dimensionar com base no comprimento da fila com mensagens de solicitação. O dimensionador visa manter uma réplica do serviço para cada N mensagem na fila (arredondada para cima).
Por exemplo, a implementação de referência usa o dimensionador KEDA do Barramento de Serviço para dimensionar automaticamente o Aplicativo de Contêiner com base no comprimento da fila do Barramento de Serviço. A regra de dimensionamento, chamada service-bus-queue-length-rule
, ajusta o número de réplicas de serviço dependendo da contagem de mensagens na fila do Barramento de Serviço especificada. O messageCount
parâmetro é definido como 10, o que significa que o dimensionador adiciona uma réplica para cada 10 mensagens na fila. O máximo de réplicas (max_replicas
) é definido como 10 e o mínimo de réplicas é implicitamente 0, a menos que seja substituído, o que permite que o serviço seja reduzido a zero quando não houver mensagens na fila. A cadeia de conexão para a fila do Barramento de Serviço é armazenada com segurança como um segredo no Azure, chamado azure-servicebus-connection-string
, que é usado para autenticar o dimensionador no Barramento de Serviço.
max_replicas = 10
min_replicas = 1
custom_scale_rule {
name = "service-bus-queue-length-rule"
custom_rule_type = "azure-servicebus"
metadata = {
messageCount = 10
namespace = var.servicebus_namespace
queueName = var.email_request_queue_name
}
authentication {
secret_name = "azure-servicebus-connection-string"
trigger_parameter = "connection"
}
}
Conteinerizar a implantação de serviço
A conteinerização significa que todas as dependências para que o aplicativo funcione são encapsuladas em uma imagem leve que pode ser implantada de forma confiável em uma ampla variedade de hosts. Para conteinerizar a implantação, siga estas recomendações:
Identifique os limites do domínio. Comece identificando os limites de domínio em seu aplicativo monolítico. Isso ajuda a determinar quais partes do aplicativo você pode extrair em serviços separados.
Crie imagens do Docker. Ao criar imagens do Docker para seus serviços Java, use imagens base oficiais do OpenJDK. Essas imagens contêm apenas o conjunto mínimo de pacotes necessários para a execução do Java, o que minimiza o tamanho do pacote e a área da superfície de ataque.
Use Dockerfiles de vários estágios. Use um Dockerfiles de vários estágios para separar os ativos de tempo de compilação da imagem do contêiner de tempo de execução. Isso ajuda a manter suas imagens de produção pequenas e seguras. Você também pode usar um servidor de compilação pré-configurado e copiar o arquivo jar para a imagem do contêiner.
Execute como um usuário não root. Execute seus contêineres Java como um usuário não raiz (por meio do nome de usuário ou UID, $APP_UID) para se alinhar ao princípio do privilégio mínimo. Isso limita os efeitos possíveis de um contêiner comprometido.
Escute na porta 8080. Ao executar como um usuário não raiz, configure seu aplicativo para escutar na porta 8080. É uma convenção comum para usuários não raiz.
Encapsule dependências. Verifique se todas as dependências para que o aplicativo funcione estejam encapsuladas na imagem de contêiner do Docker. O encapsulamento permite que o aplicativo seja implantado de forma confiável em uma série de hosts.
Escolha as imagens de base certas. A imagem base escolhida depende do seu ambiente de implantação. Se você estiver implantando em Aplicativos de Contêiner, por exemplo, precisará usar imagens do Docker do Linux.
A implementação de referência demonstra um processo de construção do Docker para conteinerizar um aplicativo Java. Este Dockerfile usa uma compilação de estágio único com a imagem base do OpenJDK (mcr.microsoft.com/openjdk/jdk:17-ubuntu
), que fornece o ambiente de tempo de execução Java necessário.
O Dockerfile inclui as seguintes etapas:
- Declaração de volume: um volume temporário (
/tmp
) é definido, permitindo o armazenamento temporário de arquivos separado do sistema de arquivos principal do contêiner. - Copiando artefatos: o arquivo JAR do aplicativo (
email-processor.jar
) é copiado para o contêiner, juntamente com o agente do Application Insights (applicationinsights-agent.jar
) para monitoramento. - Definindo o ponto de entrada: o contêiner é configurado para executar o aplicativo com o agente do Application Insights habilitado, usando
java -javaagent
para monitorar o aplicativo durante o runtime.
Esse Dockerfile mantém a imagem enxuta incluindo apenas dependências de runtime, adequadas para ambientes de implantação como Aplicativos de Contêiner, que dão suporte a contêineres baseados em Linux.
# Use OpenJDK 17 base image on Ubuntu as the foundation
FROM mcr.microsoft.com/openjdk/jdk:17-ubuntu
# Define a volume to allow temporary files to be stored separately from the container's main file system
VOLUME /tmp
# Copy the packaged JAR file into the container
COPY target/email-processor.jar app.jar
# Copy the Application Insights agent for monitoring
COPY target/agent/applicationinsights-agent.jar applicationinsights-agent.jar
# Set the entry point to run the application with the Application Insights agent
ENTRYPOINT ["java", "-javaagent:applicationinsights-agent.jar", "-jar", "/app.jar"]
Implantar a implementação de referência
Implante a implementação de referência do Padrão de Aplicativo Web Moderno para Java. Há instruções para implantação de desenvolvimento e produção no repositório. Depois de implantar, você pode simular e observar padrões de design.
Figura 3: arquitetura da implementação de referência. Faça download de um Arquivo Visio dessa arquitetura.