Posicionamento de recursos do Kubernetes do cluster de hub para clusters de membros
Este artigo descreve o conceito de posicionamento de recursos do Kubernetes de clusters de hub para clusters de membros usando o Azure Kubernetes Fleet Manager (Kubernetes Fleet).
Os administradores de plataforma geralmente precisam implantar recursos do Kubernetes em vários clusters por vários motivos, por exemplo:
- Gerenciando o controle de acesso usando funções e associações de função em vários clusters.
- Executando aplicativos de infraestrutura, como Prometheus ou Flux, que precisam estar em todos os clusters.
Os desenvolvedores de aplicativos geralmente precisam implantar recursos do Kubernetes em vários clusters por vários motivos, por exemplo:
- Implantação de um aplicativo de veiculação de vídeo em vários clusters em diferentes regiões para uma experiência de visualização de baixa latência.
- Implantação de um aplicativo de carrinho de compras em duas regiões emparelhadas para que os clientes continuem a comprar durante uma única interrupção de região.
- Implantação de um aplicativo de computação em lote em clusters com pools de nós spot baratos disponíveis.
É tedioso criar, atualizar e rastrear esses recursos do Kubernetes em vários clusters manualmente. O Fleet fornece propagação de recursos do Kubernetes para permitir o gerenciamento em escala dos recursos do Kubernetes. Com o Kubernetes Fleet, você pode criar recursos do Kubernetes no cluster de hub e propagá-los para clusters de membros selecionados por meio dos Recursos personalizados do Kubernetes: MemberCluster
e ClusterResourcePlacement
.
O Kubernetes Fleet suporta esses recursos personalizados com base em uma solução nativa da nuvem de código aberto sobre a qual você pode ler mais na documentação de código aberto do Fleet.
Apresentando o ClusterResourcePlacement
Um ClusterResourcePlacement
objeto é usado para informar ao agendador de frota como colocar um determinado conjunto de objetos com escopo de cluster do cluster de hub de frota em clusters membros. Objetos com escopo de namespace como Deployments, StatefulSets, DaemonSets, ConfigMaps, Secrets e PersistentVolumeClaims são incluídos quando seu namespace que contém é selecionado.
Com ClusterResourcePlacement
o , você pode:
- Selecione quais recursos do Kubernetes com escopo de cluster serão propagados para clusters membros.
- Especifique políticas de posicionamento para selecionar manualmente ou automaticamente clusters de membros como clusters de destino.
- Especifique estratégias de distribuição para implementar com segurança quaisquer atualizações dos recursos selecionados do Kubernetes em vários clusters de destino.
- Visualize o progresso da propagação para cada cluster de destino.
Um exemplo é mostrado no diagrama a seguir.
Encapsulando recursos
ClusterResourcePlacement
suporta o uso do ConfigMap para envolver determinados tipos de recursos do Kubernetes para que eles possam ser preparados no cluster de hub sem quaisquer efeitos colaterais não intencionais no cluster de hub. Para obter uma lista de tipos de recursos e entender como esse recurso funciona, consulte nossa documentação de objeto de envelope
Tipos de colocação
Os seguintes tipos de posicionamento estão disponíveis para controlar o número de clusters para os quais um recurso Kubernetes especificado precisa ser propagado:
- PickFixed coloca o recurso em uma lista específica de clusters de membros por nome.
- PickAll coloca o recurso em todos os clusters de membros ou em todos os clusters de membros que atendem a um critério. Essa política é útil para colocar cargas de trabalho de infraestrutura, como monitoramento de cluster ou aplicativos de relatórios.
- O PickN é a opção de posicionamento mais flexível e permite a seleção de clusters com base em restrições de dispersão de afinidade ou topologia e é útil ao distribuir cargas de trabalho entre vários clusters apropriados para garantir que a disponibilidade seja desejada.
Tipo de posicionamento PickFixed
Se quiser implantar uma carga de trabalho em um conjunto conhecido de clusters membros, você pode usar uma PickFixed
política de posicionamento para selecionar os clusters pelo nome.
clusterNames
é a única opção de política válida para este tipo de posicionamento.
O exemplo a seguir mostra como implantar o test-deployment
namespace em clusters cluster1
de membros e cluster2
.
apiVersion: placement.kubernetes-fleet.io/v1
kind: ClusterResourcePlacement
metadata:
name: crp-fixed
spec:
policy:
placementType: PickFixed
clusterNames:
- cluster1
- cluster2
resourceSelectors:
- group: ""
kind: Namespace
name: test-deployment
version: v1
Tipo de posicionamento PickAll
Você pode usar um PickAll
tipo de posicionamento para implantar uma carga de trabalho em todos os clusters membros da frota ou em um subconjunto de clusters que correspondam aos critérios definidos.
Ao criar esse tipo de posicionamento, os seguintes tipos de afinidade de cluster podem ser especificados:
- requiredDuringSchedulingIgnoredDuringExecution: como essa política é necessária durante o agendamento, ela filtra os clusters com base nos critérios especificados.
O exemplo a seguir mostra como implantar um prod-deployment
namespace e todos os seus objetos em todos os clusters rotulados com environment: production
:
apiVersion: placement.kubernetes-fleet.io/v1
kind: ClusterResourcePlacement
metadata:
name: crp-pickall
spec:
policy:
placementType: PickAll
affinity:
clusterAffinity:
requiredDuringSchedulingIgnoredDuringExecution:
clusterSelectorTerms:
- labelSelector:
matchLabels:
environment: production
resourceSelectors:
- group: ""
kind: Namespace
name: prod-deployment
version: v1
Tipo de posicionamento PickN
O PickN
tipo de posicionamento é a opção mais flexível e permite a colocação de recursos em um número configurável de clusters com base em afinidades e restrições de dispersão de topologia.
Ao criar esse tipo de posicionamento, os seguintes tipos de afinidade de cluster podem ser especificados:
- requiredDuringSchedulingIgnoredDuringExecution: como essa política é necessária durante o agendamento, ela filtra os clusters com base nos critérios especificados.
- preferredDuringSchedulingIgnoredDuringExecution: como essa política é preferida, mas não é necessária durante o agendamento, ela classifica clusters com base em critérios especificados.
Você pode definir as afinidades necessárias e preferidas. As afinidades necessárias impedem a colocação em clusters que não correspondem, e as afinidades preferenciais fornecem a ordenação de clusters válidos.
PickN
com afinidades
O uso de afinidades com uma PickN
política de posicionamento funciona de forma semelhante ao uso de afinidades com o agendamento de pods.
O exemplo a seguir mostra como implantar uma carga de trabalho em três clusters. Apenas clusters com o critical-allowed: "true"
rótulo são destinos de posicionamento válidos, e é dada preferência aos clusters com o rótulo critical-level: 1
:
apiVersion: placement.kubernetes-fleet.io/v1
kind: ClusterResourcePlacement
metadata:
name: crp-pickn-01
spec:
resourceSelectors:
- ...
policy:
placementType: PickN
numberOfClusters: 3
affinity:
clusterAffinity:
preferredDuringSchedulingIgnoredDuringExecution:
weight: 20
preference:
- labelSelector:
matchLabels:
critical-level: 1
requiredDuringSchedulingIgnoredDuringExecution:
clusterSelectorTerms:
- labelSelector:
matchLabels:
critical-allowed: "true"
PickN
com restrições de propagação de topologia
Você pode usar restrições de dispersão de topologia para forçar a divisão dos posicionamentos de cluster entre limites de topologia para atender aos requisitos de disponibilidade. Por exemplo, use essas restrições para dividir posicionamentos entre regiões ou atualizar anéis. Você também pode configurar restrições de cobertura de topologia para evitar o agendamento se a restrição não puder ser atendida (whenUnsatisfiable: DoNotSchedule
) ou agendar da melhor forma possível (whenUnsatisfiable: ScheduleAnyway
).
O exemplo a seguir mostra como distribuir um determinado conjunto de recursos por várias regiões e tenta agendar entre clusters de membros com dias de atualização diferentes.
apiVersion: placement.kubernetes-fleet.io/v1
kind: ClusterResourcePlacement
metadata:
name: crp-pickn-02
spec:
resourceSelectors:
- ...
policy:
placementType: PickN
topologySpreadConstraints:
- maxSkew: 2
topologyKey: region
whenUnsatisfiable: DoNotSchedule
- maxSkew: 2
topologyKey: updateDay
whenUnsatisfiable: ScheduleAnyway
Para obter mais informações, consulte as restrições de dispersão da topologia da documentação de código aberto da frota.
Opções de política de posicionamento
A tabela resume os campos de política de agendamento disponíveis para cada tipo de posicionamento.
Domínio de intervenção | PickFixed | Escolher tudo | PickN |
---|---|---|---|
placementType |
✅ | ✅ | ✅ |
affinity |
❌ | ✅ | ✅ |
clusterNames |
✅ | ❌ | ❌ |
numberOfClusters |
❌ | ❌ | ✅ |
topologySpreadConstraints |
❌ | ❌ | ✅ |
Seleção de clusters com base em rótulos e propriedades
Rótulos e propriedades disponíveis para selecionar clusters
Ao usar os PickN
tipos e PickAll
de posicionamento, você pode usar os seguintes rótulos e propriedades como parte de suas políticas.
Etiquetas
Os rótulos a seguir são adicionados automaticamente a todos os clusters membros e podem ser usados para a seleção de clusters de destino em políticas de posicionamento de recursos.
Label | Description |
---|---|
fleet.azure.com/location | Azure Region do cluster (westus) |
fleet.azure.com/resource-group | Grupo de Recursos do Azure do cluster (rg_prodapps_01) |
fleet.azure.com/subscription-id | Identificador de Assinatura do Azure no qual o cluster reside. Formatado como UUID/GUID. |
Você também pode usar qualquer rótulo personalizado aplicado aos clusters.
Propriedades
As propriedades a seguir estão disponíveis para uso como parte das políticas de posicionamento.
As propriedades de CPU e memória são representadas como unidades de recursos do Kubernetes.
As propriedades de custo são decimais que representam um custo por hora em dólares americanos para a computação do Azure utilizada para nós dentro do cluster. O custo é baseado nos preços públicos do Azure.
Nome de Propriedade | Description |
---|---|
kubernetes-fleet.io/node-count | Nós disponíveis no cluster membro. |
resources.kubernetes-fleet.io/total-cpu | Total de unidades de recursos da CPU do cluster. |
resources.kubernetes-fleet.io/allocatable-cpu | Unidades de recursos de CPU alocáveis do cluster. |
resources.kubernetes-fleet.io/available-cpu | Unidades de recursos de CPU disponíveis do cluster. |
resources.kubernetes-fleet.io/total-memory | Unidade de recurso de memória total do cluster. |
resources.kubernetes-fleet.io/allocatable-memory | Unidades de recursos de memória alocáveis do cluster. |
resources.kubernetes-fleet.io/available-memory | Unidades de recursos de memória disponíveis do cluster. |
kubernetes.azure.com/per-cpu-core-cost | O custo principal por CPU do cluster. |
kubernetes.azure.com/per-gb-memory-cost | O custo de memória por GiB do cluster. |
Especificar critérios de correspondência de seleção
Ao usar propriedades de cluster em um critério de política, você especifica:
Nome: Nome da propriedade, que é uma das propriedades listadas em propriedades neste artigo.
Operador: um operador usado para expressar a condição entre a restrição/valor desejado e o valor observado no cluster. Os seguintes operadores são atualmente suportados:
Gt
(Maior que): o valor observado de um cluster da propriedade dada deve ser maior do que o valor na condição antes que ele possa ser selecionado para o posicionamento do recurso.Ge
(Maior ou igual a): o valor observado de um cluster da propriedade dada deve ser maior ou igual ao valor na condição antes que ele possa ser escolhido para o posicionamento do recurso.Lt
(Menor que): o valor observado de um cluster da propriedade dada deve ser menor do que o valor na condição antes que ele possa ser escolhido para o posicionamento do recurso.Le
(Menor ou igual a): o valor observado de um cluster da propriedade dada deve ser menor ou igual ao valor na condição antes que ele possa ser selecionado para o posicionamento do recurso.Eq
(Igual a): o valor observado de um cluster da propriedade dada deve ser igual ao valor na condição antes que ele possa ser escolhido para o posicionamento do recurso.Ne
(Não igual a): o valor observado de um cluster da propriedade dada não deve ser igual ao valor na condição antes de poder ser escolhido para o posicionamento do recurso.
Se você usar o operador
Gt
,Ge
, ,Lt
,Eq
Le
, ou , aNe
lista de valores na condição deve ter exatamente um valor.Valores: Uma lista de valores, que são valores possíveis da propriedade.
O Fleet avalia cada cluster com base nas propriedades especificadas na condição. O não cumprimento das condições listadas em requiredDuringSchedulingIgnoredDuringExecution
exclui este cluster membro da colocação de recursos.
Nota
Se um cluster membro não possuir a propriedade expressa na condição, ele falhará automaticamente na condição.
Veja um exemplo de política de posicionamento para selecionar apenas clusters com cinco ou mais nós.
apiVersion: placement.kubernetes-fleet.io/v1
kind: ClusterResourcePlacement
metadata:
name: crp
spec:
resourceSelectors:
- ...
policy:
placementType: PickAll
affinity:
clusterAffinity:
requiredDuringSchedulingIgnoredDuringExecution:
clusterSelectorTerms:
- propertySelector:
matchExpressions:
- name: "kubernetes-fleet.io/node-count"
operator: Ge
values:
- "5"
Como funciona a classificação de propriedades
Quando preferredDuringSchedulingIgnoredDuringExecution
é usado, um classificador de propriedades classifica todos os clusters da frota com base em seus valores em ordem crescente ou decrescente. Os pesos utilizados para encomendar são calculados com base no valor especificado.
Um classificador de propriedades consiste em:
- Nome: Nome da propriedade do cluster.
- Ordem de classificação: A ordem de classificação pode ser uma ou
Ascending
Descending
. QuandoAscending
a ordem é usada, agrupamentos de membros com valores observados mais baixos são preferidos. QuandoDescending
a ordem é usada, agrupamentos de membros com maior valor observado são preferidos.
Ordem decrescente
Para a ordem de classificação Decrescente, o peso proporcional é calculado usando a fórmula:
((Observed Value - Minimum observed value) / (Maximum observed value - Minimum observed value)) * Weight
Por exemplo, digamos que você queira classificar clusters com base na propriedade de capacidade de CPU disponível em ordem decrescente e que tenha uma frota de três clusters com a seguinte CPU disponível:
Cluster | Capacidade de CPU disponível |
---|---|
cluster-a |
100 |
cluster-b |
20 |
cluster-c |
10 |
Neste caso, o classificador calcula os seguintes pesos:
Cluster | Capacidade de CPU disponível | Cálculo | Espessura |
---|---|---|---|
cluster-a |
100 | (100 - 10) / (100 - 10) | 100% |
cluster-b |
20 | (20 - 10) / (100 - 10) | 11.11% |
cluster-c |
10 | (10 - 10) / (100 - 10) | 0% |
Ordem crescente
Para a ordem de classificação Crescente, o peso proporcional é calculado usando a fórmula:
(1 - ((Observed Value - Minimum observed value) / (Maximum observed value - Minimum observed value))) * Weight
Por exemplo, digamos que você queira classificar clusters com base em seu custo por núcleo de CPU em ordem crescente e que tenha uma frota de três clusters com os seguintes custos principais de CPU:
Cluster | Custo de núcleo por CPU |
---|---|
cluster-a |
1 |
cluster-b |
0.2 |
cluster-c |
0.1 |
Neste caso, o classificador calcula os seguintes pesos:
Cluster | Custo de núcleo por CPU | Cálculo | Espessura |
---|---|---|---|
cluster-a |
1 | 1 - ((1 - 0.1) / (1 - 0.1)) | 0% |
cluster-b |
0.2 | 1 - ((0.2 - 0.1) / (1 - 0.1)) | 88.89% |
cluster-c |
0.1 | 1 - (0.1 - 0.1) / (1 - 0.1) | 100% |
Usando tolerações
ClusterResourcePlacement
Os objetos suportam a especificação de tolerâncias, que se aplicam ao ClusterResourcePlacement
objeto. Cada objeto de tolerância consiste nos seguintes campos:
key
: A chave da tolerância.value
: O valor da tolerância.effect
: O efeito da tolerância, comoNoSchedule
.operator
: O operador da tolerância, comoExists
ouEqual
.
Cada tolerância é usada para tolerar uma ou mais manchas específicas aplicadas no ClusterResourcePlacement
. Depois que todas as manchas em um MemberCluster
são toleradas, o agendador pode propagar recursos para o cluster. Não é possível atualizar ou remover tolerações de um ClusterResourcePlacement
objeto depois de criado.
Para obter mais informações, consulte a documentação de código aberto do Fleet sobre tolerações.
Configurando a estratégia de distribuição
O Fleet usa uma estratégia de atualização contínua para controlar como as atualizações são implementadas em clusters.
No exemplo a seguir, o agendador de frota distribui atualizações para cada cluster sequencialmente, aguardando pelo menos unavailablePeriodSeconds
entre clusters. O status de distribuição é considerado bem-sucedido se todos os recursos tiverem sido aplicados corretamente ao cluster. A verificação de status da distribuição não ocorre em cascata para recursos filho, portanto, por exemplo, não confirma se os pods criados por uma implantação ficam prontos.
apiVersion: placement.kubernetes-fleet.io/v1
kind: ClusterResourcePlacement
metadata:
name: crp
spec:
resourceSelectors:
- ...
policy:
...
strategy:
type: RollingUpdate
rollingUpdate:
maxUnavailable: 25%
maxSurge: 25%
unavailablePeriodSeconds: 60
Para obter mais informações, consulte a documentação de código aberto do Fleet sobre a estratégia de implantação.
Determinar o status do posicionamento
O Agendador de frota atualiza os detalhes e o status das decisões de posicionamento no ClusterResourcePlacement
objeto. A saída inclui as seguintes informações:
- As condições que atualmente se aplicam à colocação, que incluem se a colocação foi concluída com sucesso.
- Uma seção de status de posicionamento para cada cluster membro, que mostra o status da implantação nesse cluster.
O exemplo a seguir mostra um ClusterResourcePlacement
que implantou o test
namespace e o test-1
ConfigMap em dois clusters membros usando PickN
. A colocação foi concluída com sucesso e os recursos foram colocados nos aks-member-1
aks-member-2
e clusters.
Você pode exibir essas informações usando o kubectl describe crp <name>
comando.
kubectl describe crp crp-1
Name: crp-1
Namespace:
Labels: <none>
Annotations: <none>
API Version: placement.kubernetes-fleet.io/v1
Kind: ClusterResourcePlacement
Metadata:
...
Spec:
Policy:
Number Of Clusters: 2
Placement Type: PickN
Resource Selectors:
Group:
Kind: Namespace
Name: test
Version: v1
Revision History Limit: 10
Status:
Conditions:
Last Transition Time: 2023-11-10T08:14:52Z
Message: found all the clusters needed as specified by the scheduling policy
Observed Generation: 5
Reason: SchedulingPolicyFulfilled
Status: True
Type: ClusterResourcePlacementScheduled
Last Transition Time: 2023-11-10T08:23:43Z
Message: All 2 cluster(s) are synchronized to the latest resources on the hub cluster
Observed Generation: 5
Reason: SynchronizeSucceeded
Status: True
Type: ClusterResourcePlacementSynchronized
Last Transition Time: 2023-11-10T08:23:43Z
Message: Successfully applied resources to 2 member clusters
Observed Generation: 5
Reason: ApplySucceeded
Status: True
Type: ClusterResourcePlacementApplied
Placement Statuses:
Cluster Name: aks-member-1
Conditions:
Last Transition Time: 2023-11-10T08:14:52Z
Message: Successfully scheduled resources for placement in aks-member-1 (affinity score: 0, topology spread score: 0): picked by scheduling policy
Observed Generation: 5
Reason: ScheduleSucceeded
Status: True
Type: ResourceScheduled
Last Transition Time: 2023-11-10T08:23:43Z
Message: Successfully Synchronized work(s) for placement
Observed Generation: 5
Reason: WorkSynchronizeSucceeded
Status: True
Type: WorkSynchronized
Last Transition Time: 2023-11-10T08:23:43Z
Message: Successfully applied resources
Observed Generation: 5
Reason: ApplySucceeded
Status: True
Type: ResourceApplied
Cluster Name: aks-member-2
Conditions:
Last Transition Time: 2023-11-10T08:14:52Z
Message: Successfully scheduled resources for placement in aks-member-2 (affinity score: 0, topology spread score: 0): picked by scheduling policy
Observed Generation: 5
Reason: ScheduleSucceeded
Status: True
Type: ResourceScheduled
Last Transition Time: 2023-11-10T08:23:43Z
Message: Successfully Synchronized work(s) for placement
Observed Generation: 5
Reason: WorkSynchronizeSucceeded
Status: True
Type: WorkSynchronized
Last Transition Time: 2023-11-10T08:23:43Z
Message: Successfully applied resources
Observed Generation: 5
Reason: ApplySucceeded
Status: True
Type: ResourceApplied
Selected Resources:
Kind: Namespace
Name: test
Version: v1
Kind: ConfigMap
Name: test-1
Namespace: test
Version: v1
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal PlacementScheduleSuccess 12m (x5 over 3d22h) cluster-resource-placement-controller Successfully scheduled the placement
Normal PlacementSyncSuccess 3m28s (x7 over 3d22h) cluster-resource-placement-controller Successfully synchronized the placement
Normal PlacementRolloutCompleted 3m28s (x7 over 3d22h) cluster-resource-placement-controller Resources have been applied to the selected clusters
Gatilhos de mudança de posicionamento
O agendador de frota prioriza a estabilidade dos posicionamentos de carga de trabalho existentes. Essa priorização pode limitar o número de alterações que fazem com que uma carga de trabalho seja removida e reagendada. Os cenários a seguir podem desencadear alterações de posicionamento:
- As alterações na política de posicionamento no objeto podem desencadear a remoção e o
ClusterResourcePlacement
reagendamento de uma carga de trabalho.- As operações de expansão (aumentando
numberOfClusters
sem outras alterações) colocam cargas de trabalho apenas em novos clusters e não afetam os posicionamentos existentes.
- As operações de expansão (aumentando
- Alterações de cluster, incluindo:
- Um novo cluster que se torna elegível pode acionar o posicionamento se o novo cluster atender à política de posicionamento, por exemplo, uma
PickAll
política. - Um cluster com um posicionamento é removido da frota. Dependendo da política, o agendador tenta colocar todas as cargas de trabalho afetadas em clusters restantes sem afetar os posicionamentos existentes.
- Um novo cluster que se torna elegível pode acionar o posicionamento se o novo cluster atender à política de posicionamento, por exemplo, uma
As alterações somente de recursos (atualizar os recursos ou atualizar o ResourceSelector
ClusterResourcePlacement
no objeto) são implantadas gradualmente em posicionamentos existentes, mas não acionam o reagendamento da carga de trabalho.
Próximos passos
Azure Kubernetes Service