Uso de atributos utilizando etiquetas
Este artigo explica como usar tags personalizadas e padrão para atribuir cargas de trabalho a espaços de trabalho, equipes, projetos e usuários específicos.
Para monitorar o custo e atribuir com precisão o uso do Azure Databricks às unidades de negócios e às equipes da sua organização (para estornos, por exemplo), você pode marcar workspaces (grupos de recursos) e recursos de computação. Essas marcas são propagadas para relatórios detalhados de análise de custo que você pode acessar no portal do Azure. Observação: os dados da tag podem ser replicados globalmente. Não use nomes ou valores de marca que possam comprometer a segurança de seus recursos. como informações pessoais ou confidenciais.
Este é um relatório de detalhes da fatura de análise de custo no portal do Azure que detalha o custo por marca clusterid
em um período de um mês:
Objetos e recursos marcados
Objeto | Interface do usuário de marcação | Interface de marcação (API) |
---|---|---|
Workspace | Portal do Azure | API de Recursos do Azure |
pool | Interface do usuário de pools no workspace do Azure Databricks | API do Pool de Instâncias |
Computação de trabalho e para todos os fins | Interface do usuário de computação no workspace do Azure Databricks | API de Clusters |
SQL warehouse | Interface do usuário do SQL warehouse no workspace do Azure Databricks | API de warehouses |
Aviso
Não atribua uma marca personalizada com a chave Name
a um cluster. Cada cluster tem uma marca Name
cujo valor é definido pelo Azure Databricks. Se você alterar o valor associado à chave Name
, o cluster não poderá mais ser acompanhado pelo Azure Databricks. Como consequência, o cluster pode não ser encerrado depois de ficar ocioso e continuará a incorrer em custos de uso.
Marcas padrão
O Azure Databricks adiciona as seguintes marcas padrão à computação para todas as finalidades:
Chave de marca | Valor |
---|---|
Vendor |
Valor constante: Databricks |
ClusterId |
ID interna do Azure Databricks do cluster |
ClusterName |
Nome do cluster |
Creator |
Nome de usuário (endereço de email) do usuário que criou o cluster |
Em clusters de trabalho, o Azure Databricks também aplica as seguintes marcas padrão:
Chave de marca | Valor |
---|---|
RunName |
Nome do trabalho |
JobId |
ID do Trabalho |
O Azure Databricks adiciona as seguintes marcas padrão a todos os pools:
Chave de marca | Valor |
---|---|
Vendor |
Valor constante: Databricks |
DatabricksInstancePoolCreatorId |
ID interna do Azure Databricks do usuário que criou o pool |
DatabricksInstancePoolId |
ID interna do Azure Databricks do pool |
Na computação usada pelo Lakehouse Monitoring, o Azure Databricks também aplica as seguintes marcas:
Chave de marca | Valor |
---|---|
LakehouseMonitoring |
true |
LakehouseMonitoringTableId |
ID da tabela monitorada |
LakehouseMonitoringWorkspaceId |
ID do workspace em que o monitor foi criado |
LakehouseMonitoringMetastoreId |
ID do metastore em que a tabela monitorada existe |
Marcar cargas de trabalho de computação sem servidor
Importante
Esse recurso está em uma versão prévia.
Para atribuir o uso de computação sem servidor a usuários, grupos ou projetos, você pode usar políticas de orçamento. Quando um usuário recebe uma política de orçamento, o uso sem servidor é marcado automaticamente com as tags da política. Consulte Atribua o uso sem servidor com políticas de orçamento.
Propagação de marcas
As marcas de workspace, pool e cluster são agregadas pelo Azure Databricks e propagadas para VMs do Azure para relatórios de análise de custo. Mas as marcas do pool e do cluster são propagadas de forma diferente.
As marcas de pool e workspace são agregadas e atribuídas como marcas de recurso das VMs do Azure que hospedam os pools.
As marcas de cluster e workspace são agregadas e atribuídas como marcas de recurso das VMs do Azure que hospedam os clusters.
Quando os clusters são criados com base nos pools, somente as marcas de workspace e as marcas de pool são propagadas para as VMs. As marcas de cluster não são propagadas para preservar o desempenho de inicialização do cluster de pool.
Resolução de conflitos de marcas
Se uma marca personalizada de cluster, de pool ou de workspace tiver o mesmo nome de uma marca padrão de cluster ou de pool do Azure Databricks, a marca personalizada será prefixada com um x_
quando for propagada.
Por exemplo, se um workspace for marcado com vendor = Azure Databricks
, essa marca estará em conflito com a marca de cluster padrão vendor = Databricks
. Portanto, as marcas serão propagadas como x_vendor = Azure Databricks
e vendor = Databricks
.
Limitações
- Pode levar até uma hora para que as marcas de workspace personalizadas sejam propagadas para o Azure Databricks após qualquer alteração.
- No máximo, 50 marcas podem ser atribuídas a um recurso do Azure. Se a contagem geral de marcas agregadas exceder esse limite, as marcas prefixadas com
x_
serão avaliadas em ordem alfabética e aquelas que excederem o limite serão ignoradas. Se todas as marcas prefixadas comx_
forem ignoradas e a contagem estiver acima do limite, as marcas restantes serão avaliadas em ordem alfabética e aquelas que excederem o limite serão ignoradas. - As chaves e valores de tag só podem conter letras, espaços, números ou os caracteres
+
,-
,=
,.
_
,:
, ,/
, .@
As tags que contêm outros caracteres são inválidas. - Se você alterar os nomes ou os valores de chave de marca, essas alterações serão aplicadas somente após a reinicialização do cluster ou a expansão do pool.
- Se as marcas personalizadas do cluster entrarem em conflito com as marcas personalizadas de um pool, o cluster não poderá ser criado.
- As marcas de workspace recém-adicionadas não são automaticamente propagadas para os recursos de computação existentes. Para fazer com que as novas marcas sejam propagadas, abra a página de detalhes do recurso de computação, selecione Editar e depois Confirmar e reiniciar.
Marcando práticas recomendadas
- Como as etiquetas podem ser inseridas manualmente, sua organização deve padronizar os pares de chave-valor. O Databricks recomenda o desenvolvimento de uma política de negócios para nomenclatura de chave e valor que você pode compartilhar com todos os usuários.
- Todos os recursos devem ser marcados com chaves gerais que atribuam o uso a uma unidade de negócios ou projeto. Por exemplo, um recurso computacional de trabalho criado pela equipe de finanças para seu orçamento anual pode incluir as tags
business-unit:finance
eproject:annual-budget
. - Para obter insights mais granulares, atribua marcas usando chaves de alta especificidade. Por exemplo, você pode criar chaves com base em funções, produtos, serviços ou clientes.
- Quando aplicável, os administradores do workspace devem aplicar tags usando políticas de computação e políticas de orçamento. Confira Imposição de marca personalizada.