Substituições de amostragem (versão prévia) – Azure Monitor Application Insights para Java
Observação
O recurso de substituição de amostragem está no GA, a partir da versão 3.5.0.
As substituições de amostragem permitem que você substitua a porcentagem de amostragem padrão, por exemplo:
- Defina o percentual de amostragem como 0 (ou algum valor pequeno) para verificações de integridade com ruídos.
- Defina o percentual de amostragem como 0 (ou algum valor pequeno) para chamadas de dependência com ruídos.
- Defina o percentual de amostragem como 100 para um tipo de solicitação importante (por exemplo,
/login
), mesmo que você tenha a amostragem padrão configurada com um valor menor.
Terminologia
Antes de aprender sobre as substituições de amostragem, você deve entender o termo span. Span é um termo geral para:
- Uma solicitação de entrada.
- Uma dependência de saída (por exemplo, uma chamada remota para outro serviço).
- Uma dependência em processo (por exemplo, trabalho sendo feito por subcomponentes do serviço).
Para substituições de amostragem, esses componentes de span são importantes:
- Atributos
Atributos de span representam propriedades padrão e personalizadas de uma determinada solicitação ou dependência.
Introdução
Para começar, crie um arquivo de configuração chamado applicationinsights.jsem. Salve-o no mesmo diretório que applicationinsights-agent-*.jar. Use o modelo a seguir.
{
"connectionString": "...",
"sampling": {
"percentage": 10,
"overrides": [
{
"telemetryType": "request",
"attributes": [
...
],
"percentage": 0
},
{
"telemetryType": "request",
"attributes": [
...
],
"percentage": 100
}
]
}
}
Como ele funciona
telemetryType
(telemetryKind
no Application Insights 3.4.0) deve ser um de request
, dependency
, trace
(log) ou exception
.
Quando um span é iniciado, o tipo de span e os atributos presentes são usados para verificar se há correspondência de alguma das substituições de amostragem.
As correspondências podem ser strict
ou regexp
. Correspondências de expressão regular são executadas com base no valor do atributo inteiro, portanto, se você quiser corresponder a um valor que contenha abc
em qualquer lugar, use .*abc.*
.
Uma substituição de amostragem pode especificar vários critérios de atributo, nesse caso, todos eles precisam corresponder para que a substituição de amostragem corresponda.
Se houver correspondência de uma das substituições de amostragem, o percentual de amostragem será usado para decidir se o span deve ser amostrado ou não.
Somente a primeira substituição de amostragem que corresponde é usada.
Se nenhuma substituição de amostragem corresponder:
- Se esse for o primeiro span no rastreamento, a configuração de amostragem de nível superior será usada.
- Caso não seja o primeiro span no rastreamento, então a decisão de amostragem pai será usada.
Exemplo: suprimir coleta de telemetria para verificações de integridade
Esse exemplo suprime a coleta de telemetria para todas as solicitações de /health-checks
.
Esse exemplo também suprime a coleta de todos os spans downstream (dependências) que normalmente seriam coletados como /health-checks
.
{
"connectionString": "...",
"sampling": {
"overrides": [
{
"telemetryType": "request",
"attributes": [
{
"key": "url.path",
"value": "/health-check",
"matchType": "strict"
}
],
"percentage": 0
}
]
}
}
Exemplo: suprimir coleta de telemetria para uma chamada de dependência com ruídos
Esse exemplo suprime a coleta de telemetria para todas as chamadas GET my-noisy-key
do Redis.
{
"connectionString": "...",
"sampling": {
"overrides": [
{
"telemetryType": "dependency",
"attributes": [
{
"key": "db.system",
"value": "redis",
"matchType": "strict"
},
{
"key": "db.statement",
"value": "GET my-noisy-key",
"matchType": "strict"
}
],
"percentage": 0
}
]
}
}
Exemplo: coletar 100% da telemetria para um tipo de solicitação importante
Esse exemplo coleta 100% de telemetria para o /login
.
Como os spans downstream (dependências) respeitam a decisão de amostragem do pai (na ausência de qualquer substituição de amostragem para esse span downstream), eles também serão coletados para todas as solicitações "/login".
{
"connectionString": "...",
"sampling": {
"percentage": 10
},
"sampling": {
"overrides": [
{
"telemetryType": "request",
"attributes": [
{
"key": "url.path",
"value": "/login",
"matchType": "strict"
}
],
"percentage": 100
}
]
}
}
Atributos de span disponíveis para amostragem
Os nomes de atributo de span têm base nas convenções semânticas do OpenTelemetry. (HTTP, Mensagens, Banco de Dados, RPC)
https://github.com/open-telemetry/semantic-conventions/blob/main/docs/README.md
Observação
Para ver o conjunto exato de atributos capturados pelo Java do Application Insights para seu aplicativo, defina o nível de autodiagnóstico como depuração e procure mensagens de depuração que comecem com o texto "exportando span".
Observação
Somente os atributos definidos no início do intervalo estão disponíveis para amostragem. Portanto, atributos como http.response.status_code
ou duração da solicitação, que são capturados posteriormente, podem ser filtrados através das extensões Java OpenTelemetry. Aqui está uma extensão de exemplo que filtra intervalos com base na duração da solicitação.
Exemplo: expor atributos de intervalo para suprimir chamadas de dependência de SQL
Este exemplo explica a experiência de localizar atributos disponíveis para suprimir chamadas SQL com ruído. A consulta abaixo ilustra as diferentes chamadas SQL e contagens de registros associados nos últimos 30 dias:
dependencies
| where timestamp > ago(30d)
| where name == 'SQL: DB Query'
| summarize count() by name, operation_Name, data
| sort by count_ desc
SQL: DB Query POST /Order DECLARE @MyVar varbinary(20); SET @MyVar = CONVERT(VARBINARY(20), 'Hello World');SET CONTEXT_INFO @MyVar; 36712549
SQL: DB Query POST /Receipt DECLARE @MyVar varbinary(20); SET @MyVar = CONVERT(VARBINARY(20), 'Hello World');SET CONTEXT_INFO @MyVar; 2220248
SQL: DB Query POST /CheckOutForm DECLARE @MyVar varbinary(20); SET @MyVar = CONVERT(VARBINARY(20), 'Hello World');SET CONTEXT_INFO @MyVar; 554074
SQL: DB Query GET /ClientInfo DECLARE @MyVar varbinary(20); SET @MyVar = CONVERT(VARBINARY(20), 'Hello World');SET CONTEXT_INFO @MyVar; 37064
Nos resultados acima, pode-se observar que todas as operações compartilham o mesmo valor no campo data
: DECLARE @MyVar varbinary(20); SET @MyVar = CONVERT(VARBINARY(20), 'Hello World');SET CONTEXT_INFO @MyVar;
. A convergência entre todos esses registros torna-se um bom candidato para uma substituição de amostragem.
Ao definir o autodiagnóstico para depuração, as seguintes entradas de log ficarão visíveis na saída:
2023-10-26 15:48:25.407-04:00 DEBUG c.m.a.a.i.exporter.AgentSpanExporter - exporting span: SpanData{spanContext=ImmutableSpanContext...
A área de interesse desses logs é a seção "atributos":
{
"attributes": {
"data": {
"thread.name": "DefaultDatabaseBroadcastTransport: MessageReader thread",
"thread.id": 96,
"db.connection_string": "apache:",
"db.statement": "DECLARE @MyVar varbinary(20); SET @MyVar = CONVERT(VARBINARY(20), 'Hello World');SET CONTEXT_INFO @MyVar;",
"db.system": "other_sql",
"applicationinsights.internal.item_count": 1
}
}
}
Usando essa saída, você pode configurar uma substituição de amostragem semelhante à mostrada abaixo que filtrará nossas chamadas SQL com ruído:
{
"connectionString": "...",
"preview": {
"sampling": {
"overrides": [
{
"telemetryType": "dependency",
"attributes": [
{
"key": "db.statement",
"value": "DECLARE @MyVar varbinary(20); SET @MyVar = CONVERT(VARBINARY(20), 'Hello World');SET CONTEXT_INFO @MyVar;",
"matchType": "strict"
}
],
"percentage": 0
}
]
}
}
}
Depois que as alterações são aplicadas, a seguinte consulta nos permite determinar a última vez que essas dependências foram ingeridas no Application Insights:
dependencies
| where timestamp > ago(30d)
| where data contains 'DECLARE @MyVar'
| summarize max(timestamp) by data
| sort by max_timestamp desc
DECLARE @MyVar varbinary(20); SET @MyVar = CONVERT(VARBINARY(20), 'Hello World');SET CONTEXT_INFO @MyVar; 11/13/2023 8:52:41 PM
Solução de problemas
Se você usar regexp
e a substituição de amostragem não funcionar, tente com a expressão regular .*
. Se a amostragem funcionar agora, isso significa que você tem um problema com a primeira expressão regular e deve ler essa documentação sobre expressões regulares.
Se isso não funcionar com .*
, você poderá ter um problema de sintaxe em seu application-insights.json file
. Examine os logs do Application Insights e veja se existem mensagens de aviso.