Compartilhar via


Como rastrear seu aplicativo com o SDK de Inferência da IA do Azure

Importante

Os itens marcados (versão prévia) neste artigo estão atualmente em versão prévia pública. Essa versão prévia é fornecida sem um contrato de nível de serviço e não recomendamos isso para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou podem ter restrição de recursos. Para obter mais informações, consulte Termos de Uso Complementares de Versões Prévias do Microsoft Azure.

Neste artigo, você aprenderá a rastrear seu aplicativo com o SDK de Inferência da IA do Azure, podendo escolher entre usar Python, JavaScript ou C#. A biblioteca de clientes de Inferência da IA do Azure dá suporte ao rastreamento com OpenTelemetry.

Habilitar rastreamento em seu aplicativo

Pré-requisitos

Instalação

Instale o pacote azure-ai-inference usando seu gerenciador de pacotes, como o pip:

  pip install azure-ai-inference[opentelemetry] 

Instale o plug-in Azure Core OpenTelemetry Tracing, o OpenTelemetry e o exportador OTLP para enviar telemetria ao back-end de observabilidade. Para instalar os pacotes necessários para Python, use os seguintes comandos pip:

pip install opentelemetry 

pip install opentelemetry-exporter-otlp 

Para saber mais sobre o SDK de Inferência da IA do Azure para Python e observabilidade, confira Rastreamento via SDK de Inferência para Python.

Para saber mais, confira a Referência do SDK de Inferência.

Configuração

Você precisa adicionar as seguintes configurações de acordo com o caso de uso:

  • Para capturar o conteúdo de prompt e conclusão, defina a variável de ambiente AZURE_TRACING_GEN_AI_CONTENT_RECORDING_ENABLED como true (não diferencia maiúsculas de minúsculas). Por padrão, prompts, conclusões, nomes de função, parâmetros e saídas não são registrados.

  • Para habilitar o rastreamento do SDK do Azure, defina a variável de ambiente AZURE_SDK_TRACING_IMPLEMENTATION como opentelemetry. Como alternativa, você pode configurá-lo no código com o seguinte snippet:

    from azure.core.settings import settings 
    
    settings.tracing_implementation = "opentelemetry" 
    

    Para saber mais, confira Biblioteca de clientes OpenTelemetry de Rastreamento do Azure Core para Python.

Habilitar a instrumentação

A etapa final é habilitar a instrumentação da Inferência da IA do Azure com o seguinte snippet de código:

from azure.ai.inference.tracing import AIInferenceInstrumentor 

# Instrument AI Inference API 

AIInferenceInstrumentor().instrument() 

Também é possível desfazer a instrumentação da API de Inferência da IA do Azure usando a chamada uninstrument. Após essa chamada, os rastreamentos deixarão de ser emitidos pela API de Inferência da IA do Azure até que o instrumento seja chamado novamente:

AIInferenceInstrumentor().uninstrument() 

Rastreamento de suas funções

Para rastrear suas funções personalizadas, você pode aproveitar o OpenTelemetry. Você precisará instrumentar o código com o SDK do OpenTelemetry. Isso envolve a configuração de um provedor de rastreamento e a criação de intervalos em torno do código que você deseja rastrear. Cada intervalo representa uma unidade de trabalho e pode ser aninhada de modo a formar uma árvore de rastreamento. Você pode adicionar atributos a intervalos para enriquecer os dados de rastreamento com contexto adicional. Após a instrumentação, configure um exportador para enviar os dados de rastreamento para um back-end para análise e visualização. Para obter instruções detalhadas e informações sobre o uso avançado, confira a documentação do OpenTelemetry. Isso ajudará você a monitorar o desempenho de suas funções personalizadas e obter insights sobre a execução.

Anexar comentários do usuário a rastreamentos

Para anexar os comentários do usuário a rastreamentos e visualizá-los no portal do Azure AI Foundry usando as convenções semânticas do OpenTelemetry, você pode instrumentar seu aplicativo habilitando o rastreamento e o registro de comentários do usuário. Ao correlacionar traces de comentários com seus respectivos rastreamentos de solicitação de chat usando a ID de resposta, você pode visualizar e gerenciar esses traces no portal do Azure AI Foundry. A especificação do OpenTelemetry permite dados de rastreamento padronizados e avançados, que podem ser analisados no portal do Azure AI Foundry para otimização de desempenho e insights sobre a experiência do usuário. Essa abordagem ajuda você a usar toda a potência do OpenTelemetry para ter maior observabilidade em seus aplicativos.

  • Exemplos de Python contendo código Python totalmente executável para rastreamento usando clientes síncronos e assíncronos.
  • Exemplos de JavaScript contendo código JavaScript totalmente executável para rastreamento usando clientes síncronos e assíncronos.
  • Exemplos de C# contendo código C# totalmente executável para fazer inferência usando métodos síncronos e assíncronos.