Recomendações de gerenciamento para cargas de trabalho de IA no Azure
Este artigo oferece recomendações de gerenciamento para organizações que executam cargas de trabalho de IA no Azure. Ele se concentra em soluções de plataforma como serviço (PaaS) de IA do Azure, incluindo Azure AI Foundry, Azure OpenAI, Azure Machine Learning e Azure AI Services. Abrange cargas de trabalho de IA generativas e não generativas.
O gerenciamento eficaz de cargas de trabalho de IA no Azure envolve a supervisão da implantação, do desempenho do modelo, das operações, dos dados e da recuperação de desastres para dar suporte às suas cargas de trabalho de IA. O gerenciamento adequado ajuda a garantir que as cargas de trabalho de IA sejam confiáveis, confiáveis e seguras durante todo o seu ciclo de vida.
Gerenciar implantações de IA
O gerenciamento de implantações de IA ajuda as equipes de carga de trabalho a passar de estágios de prova de conceito para ambientes de produção com configurações consistentes que melhoram a segurança e a conformidade entre as equipes. O Azure oferece ferramentas como o Azure AI Foundry hubs e projetos para reforçar a governança e a segurança. O Azure Machine Learning tem recursos semelhantes com seus espaços de trabalho de hub. Para obter mais informações, consulte Gerenciar implantações de IA.
Gerir modelos de IA
O gerenciamento de modelos de IA inclui o monitoramento de suas saídas, desempenho e alinhamento com os princípios de IA responsável. Os modelos de IA podem se desviar ao longo do tempo devido à mudança de dados, comportamentos do usuário ou outros fatores externos. Estas alterações podem conduzir a resultados imprecisos ou a preocupações éticas se não forem abordadas.
Monitore as saídas do modelo. Implemente um processo de monitoramento e teste para garantir que essas cargas de trabalho permaneçam alinhadas com seus alvos de IA responsáveis.
Monitore a IA generativa. Para cargas de trabalho de IA generativas, use os de avaliação de
internos do Azure AI Foundry e recursos manuais de monitoramento de . Se você estiver usando o fluxo de prompt, monitore as implantações de fluxo de prompt. Considere também o uso de ferramentas de IA responsáveis para complementar o monitoramento de modelos.Monitore a IA não generativa. Para cargas de trabalho de IA não generativas, monitore os estágios de processamento de dados e as métricas de desempenho do modelo para garantir que as previsões permaneçam precisas e confiáveis. Habilite o monitoramento de modelo no Azure Machine Learning. Para serviços de IA do Azure, habilite o monitoramento para cada serviço de IA que você usa.
Monitore o desempenho do modelo. Quando uma queda no desempenho ou na precisão é detetada, o monitoramento ajuda a identificar a origem do problema. Como em todas as cargas de trabalho, use o Azure Monitor e o Application Insights para monitorar o desempenho de cargas de trabalho de IA.
Monitore o desempenho da IA generativa. Na IA generativa, monitore a latência nos tempos de resposta ou a precisão dos resultados de pesquisa vetorial para melhorar as experiências do usuário. No Azure AI Foundry, habilitar o rastreamento que recolhe dados de rastreamento para cada solicitação, as métricas agregadas e comentários de utilizador.
Monitore o desempenho da IA não generativa. Capture métricas de desempenho de modelos implantados no Azure Machine Learning. Para serviços de IA do Azure, habilite o log de diagnóstico para cada serviço de IA do Azure.
Considere um gateway de IA generativo para monitoramento. Um proxy reverso como o Gerenciamento de API do Azure permite implementar o registro em log e o monitoramento que não são nativos da plataforma. O Gerenciamento de API permite que você colete IPs de origem, texto de entrada e texto de saída. Para obter mais informações, consulte Implementar registro em log e monitoramento para modelos de linguagem do Serviço OpenAI do Azure.
Gerencie operações de IA
O gerenciamento de operações de IA envolve a padronização de recursos de computação e o monitoramento de recursos da plataforma para cargas de trabalho de IA do Azure. Ele garante que as equipes usem os recursos de computação corretos de forma eficiente e capturem métricas e logs dos recursos da plataforma.
Monitore os recursos da plataforma. Use as definições de diagnóstico para capturar registos e métricas para todos os principais serviços, como o Azure AI Foundry, o Azure Machine Learninge os Azure AI services. Serviços específicos devem capturar logs de auditoria e logs relevantes específicos do serviço. Implemente alertas de monitoramento personalizados com base nas necessidades específicas da sua arquitetura. Os exemplos incluem alertas para registos de contentores, Azure Machine Learning e Azure OpenAI. Configure alertas de monitoramento recomendados para cada serviço em sua arquitetura de IA. Para obter mais informações, consulte Azure Monitor Baseline Alerts.
Padronize o gerenciamento de computação. Você precisa de recursos de computação para determinadas ações, como fluxos de prompt e modelos de treinamento. Um serviço como o Machine Learning tem diferentes opções de computação, como instâncias de computação, clusters e opções sem servidor. Padronize o tipo de computação, os tempos de execução e os períodos de desligamento. Para obter opções de computação específicas do serviço, consulte Azure AI Foundry e Aprendizagem Automática .
Gerenciar dados de IA
Dados de alta qualidade são a base de modelos de IA precisos. O rastreamento do desvio do modelo ajuda a manter a relevância das previsões de IA ao longo do tempo e permite que as organizações adaptem os modelos conforme necessário para refletir as condições atuais.
Monitore o desvio de dados. Rastreie a precisão e o desvio de dados continuamente em IA generativa e não generativa para garantir que os modelos permaneçam relevantes. O monitoramento pode alertá-lo quando previsões de modelo ou respostas de modelo de linguagem grande se desviam do comportamento esperado. Este desvio indica a necessidade de reciclagem ou ajustamento. Configure alertas personalizados para detetar limites de desempenho. Esta abordagem permite uma intervenção precoce quando surgem problemas. Use avaliações no Azure AI Foundry e métricas suportadas no Aprendizagem Automática.
Garantir um tratamento de dados de qualidade. Para o aprendizado de máquina, os dados de treinamento devem ser formatados, limpos e prontos para o consumo do modelo. Para IA generativa, os dados de aterramento precisam estar no formato correto e, provavelmente, fragmentados, enriquecidos e incorporados para o consumo de modelos de IA. Para obter mais informações, consulte Guia para projetar e desenvolver uma solução RAG.
Gerencie a continuidade de negócios
Implementar implantações em várias regiões para garantir alta disponibilidade e resiliência para sistemas de IA generativos e não generativos Para obter mais informações, consulte Implantação de várias regiões no Azure AI Foundry, Azure Machine Learninge Azure OpenAI.