Se não conseguir encontrar respostas às suas perguntas neste documento e ainda precisar de ajuda, consulte o guia de opções de suporte dos serviços de IA do Azure.
Geral
Qual é a diferença entre o serviço Azure OpenAI e a inferência de modelo de IA do Azure?
O Serviço Azure OpenAI dá aos clientes acesso a modelos de linguagem avançados da OpenAI. A inferência de modelo de IA do Azure estende essa capacidade, dando aos clientes acesso a todos os modelos emblemáticos da IA do Azure sob o mesmo serviço, ponto de extremidade e credenciais. Inclui Azure OpenAI, Cohere, Mistral AI, Meta Llama, laboratórios AI21, etc. Os clientes podem alternar perfeitamente entre modelos sem alterar o código.
O Serviço OpenAI do Azure e a inferência de modelo de IA do Azure fazem parte da família de serviços de IA do Azure e são construídos com base na mesma promessa de segurança e empresarial do Azure.
Enquanto a inferência do modelo de IA do Azure se concentra na inferência, o Serviço OpenAI do Azure pode ser usado com APIs mais avançadas, como lote, ajuste fino, assistentes e arquivos.
Qual é a diferença entre OpenAI e Azure OpenAI?
Os Modelos de IA do Azure e o Serviço OpenAI do Azure dão aos clientes acesso a modelos de linguagem avançados da OpenAI com a promessa de segurança e empresarial do Azure. O Azure OpenAI codesenvolve as APIs com a OpenAI, garantindo compatibilidade e uma transição suave de uma para a outra.
Os clientes obtêm os recursos de segurança do Microsoft Azure enquanto executam os mesmos modelos do OpenAI. Ele oferece rede privada, disponibilidade regional e filtragem responsável de conteúdo de IA.
Saiba mais sobre o serviço Azure OpenAI.
Qual é a diferença entre os serviços de IA do Azure e o Azure AI Foundry?
Os serviços de IA do Azure são um conjunto de serviços de IA que fornecem APIs pré-criadas para cenários comuns de IA. Os Serviços de IA do Azure fazem parte da plataforma Azure AI Foundry. Os serviços de IA do Azure podem ser usados no portal do Azure AI Foundry para aprimorar seus modelos com recursos de IA pré-criados.
Modelos
Por que nem todos os modelos no catálogo de modelos de IA do Azure são suportados nos serviços de IA do Azure?
A inferência de modelo de IA do Azure em serviços de IA dá suporte a todos os modelos no catálogo de IA do Azure com cobrança pré-paga. Para obter mais informações, consulte o artigo Modelos.
O catálogo de modelos da IA do Azure contém uma lista mais ampla de modelos, no entanto, esses modelos exigem cota de computação da sua assinatura. Eles também precisam ter um projeto ou hub de IA onde hospedar a implantação. Para obter mais informações, consulte Opções de implantação no Azure AI Foundry.
SDKs e linguagens de programação
Quais são os SDKs e linguagens de programação suportados para inferência de modelo de IA do Azure?
Você pode usar o SDK de Inferência do Azure com qualquer modelo suportado pela inferência de modelo de IA do Azure nos serviços de IA do Azure, a AzureOpenAI
classe no SDK do OpenAI ou o SDK do Azure OpenAI.
Cohere SDK, Mistral SDK e SDKs específicos do provedor de modelo não são suportados quando conectados aos serviços de IA do Azure.
Para obter mais informações, consulte SDKs e linguagens de programação suportados.
A inferência de modelo de IA do Azure funciona com a biblioteca Python mais recente lançada pelo OpenAI (versão>=1.0)?
Os serviços de IA do Azure suportam a versão mais recente da biblioteca OpenAI Python (version>=1.0).
Estou fazendo uma solicitação para um modelo que dá suporte à inferência de modelo de IA do Azure, mas estou recebendo um erro 404. O que devo fazer?
Certifique-se de que criou uma implementação para um determinado modelo e que o nome da implementação corresponde exatamente ao valor que está a passar no model
parâmetro. Embora o roteamento não diferencie maiúsculas de minúsculas, certifique-se de que não haja pontuação ou espaços especiais, pois esses são erros comuns.
Estou usando o pacote 'azure-ai-inference' para Python e recebo um erro 401 quando tento autenticar usando chaves. O que devo fazer?
O recurso Serviços de IA do Azure requer a versão azure-ai-inference>=1.0.0b5
para Python. Certifique-se de que está a utilizar essa versão.
Estou usando o SDK do OpenAI e indiquei o ponto de extremidade de inferência do Azure OpenAI como URL base (https://<resource-name>.openai.azure.com). No entanto, recebo um erro 404. O que devo fazer?
Verifique se você está usando o ponto de extremidade correto para o serviço Azure OpenAI e o conjunto certo de credenciais. Além disso, certifique-se de que você está usando a classe AzureOpenAI
do SDK do OpenAI, pois o mecanismo de autenticação e as URLs usadas são diferentes.
A inferência de modelo de IA do Azure dá suporte a cabeçalhos de API personalizados? Acrescentamos cabeçalhos personalizados às nossas solicitações de API e estamos vendo erros de falha HTTP 431.
Nossas APIs atuais permitem até 10 cabeçalhos personalizados, que são passados pelo pipeline e retornados. Observamos que alguns clientes agora excedem essa contagem de cabeçalhos, resultando em erros HTTP 431. Não há solução para esse erro, a não ser reduzir o volume do cabeçalho. Em versões futuras da API, não passamos mais por cabeçalhos personalizados. Recomendamos que você não dependa de cabeçalhos personalizados em arquiteturas de sistema futuras.
Preços e Faturação
Como a inferência de modelo de IA do Azure é cobrada?
Você é cobrado pelas entradas e saídas para as APIs, geralmente em tokens. Não há nenhum custo associado ao recurso em si ou às implantações.
O preço do token varia por cada modelo e você é cobrado por 1.000 tokens. Você pode ver os detalhes de preços antes de implantar um determinado modelo. Para obter mais informações sobre cobrança, consulte Gerenciar custo.
Onde posso ver os detalhes da fatura?
A faturação e os custos são apresentados no Azure Cost Management + Faturação. Você pode ver os detalhes de uso no portal do Azure.
A cobrança não é mostrada no portal do Azure AI Foundry.
Como posso colocar um limite de gastos na minha fatura?
Pode configurar um limite de gastos no portal do Azure em Gestão de Custos do Azure + Faturação. Esse limite impede que você gaste mais do que o limite definido. Quando o limite de gastos for atingido, a assinatura será desativada e você não poderá usar o ponto final até o próximo ciclo de cobrança.
Dados e Privacidade
Utiliza os dados da minha empresa para formar algum dos modelos?
A inferência de modelo de IA do Azure não usa dados do cliente para treinar novamente os modelos e os dados do cliente nunca são compartilhados com provedores de modelos.
Compromisso de Direitos Autorais do Cliente
Como posso obter cobertura ao abrigo do Compromisso de Direitos de Autor do Cliente?
O Compromisso de Direitos Autorais do Cliente é uma disposição a ser incluída nos Termos de Produto da Microsoft de 1º de dezembro de 2023 que descreve a obrigação da Microsoft de defender os clientes contra determinadas reivindicações de propriedade intelectual que não sejam da Microsoft relacionadas ao Conteúdo de Saída. Se o assunto da reivindicação for Conteúdo de Saída gerado a partir do Serviço OpenAI do Azure (ou qualquer outro Produto Coberto que permita aos clientes configurar os sistemas de segurança), então, para receber cobertura, os clientes devem ter implementado todas as atenuações exigidas pela documentação do Serviço OpenAI do Azure na oferta que forneceu o Conteúdo de Saída. As mitigações necessárias são documentadas aqui e atualizadas continuamente. Para novos serviços, recursos, modelos ou casos de uso, novos requisitos de CCC serão publicados e entrarão em vigor no lançamento ou após o lançamento de tal serviço, recurso, modelo ou caso de uso. Caso contrário, os clientes terão seis meses a partir do momento da publicação para implementar novas mitigações para manter a cobertura sob o CCC. Se um cliente apresentar uma reclamação, ser-lhe-á pedido que demonstre a conformidade com os requisitos relevantes. Essas atenuações são necessárias para Produtos Cobertos que permitem que os clientes configurem os sistemas de segurança, incluindo o Serviço Azure OpenAI; eles não afetam a cobertura para clientes que usam outros Produtos Cobertos.