Glossário de noções básicas de linguagem de conceitos e vocabulário comuns
Importante
O LUIS será desativado em 1º de outubro de 2025 e, a partir de 1º de abril de 2023, você não poderá criar novos recursos do LUIS. É recomendável migrar seus aplicativos LUIS para a compreensão da linguagem coloquial a fim de usufruir do suporte contínuo ao produto e dos recursos multilíngues.
O glossário do LUIS (Reconhecimento de Linguagem) explica os termos que você pode encontrar à medida que trabalha com o serviço do LUIS.
Versão ativa
A versão ativa é a versão de seu aplicativo que é atualizada quando você faz alterações no modelo usando o portal do LUIS. No portal do LUIS, se você quiser fazer alterações em uma versão que não seja a versão ativa, primeiro será necessário definir essa versão como ativa.
Aprendizado ativo
Aprendizado ativo é uma técnica de machine learning em que o modelo aprendido por máquina é usado para identificar novos exemplos informativos para rotular. No LUIS, aprendizado ativo se refere à adição de enunciados do tráfego do ponto de extremidade cujas previsões atuais não estão claras a fim de aprimorar seu modelo. Clique em "revisar enunciados do ponto de extremidade" para exibir enunciados para serem rotulados.
Consulte também:
- Informações conceituais
- Tutorial para revisar enunciados de ponto de extremidade
- Como aprimorar o aplicativo LUIS revisando os enunciados do ponto de extremidade
Aplicativo (app)
No LUIS, seu aplicativo, ou aplicativo, é uma coleção de modelos de aprendizado de máquina, criados no mesmo conjunto de dados, que trabalham juntos para prever intenções e entidades para um cenário específico. Cada aplicativo tem um ponto de extremidade de previsão separado.
Se estiver criando um bot de RH, você poderá ter um conjunto de intenções, como "Agendar período de licença", "consultar benefícios" e "atualizar informações pessoais", bem como entidades para cada uma dessas intenções que você agrupa em um só aplicativo.
Criação
Criação é a capacidade de criar, gerenciar e implantar um aplicativo LUIS usando o portal do LUIS ou as APIs de criação.
Chave de criação
A chave de criação é usada para criar o aplicativo. Não usada para consultas de ponto de extremidade no nível de produção. Para saber mais, consulte limites do recurso.
Recurso de criação
Um recurso de criação do LUIS é um item gerenciável que está disponível por meio do Azure. O recurso é seu acesso às capacidades de criação, treinamento e publicação associadas do serviço do Azure. O recurso inclui informações de autenticação, autorização e segurança de que você precisa para acessar o serviço do Azure associado.
O recurso de criação tem um "tipo" do Azure igual a LUIS-Authoring
.
Teste de lote
Testes de lote são a capacidade de validar os modelos de um aplicativo LUIS atual com um conjunto de teste consistente e conhecido de enunciados do usuário. O teste de lote é definido em um arquivo formatado em JSON.
Consulte também:
Medida F
No teste de lote, uma medida da precisão do teste.
Falso negativo (FN)
No teste de lote, os pontos de dados representam enunciados em que o aplicativo previu incorretamente a ausência de entidade/intenção de destino.
Falso positivo (FP)
No teste de lote, os pontos de dados representam enunciados em que o aplicativo previu incorretamente a existência de entidade/intenção de destino.
Precisão
No teste de lote, a precisão (também chamada de valor preditivo positivo) é a fração de enunciados relevantes entre os enunciados recuperados.
Um exemplo de teste de lote com animais é o número de ovelhas que foram previstas dividido pelo número total de animais (ovelha e não ovelha).
Recall
No teste de lote, recall (também conhecido como sensibilidade) é a capacidade de generalização do LUIS.
Um exemplo de teste de lote com animais é o número de ovelhas que foram previstas dividido pelo número total de ovelhas disponíveis.
Negativo verdadeiro (TN)
Um negativo verdadeiro ocorre quando seu aplicativo não prevê corretamente nenhuma correspondência. No teste em lote, um verdadeiro negativo ocorre quando seu aplicativo prevê uma intenção ou entidade para um exemplo que não foi rotulado com essa intenção ou entidade.
Positivo verdadeiro (TP)
Verdadeiro positivo (TP): um verdadeiro positivo ocorre quando seu aplicativo prevê uma correspondência corretamente. Nos testes de lote, um verdadeiro positivo ocorre quando seu aplicativo prevê uma intenção ou entidade para um exemplo que foi rotulado com essa intenção ou entidade.
Classificador
Um classificador é um modelo aprendido por máquina que prevê em qual categoria ou classe uma entrada se encaixa.
Uma intenção é um exemplo de classificador.
Colaborador
Um colaborador é, conceitualmente, a mesma coisa que um contribuinte. Um colaborador recebe acesso quando um proprietário adiciona o endereço de email do colaborador a um aplicativo que não é controlado com o RBAC do Azure (controle de acesso baseado em função do Azure). Se você ainda estiver usando colaboradores, deverá migrar sua conta do LUIS e usar os recursos de criação do LUIS para gerenciar os colaboradores com o RBAC do Azure.
Colaborador
Um colaborador não é o proprietário do aplicativo, mas tem as mesmas permissões para adicionar, editar e excluir as intenções, entidades e enunciados. Um colaborador fornece RBAC do Azure (controle de acesso baseado em função do Azure) para um aplicativo LUIS.
Consulte também:
- Como adicionar colaboradores
Descritor
Um descritor é o termo usado anteriormente para um recurso de machine learning.
Domínio
No contexto do LUIS, um domínio é uma área de conhecimento. Seu domínio é específico de seu cenário. Domínios diferentes usam uma terminologia e uma linguagem específica que têm significado no contexto do domínio. Por exemplo, se você estiver criando um aplicativo para reproduzir música, ele teria termos e linguagem específicos da música – palavras como "canção, faixa, álbum, letras, lado b, artista". Para ver exemplos de domínios, confira domínios predefinidos.
Ponto de extremidade
Ponto de extremidade de criação
A URL do ponto de extremidade de criação do LUIS é onde você cria, treina e publica seu aplicativo. A URL de ponto de extremidade contém a região ou o subdomínio do aplicativo publicado, bem como a ID do aplicativo.
Saiba mais sobre como criar seu aplicativo programaticamente na Referência do desenvolvedor
Ponto de extremidade de previsão
A URL do ponto de extremidade de previsão do LUIS é onde você envia consultas do LUIS após o aplicativo LUIS ser criado e publicado. A URL de ponto de extremidade contém a região ou o subdomínio do aplicativo publicado, bem como a ID do aplicativo. Você pode encontrar o ponto de extremidade na página Recursos do Azure do aplicativo ou obter a URL do ponto de extremidade na API Obter Informações do Aplicativo.
Seu acesso ao ponto de extremidade de previsão é autorizado com a chave de previsão do LUIS.
Entidade
Entidades são palavras em enunciados que descrevem as informações usadas para atender ou identificar uma intenção. Se sua entidade for complexa e você quiser que o modelo identifique partes específicas, você poderá dividir o modelo em subentidades. Por exemplo, você pode querer que o modelo preveja um endereço, mas também as subentidades de rua, cidade, estado e código postal. As entidades também podem ser usadas como recursos para modelos. Sua resposta do aplicativo LUIS inclui as intenções previstas e todas as entidades.
Extrator de entidades
Um extrator de entidades, às vezes chamado apenas de extrator, é o tipo de modelo aprendido por máquina que o LUIS usa para prever entidades.
Esquema de entidade
O esquema de entidade é a estrutura que você define para entidades aprendidas por máquina com subentidades. O ponto de extremidade de previsão retorna todas as entidades e subentidades extraídas definidas no esquema.
Subentidade da entidade
Uma subentidade é uma entidade filho de uma entidade de aprendizado de máquina.
Entidade que não é de aprendizado de máquina
Uma entidade que usa correspondência de texto para extrair dados:
- Entidade de lista
- Entidade de expressão regular
Entidade de lista
Uma entidade de lista representa um conjunto fixo e fechado de palavras relacionadas, juntamente com os respectivos sinônimos. Entidades de lista são correspondências exatas, diferentemente das entidades aprendidas por máquina.
A entidade será prevista se uma palavra na entidade de lista estiver incluída na lista. Por exemplo, se você tiver uma entidade de lista chamada "tamanho" e tiver as palavras "pequeno, médio, grande" na lista, a entidade de tamanho será prevista para todos os enunciados em que as palavras "pequeno", "médio" ou "grande" são usadas independentemente do contexto.
Expressão regular
Uma entidade de expressão regular representa uma expressão regular. Entidades de expressão regular são correspondências exatas, diferentemente das entidades aprendidas por máquina.
Entidade predefinida
Consulte a entrada do modelo predefinido para entidade predefinida.
Recursos
No machine learning, um recurso é uma característica que ajuda o modelo a reconhecer um determinado conceito. É uma dica que o LUIS pode usar, mas não uma regra rígida.
Esse termo também é conhecido como recurso de aprendizado de máquina .
Essas dicas são usadas com os rótulos para aprender a prever novos dados. O LUIS dá suporte a listas de frases e ao uso de outros modelos como recursos.
Recurso obrigatório
Um recurso obrigatório é uma forma de restringir a saída de um modelo do LUIS. Quando um recurso de uma entidade é marcado como obrigatório, ele deve estar presente no exemplo para que a entidade seja prevista, independentemente do que o modelo aprendido pelo computador prevê.
Considere um exemplo em que você tem um recurso de número predefinido que você marcou como obrigatório na entidade de quantidade para um bot de pedidos de menus. Quando o bot vir I want a bajillion large pizzas?
, zilhão não será previsto como uma quantidade, independentemente do contexto no qual aparecer. Bajillion não é um número válido e não será previsto pela entidade predefinida de número.
Intencional
Uma intenção representa uma tarefa ou ação que o usuário deseja executar. É uma finalidade ou meta expressa na entrada de um usuário, como reservar um voo ou pagar uma fatura. No LUIS, um enunciado como um todo é classificado como uma intenção, mas partes do enunciado são extraídas como entidades.
Exemplos de rotulagem
Rotular (ou marcar) é o processo de associar um exemplo positivo ou negativo a um modelo.
Rotulagem para intenções
No LUIS, as intenções em um aplicativo são mutuamente exclusivas. Isso significa que, quando você adiciona um enunciado a uma intenção, ele é considerado um exemplo positivo para essa intenção e um exemplo negativo para todas as outras intenções. Exemplos negativos não devem ser confundidos com a intenção "Nenhum", que representa enunciados que estão fora do escopo do aplicativo.
Rotulagem para entidades
No LUIS, você rotula uma palavra ou frase no exemplo de enunciado de uma intenção com uma entidade como um exemplo positivo. A rotulagem mostra à intenção o que ela deve prever esse enunciado. Os enunciados rotulados são usados para treinar a intenção.
Aplicativo LUIS
Confira a definição de aplicativo (app).
Modelar
Um modelo (aprendido por máquina) é uma função que faz uma previsão sobre dados de entrada. No LUIS, nos referimos aos classificadores de intenção e aos extratores de entidade genericamente como "modelos", e nos referimos a uma coleção de modelos treinados, publicados e consultados como um "aplicativo".
Valor normalizado
Você adiciona valores às suas entidades de lista. Cada um desses valores pode ter uma lista de um ou mais sinônimos. Somente o valor normalizado é retornado na resposta.
Sobreajuste
O sobreajuste acontece quando o modelo se concentra nos exemplos específicos e não é capaz de generalizar bem.
Proprietário
Cada aplicativo tem um proprietário, que é a pessoa que criou o aplicativo. O proprietário gerencia permissões para o aplicativo no portal do Azure.
Lista de frases
Uma lista de frases é um tipo específico de recurso de machine learning que inclui um grupo de valores (palavras ou frases) que pertencem à mesma classe e devem ser tratadas de maneira semelhante (por exemplo, nomes de cidades ou produtos).
Modelo predefinido
Um modelo predefinido é uma intenção, entidade ou coleção de ambos, juntamente com exemplos rotulados. Esses modelos predefinidos comuns podem ser adicionados ao seu aplicativo para reduzir o trabalho de desenvolvimento de modelo necessário para seu aplicativo.
Domínio predefinido
Um domínio predefinido é um aplicativo LUIS configurado para um domínio específico, como automação residencial (HomeAutomation) ou reservas de restaurante (RestaurantReservation). As intenções, declarações e entidades são configuradas para esse domínio.
Entidade predefinida
Uma entidade predefinida é um LUIS de entidade que fornece tipos comuns de informações, como número, URL e email. Elas são criadas com base em dados públicos. Você pode optar por adicionar uma entidade predefinida como uma entidade autônoma ou como um recurso a uma entidade.
Intenção predefinida
Uma intenção predefinida é uma intenção que o LUIS fornece para tipos comuns de informações e tem os próprios enunciados de exemplo rotulados.
Previsão
Uma previsão é uma solicitação REST para o serviço de previsão do LUIS do Azure que recebe novos dados (enunciado do usuário) e aplica o aplicativo treinado e publicado a esses dados para determinar quais intenções e entidades são encontradas.
Chave de previsão
A chave de previsão é a chave associada ao serviço LUIS que você criou no Azure e que autoriza o uso do ponto de extremidade de previsão.
Essa chave não é a chave de criação. Se você tiver uma chave de ponto de extremidade de previsão, ela deverá ser usada para qualquer solicitação de ponto de extremidade, em vez da chave de criação. Você pode ver sua chave de previsão atual dentro da URL do ponto de extremidade na parte inferior da página de recursos do Azure no site do LUIS. É o valor do par nome/valor de subscription-key.
Recurso de previsão
Um recurso de previsão do LUIS é um item gerenciável que está disponível por meio do Azure. O recurso é seu acesso à previsão associada do serviço do Azure. O recurso inclui previsões.
O recurso de previsão tem um "tipo" do Azure igual a LUIS
.
Pontuação de previsão
A pontuação é um número de 0 a 1 que é uma medida do quanto o sistema confia que um determinado enunciado de entrada corresponde a uma determinada intenção. Uma pontuação mais próxima de 1 significa que o sistema está muito confiante sobre sua saída e uma pontuação mais próxima de 0 significa que o sistema está confiante de que a entrada não corresponde a uma saída específica. Pontuações no meio significam que o sistema não sabe ao certo como tomar a decisão.
Por exemplo, imagine um modelo que é usado para identificar se um texto do cliente inclui um pedido de alimentos. Ele pode dar uma pontuação de 1 para "Gostaria de pedir uma café" (o sistema tem certeza de que se trata de um pedido) e uma pontuação de 0 para "meu time venceu o jogo ontem à noite" (o sistema tem certeza de que não se trata de um pedido). E ele pode ter uma pontuação de 0,5 para "vamos tomar um chá" (não tem certeza se é um pedido ou não).
Chave programática
Renomeada para chave de criação.
Publicação
Publicação significa disponibilizar uma versão ativa do LUIS no ponto de extremidade de preparo ou de produção.
Quota
A cota LUIS é a limitação do nível de assinatura do Azure. A cota LUIS pode ser limitada por solicitações por segundo (HTTP Status 429) e solicitações totais em um mês (HTTP Status 403).
Esquema
Seu esquema inclui suas intenções e entidades junto com as subentidades. O esquema é planejado inicialmente e, depois, é iterado ao longo do tempo. O esquema não inclui configurações de aplicativo, recursos nem enunciados de exemplo.
Análise de Sentimento
A análise de sentimento fornece valores positivos ou negativos das declarações fornecidas pelo Serviço de linguagem.
Preparação da fala
O priming de fala aprimora o reconhecimento de palavras e frases faladas que costumam ser usadas em seus cenários com os Serviços de Fala. Para aplicativos habilitados para priming de fala, todos os exemplos rotulados do LUIS são usados para aprimorar a precisão do reconhecimento de fala criando um modelo de fala personalizado para esse aplicativo específico. Por exemplo, em um jogo de xadrez, você deseja garantir que quando o usuário disser "Mover cavalo", isso não seja interpretado como "Mover intervalo". O aplicativo LUIS deve incluir exemplos em que "cavalo" é rotulado como uma entidade.
Chave inicial
Uma chave gratuita a ser usada ao começar a usar o LUIS pela primeira vez.
Sinônimos
Ao listar entidades no LUIS, você pode criar um valor normalizado, que pode ter uma lista de sinônimos. Por exemplo, se você cria uma entidade de tamanho que tenha os valores normalizados pequeno, médio, grande e extragrande. Você pode criar sinônimos para cada valor, da seguinte maneira:
Valor normalizado | Sinônimos |
---|---|
Pequena | o pequeno, 8 onças |
Médio | regular, 12 onças |
Grande | grande, 16 onças |
Extragrande | o maior, 24 onças |
O modelo retorna o valor normalizado para a entidade quando qualquer um dos sinônimos é visto na entrada.
Teste
Testar um aplicativo LUIS significa exibir previsões de modelo.
Diferença de fuso horário
O ponto de extremidade inclui timezoneOffset. Este é o número, em minutos, que você deseja adicionar ou remover da entidade predefinida datetimeV2. Por exemplo, se a declaração for "que horas são agora?", o datetimeV2 retornado será a hora atual da solicitação do cliente. Se a solicitação do cliente vier de um bot ou outro aplicativo que não seja o mesmo que o usuário do bot, você deverá passar o deslocamento entre o bot e o usuário.
Confira Alterar o fuso horário da entidade datetimeV2 predefinida.
Token
Um token é a menor unidade de texto que o LUIS pode reconhecer. Isso difere ligeiramente entre idiomas.
Para o inglês, um token é um intervalo contínuo (sem espaços nem pontuação) de letras e números. Um espaço NÃO é um token.
Frase | Contagem de tokens | Explicação |
---|---|---|
Dog |
1 | Uma palavra sem pontuação nem espaços. |
RMT33W |
1 | Um número localizador de registro. Pode ter números e letras, mas não tem pontuação. |
425-555-5555 |
5 | Um número de telefone. Cada sinal de pontuação é um token, portanto, 425-555-5555 teria 5 tokens:425 - 555 - 5555 |
https://luis.ai |
7 | https : / / luis . ai |
Treinar
Treinar é o processo de ensinar ao LUIS sobre alterações na versão ativa desde o último treinamento.
Dados de treinamento
Os dados de treinamento são o conjunto de informações necessárias para treinar um modelo. Isso inclui o esquema, os enunciados rotulados, os recursos e as configurações do aplicativo.
Erros de treinamento
Erros de treino são previsões nos seus dados de treino que não correspondem aos seus rótulos.
Enunciado
Um enunciado é uma entrada de usuário que é um representante de texto curto de uma frase em uma conversa. É uma frase em linguagem natural, como "reservar 2 passagens para Seattle na próxima terça-feira". Enunciados de exemplo são adicionados para treinar o modelo e o modelo prevê um novo enunciado em tempo de execução.
Versão
Uma versão do LUIS é uma instância específica de um aplicativo LUIS associada a uma ID do aplicativo LUIS e ao ponto de extremidade publicado. Todo aplicativo LUIS tem pelo menos uma versão.