Partilhar via


Glossário de compreensão linguística de vocabulário e conceitos comuns

Importante

O LUIS será aposentado em 1º de outubro de 2025 e a partir de 1º de abril de 2023 você não poderá criar novos recursos do LUIS. Recomendamos migrar seus aplicativos LUIS para o entendimento de linguagem conversacional para se beneficiar do suporte contínuo ao produto e dos recursos multilíngues.

O glossário Language Understanding (LUIS) explica os termos que poderá encontrar ao trabalhar com o serviço LUIS.

Versão ativa

A versão ativa é a versão do seu aplicativo que é atualizada quando você faz alterações no modelo usando o portal LUIS. No portal LUIS, se você quiser fazer alterações em uma versão que não é a versão ativa, você precisa primeiro definir essa versão como ativa.

Aprendizagem ativa

O aprendizado ativo é uma técnica de aprendizado de máquina na qual o modelo de aprendizado de máquina é usado para identificar novos exemplos informativos para rotular. No LUIS, a aprendizagem ativa refere-se à adição de enunciados do tráfego do ponto final cujas previsões atuais não são claras para melhorar o seu modelo. Selecione "revisar enunciados do ponto final" para visualizar os enunciados a serem rotulados.

Consulte também:

Aplicação (App)

No LUIS, seu aplicativo, ou aplicativo, é uma coleção de modelos aprendidos por máquina, criados no mesmo conjunto de dados, que trabalham juntos para prever intenções e entidades para um cenário específico. Cada aplicativo tem um ponto de extremidade de previsão separado.

Se você estiver criando um bot de RH, você pode ter um conjunto de intenções, como "Agendar tempo de licença", "perguntar sobre benefícios" e "atualizar informações pessoais" e entidades para cada uma dessas intenções que você agrupa em um único aplicativo.

Criação

Criação é a capacidade de criar, gerenciar e implantar um aplicativo LUIS, usando o portal LUIS ou as APIs de criação.

Chave de criação

A chave de criação é usada para criar o aplicativo. Não é usado para consultas de ponto de extremidade no nível de produção. Para obter mais informações, consulte limites de recursos.

Recurso de criação

Seu recurso de criação LUIS é um item gerenciável que está disponível através do Azure. O recurso é o seu acesso às capacidades associadas de criação, formação e publicação do serviço do Azure. O recurso inclui autenticação, autorização e informações de segurança necessárias para acessar o serviço do Azure associado.

O recurso de criação tem um "tipo" do Azure de LUIS-Authoring.

Teste em lote

O teste em lote é a capacidade de validar os modelos de um aplicativo LUIS atual com um conjunto de teste consistente e conhecido de expressões do usuário. O teste em lote é definido em um arquivo formatado JSON.

Consulte também:

Medida-F

No teste de lote, uma medida da precisão do teste.

Falso negativo (FN)

No teste em lote, os pontos de dados representam expressões nas quais seu aplicativo previu incorretamente a ausência da intenção/entidade de destino.

Falso positivo (FP)

No teste em lote, os pontos de dados representam expressões nas quais seu aplicativo previu incorretamente a existência da intenção/entidade de destino.

Precisão

No teste de lote, precisão (também chamada de valor preditivo positivo) é a fração de enunciados relevantes entre os enunciados recuperados.

Um exemplo de um teste de lote animal é o número de ovinos que foram previstos dividido pelo número total de animais (ovinos e não ovinos).

Recuperar

Em testes em lote, recall (também conhecido como sensibilidade), é a capacidade do LUIS de generalizar.

Um exemplo de teste de lote animal é o número de ovinos que foram previstos dividido pelo número total de ovinos disponíveis.

Verdadeiro negativo (TN)

Um verdadeiro negativo é quando seu aplicativo prevê corretamente nenhuma correspondência. No teste em lote, um verdadeiro negativo ocorre quando seu aplicativo prevê uma intenção ou entidade para um exemplo que não foi rotulado com essa intenção ou entidade.

Verdadeiro positivo (TP)

Verdadeiro positivo (TP) Um verdadeiro positivo é quando seu aplicativo prevê corretamente uma correspondência. No teste em lote, um verdadeiro positivo ocorre quando seu aplicativo prevê uma intenção ou entidade para um exemplo que foi rotulado com essa intenção ou entidade.

Classificador

Um classificador é um modelo aprendido por máquina que prevê em que categoria ou classe uma entrada se encaixa.

Uma intenção é um exemplo de classificador.

Colaborador

Um colaborador é conceptualmente a mesma coisa que um colaborador. Um colaborador recebe acesso quando um proprietário adiciona o endereço de email do colaborador a um aplicativo que não é controlado com o controle de acesso baseado em função do Azure (Azure RBAC). Se você ainda estiver usando colaboradores, deverá migrar sua conta LUIS e usar recursos de criação do LUIS para gerenciar colaboradores com o Azure RBAC.

Contribuinte

Um colaborador não é o proprietário do aplicativo, mas tem as mesmas permissões para adicionar, editar e excluir as intenções, entidades e declarações. Um colaborador fornece o controle de acesso baseado em função do Azure (Azure RBAC) para um aplicativo LUIS.

Consulte também:

  • Como adicionar contribuidores

Descritor

Um descritor é o termo usado anteriormente para um recurso de aprendizado de máquina.

Domínio

No contexto do LUIS, um domínio é uma área de conhecimento. O seu domínio é específico para o seu cenário. Diferentes domínios usam linguagem e terminologia específicas que têm significado no contexto do domínio. Por exemplo, se estiver a criar uma aplicação para reproduzir música, a sua aplicação terá termos e linguagem específicos para a música – palavras como "música, faixa, álbum, letras, lado b, artista". Para obter exemplos de domínios, consulte domínios pré-criados.

Ponto final

Ponto de extremidade de criação

A URL do ponto de extremidade de criação LUIS é onde você cria, treina e publica seu aplicativo. A URL do ponto de extremidade contém a região ou o subdomínio personalizado do aplicativo publicado, bem como o ID do aplicativo.

Saiba mais sobre como criar seu aplicativo programaticamente na Referência do desenvolvedor

Ponto final de previsão

A URL do ponto de extremidade de previsão LUIS é onde você envia consultas LUIS depois que o aplicativo LUIS é criado e publicado. A URL do ponto de extremidade contém a região ou o subdomínio personalizado do aplicativo publicado, bem como o ID do aplicativo. Pode encontrar o ponto de extremidade na página de recursos do Azure da sua aplicação ou pode obter o URL do ponto de extremidade a partir da API Obter Informações da Aplicação.

Seu acesso ao ponto de extremidade de previsão é autorizado com a chave de previsão LUIS.

Entidade

Entidades são palavras em enunciados que descrevem informações usadas para cumprir ou identificar uma intenção. Se sua entidade é complexa e você gostaria que seu modelo identificasse partes específicas, você pode dividir seu modelo em subentidades. Por exemplo, você pode querer que seu modelo preveja um endereço, mas também as subentidades de rua, cidade, estado e CEP. As entidades também podem ser usadas como recursos para modelos. A sua resposta da aplicação LUIS inclui as intenções previstas e todas as entidades.

Extrator de entidades

Um extrator de entidades, às vezes conhecido apenas como extrator, é o tipo de modelo aprendido por máquina que o LUIS usa para prever entidades.

Esquema de entidade

O esquema de entidade é a estrutura que você define para entidades aprendidas por máquina com subentidades. O ponto de extremidade de previsão retorna todas as entidades e subentidades extraídas definidas no esquema.

Subentidade da entidade

Uma subentidade é uma entidade filha de uma entidade de aprendizado de máquina.

Entidade que não é de aprendizagem automática

Uma entidade que usa correspondência de texto para extrair dados:

  • Entidade de lista
  • Entidade de expressão regular

Entidade de lista

Uma entidade de lista representa um conjunto fixo e fechado de palavras relacionadas, juntamente com seus sinônimos. As entidades de lista são correspondências exatas, ao contrário das entidades aprendidas usinadas.

A entidade será prevista se uma palavra na entidade da lista for incluída na lista. Por exemplo, se você tiver uma entidade de lista chamada "tamanho" e tiver as palavras "pequeno, médio, grande" na lista, a entidade de tamanho será prevista para todos os enunciados em que as palavras "pequeno", "médio" ou "grande" são usadas independentemente do contexto.

Regular expression

Uma entidade de expressão regular representa uma expressão regular. As entidades de expressão regular são correspondências exatas, ao contrário das entidades aprendidas usinadas.

Entidade pré-construída

Consulte a entrada do modelo pré-construído para entidade pré-construída.

Funcionalidades

No aprendizado de máquina, um recurso é uma característica que ajuda o modelo a reconhecer um determinado conceito. É uma dica que o LUIS pode usar, mas não uma regra rígida.

Este termo também é referido como um recurso de aprendizado de máquina.

Essas dicas são usadas com os rótulos para aprender a prever novos dados. O LUIS suporta listas de frases e o uso de outros modelos como recursos.

Funcionalidade necessária

Um recurso necessário é uma maneira de restringir a saída de um modelo LUIS. Quando um recurso para uma entidade é marcado como necessário, o recurso deve estar presente no exemplo para que a entidade seja prevista, independentemente do que o modelo aprendido por máquina prevê.

Considere um exemplo em que você tem um recurso de número pré-incorporado que você marcou como necessário na entidade de quantidade para um bot de pedido de menu. Quando seu bot vê I want a bajillion large pizzas?, bajillion não será previsto como uma quantidade, independentemente do contexto em que aparece. Bajillion não é um número válido e não será previsto pela entidade pré-construída número.

Intenção

Uma intenção representa uma tarefa ou ação que o usuário deseja executar. É um propósito ou objetivo expresso na entrada de um usuário, como reservar um voo ou pagar uma conta. Em LUIS, um enunciado como um todo é classificado como uma intenção, mas partes do enunciado são extraídas como entidades.

Exemplos de rotulagem

A rotulagem, ou marcação, é o processo de associar um exemplo positivo ou negativo a um modelo.

Rotulagem para intenções

No LUIS, as intenções dentro de um aplicativo são mutuamente exclusivas. Isso significa que quando você adiciona um enunciado a uma intenção, ele é considerado um exemplo positivo para essa intenção e um exemplo negativo para todas as outras intenções. Exemplos negativos não devem ser confundidos com a intenção "Nenhuma", que representa enunciados que estão fora do escopo do aplicativo.

Rotulagem para entidades

No LUIS, você rotula uma palavra ou frase no enunciado de exemplo de uma intenção com uma entidade como um exemplo positivo . A rotulagem mostra a intenção do que deve prever para aquele enunciado. Os enunciados rotulados são usados para treinar a intenção.

Aplicação LUIS

Consulte a definição para aplicação (app).

Modelo

Um modelo (aprendizado de máquina) é uma função que faz uma previsão sobre dados de entrada. No LUIS, nos referimos a classificadores de intenção e extratores de entidade genericamente como "modelos", e nos referimos a uma coleção de modelos que são treinados, publicados e consultados juntos como um "aplicativo".

Valor normalizado

Você adiciona valores às entidades da sua lista . Cada um desses valores pode ter uma lista de um ou mais sinônimos. Somente o valor normalizado é retornado na resposta.

Sobreajuste

O overfitting acontece quando o modelo é fixado nos exemplos específicos e não é capaz de generalizar bem.

Proprietário

Cada aplicativo tem um proprietário que é a pessoa que criou o aplicativo. O proprietário gerencia permissões para o aplicativo no portal do Azure.

Lista de frases

Uma lista de frases é um tipo específico de recurso de aprendizado de máquina que inclui um grupo de valores (palavras ou frases) que pertencem à mesma classe e devem ser tratados de forma semelhante (por exemplo, nomes de cidades ou produtos).

Modelo pré-construído

Um modelo pré-construído é uma intenção, entidade ou coleção de ambos, juntamente com exemplos rotulados. Esses modelos pré-criados comuns podem ser adicionados ao seu aplicativo para reduzir o trabalho de desenvolvimento de modelo necessário para seu aplicativo.

Domínio pré-construído

Um domínio pré-construído é um aplicativo LUIS configurado para um domínio específico, como automação residencial (HomeAutomation) ou reservas de restaurantes (RestaurantReservation). As intenções, enunciados e entidades são configurados para este domínio.

Entidade pré-construída

Uma entidade pré-criada é uma entidade que o LUIS fornece para tipos comuns de informações, como número, URL e e-mail. Estes são criados com base em dados públicos. Você pode optar por adicionar uma entidade pré-criada como uma entidade autônoma ou como um recurso a uma entidade.

Intenção pré-construída

Uma intenção pré-construída é uma intenção que o LUIS fornece para tipos comuns de informações e vem com seus próprios enunciados de exemplo rotulados.

Previsão

Uma previsão é uma solicitação REST para o serviço de previsão LUIS do Azure que recebe novos dados (emissão do usuário) e aplica o aplicativo treinado e publicado a esses dados para determinar quais intenções e entidades são encontradas.

Chave de previsão

A chave de previsão é a chave associada ao serviço LUIS criado no Azure que autoriza o uso do ponto de extremidade de previsão.

Essa chave não é a chave de criação. Se você tiver uma chave de ponto de extremidade de previsão, ela deverá ser usada para quaisquer solicitações de ponto de extremidade em vez da chave de criação. Você pode ver sua chave de previsão atual dentro da URL do ponto de extremidade na parte inferior da página de recursos do Azure no site do LUIS. É o valor do par nome/valor da chave de assinatura.

Recurso de predição

Seu recurso de previsão LUIS é um item gerenciável que está disponível através do Azure. O recurso é o seu acesso à previsão associada do serviço do Azure. O recurso inclui previsões.

O recurso de previsão tem um "tipo" do Azure de LUIS.

Classificação da predição

A pontuação é um número de 0 e 1 que é uma medida de quão confiante o sistema está de que um determinado enunciado de entrada corresponde a uma intenção específica. Uma pontuação mais próxima de 1 significa que o sistema está muito confiante sobre sua saída e uma pontuação mais próxima de 0 significa que o sistema está confiante de que a entrada não corresponde a uma saída específica. Pontuações no meio significam que o sistema está muito inseguro de como tomar a decisão.

Por exemplo, pegue um modelo que é usado para identificar se algum texto do cliente inclui um pedido de comida. Pode dar uma pontuação de 1 para "Eu gostaria de pedir um café" (o sistema está muito confiante de que esta é uma ordem) e uma pontuação de 0 para "minha equipe ganhou o jogo ontem à noite" (o sistema está muito confiante de que isso NÃO é uma ordem). E pode ter uma pontuação de 0,5 para "vamos tomar um chá" (não tenho certeza se esta é uma ordem ou não).

Chave programática

Renomeado para chave de criação.

Publicar

Publicar significa disponibilizar uma versão ativa do LUIS no ponto de extremidade de preparação ou produção.

Quota

A cota LUIS é a limitação da camada de assinatura do Azure. A cota LUIS pode ser limitada por solicitações por segundo (Status HTTP 429) e pelo total de solicitações em um mês (Status HTTP 403).

Esquema

Seu esquema inclui suas intenções e entidades junto com as subentidades. O esquema é inicialmente planejado para depois iterado ao longo do tempo. O esquema não inclui configurações do aplicativo, recursos ou expressões de exemplo.

Análise de Sentimentos

A análise de sentimento fornece valores positivos ou negativos dos enunciados fornecidos pelo serviço linguístico.

Preparação de voz

A preparação por fala melhora o reconhecimento de palavras e frases faladas que são comumente usadas em seu cenário com os Serviços de Fala. Para aplicativos habilitados para preparação de fala, todos os exemplos rotulados como LUIS são usados para melhorar a precisão do reconhecimento de fala criando um modelo de fala personalizado para esse aplicativo específico. Por exemplo, em um jogo de xadrez, você quer ter certeza de que, quando o usuário diz "Move knight", ele não é interpretado como "Move night". O aplicativo LUIS deve incluir exemplos em que "cavaleiro" é rotulado como uma entidade.

Chave de arranque

Uma chave gratuita para usar quando começar a usar o LUIS.

Sinónimos

Nas entidades da lista LUIS, você pode criar um valor normalizado, que pode ter uma lista de sinônimos. Por exemplo, se você criar uma entidade de tamanho que tenha valores normalizados de pequeno, médio, grande e extragrande. Você pode criar sinônimos para cada valor assim:

Valor nomalizado Sinónimos
Pequena o pequeno, 8 onças
Médio regular, 12 onças
Grande grande, 16 onças
Xtra grande o maior, 24 onças

O modelo retorna o valor normalizado para a entidade quando qualquer um dos sinônimos é visto na entrada.

Teste

Testar um aplicativo LUIS significa visualizar previsões de modelo.

Deslocamento de fuso horário

O ponto de extremidade inclui timezoneOffset. Este é o número em minutos que você deseja adicionar ou remover da entidade pré-criada datetimeV2. Por exemplo, se o enunciado for "que horas são agora?", o datetimeV2 retornado é a hora atual para a solicitação do cliente. Se a solicitação do cliente for proveniente de um bot ou outro aplicativo que não seja o mesmo que o usuário do bot, você deverá passar o deslocamento entre o bot e o usuário.

Consulte Alterar fuso horário da entidade datetimeV2 pré-criada.

Token

Um token é a menor unidade de texto que o LUIS pode reconhecer. Esta situação difere ligeiramente consoante as línguas.

Para o inglês, um token é uma extensão contínua (sem espaços ou pontuação) de letras e números. Um espaço NÃO é um token.

Expressão Contagem de tokens Explicação
Dog 1 Uma única palavra sem pontuação ou espaços.
RMT33W 1 Um número localizador de registros. Pode ter números e letras, mas não tem pontuação.
425-555-5555 5 Um número de telefone. Cada sinal de pontuação é um único token, então 425-555-5555 seriam 5 tokens:
425
-
555
-
5555
https://luis.ai 7 https
:
/
/
luis
.
ai

Treinar

A formação é o processo de ensinar o LUIS sobre quaisquer alterações à versão ativa desde a última formação.

Dados de preparação

Dados de treinamento são o conjunto de informações necessárias para treinar um modelo. Isso inclui o esquema, expressões rotuladas, recursos e configurações do aplicativo.

Erros de treinamento

Erros de treinamento são previsões em seus dados de treinamento que não correspondem aos rótulos deles.

Expressão

Um enunciado é a entrada do usuário que é um texto curto representativo de uma frase em uma conversa. É uma frase em linguagem natural como "reserve 2 ingressos para Seattle na próxima terça-feira". Exemplos de enunciados são adicionados para treinar o modelo e o modelo prevê novos enunciados em tempo de execução.

Versão

Uma versão do LUIS é uma instância específica de um aplicativo LUIS associado a um ID de aplicativo LUIS e ao ponto de extremidade publicado. Cada aplicativo LUIS tem pelo menos uma versão.