Treine e avalie o seu modelo

Concluído

Treinar e avaliar seu modelo é um processo iterativo de adicionar dados e rótulos ao seu conjunto de dados de treinamento para ensinar o modelo com mais precisão. Para saber que tipos de dados e rótulos precisam ser melhorados, o Language Studio fornece pontuação na página Exibir detalhes do modelo no painel esquerdo.

Screenshot of the View model scoring tab.

As entidades individuais e a pontuação geral do seu modelo são divididas em três métricas para explicar o seu desempenho e onde precisam de melhorar.

Métrico Description
Precisão A proporção de reconhecimentos de entidades bem-sucedidas para todas as tentativas de reconhecimento. Uma pontuação alta significa que, desde que a entidade seja reconhecida, ela é rotulada corretamente.
Recuperar A proporção de reconhecimentos de entidades bem-sucedidas em relação ao número real de entidades no documento. Uma pontuação alta significa que encontra bem a entidade ou entidades, independentemente de lhes atribuir o rótulo certo
Pontuação F1 Combinação de precisão e recall fornecendo uma única métrica de pontuação

As pontuações estão disponíveis por entidade e para o modelo como um todo. Você pode achar que uma entidade pontua bem, mas todo o modelo não.

Como interpretar métricas

Idealmente, queremos que o nosso modelo tenha uma boa pontuação, tanto em precisão como em recordação, o que significa que o reconhecimento da entidade funciona bem. Se ambas as métricas tiverem uma pontuação baixa, isso significa que o modelo está lutando para reconhecer entidades no documento e, quando extrai essa entidade, não atribui o rótulo correto com alta confiança.

Se a precisão for baixa, mas a recuperação for alta, isso significa que o modelo reconhece bem a entidade, mas não a rotula como o tipo de entidade correto.

Se a precisão for alta, mas a recuperação for baixa, isso significa que o modelo nem sempre reconhece a entidade, mas quando o modelo extrai a entidade, o rótulo correto é aplicado.

A matriz de confusão

Na mesma página Exibir detalhes do modelo, há outra guia na parte superior da matriz Confusion. Esta visualização fornece uma tabela visual de todas as entidades e como cada uma se saiu, dando uma visão completa do modelo e onde ele está falhando.

Screenshot of a sample confusion matrix.

A matriz de confusão permite identificar visualmente onde adicionar dados para melhorar o desempenho do seu modelo.