모델 학습 및 평가

완료됨

모델 학습 및 평가는 모델을 보다 정확하게 학습하기 위해 학습 데이터 세트에 데이터 및 레이블을 추가하는 반복적인 프로세스입니다. 개선해야 하는 데이터 및 레이블 유형을 파악하기 위해 Language Studio는 왼쪽 창의 모델 세부 정보 보기 페이지에서 점수를 제공합니다.

Screenshot of the View model scoring tab.

개별 엔터티와 전체 모델 점수는 어떻게 수행되고 있으며 개선이 필요한 곳을 설명하는 세 가지 메트릭으로 나뉩니다.

메트릭 Description
자릿수 시도된 모든 인식에 대한 성공한 엔터티 인식의 비율입니다. 높은 점수는 엔터티가 인식되는 한 올바르게 레이블이 지정됨을 의미합니다.
회차 문서의 실제 엔터티 수에서 성공한 엔터티 인식의 비율입니다. 점수가 높으면 올바른 레이블을 할당하는지 여부에 관계없이 엔터티를 잘 찾습니다.
F1 점수 단일 점수 매기기 메트릭을 제공하는 정밀도와 재현율의 결합

점수는 엔터티당 및 모델 전체에 대해 모두 사용할 수 있습니다. 엔터티 점수는 잘 찾을 수 있지만 전체 모델은 그렇지 않습니다.

메트릭을 해석하는 방법

이상적으로는 모델이 정밀도와 재현율 모두에서 점수를 잘 매기기를 원합니다. 즉 엔터티 인식이 잘 작동한다는 의미합니다. 두 메트릭 모두 점수가 낮으면 모델이 문서에서 엔터티를 인식하는 데 어려움을 겪고 있으며 해당 엔터티를 추출할 때 신뢰도가 높은 올바른 레이블을 할당하지 않습니다.

정밀도가 낮지만 재현율이 높으면 모델이 엔터티를 잘 인식하지만 올바른 엔터티 형식으로 레이블을 지정하지 않는다는 의미입니다.

정밀도가 높지만 재현율이 낮으면 모델이 항상 엔터티를 인식하지는 않지만 모델에서 엔터티를 추출할 때 올바른 레이블이 적용됩니다.

혼동 행렬

동일한 모델 세부 정보 보기 페이지에는 혼동 행렬의 위쪽에 다른 탭이 있습니다. 이 보기는 모든 엔터티의 시각적 테이블과 각 엔터티가 어떻게 수행되고 있는지를 보여 주어 모델의 전체 보기와 부족한 위치를 제공합니다.

Screenshot of a sample confusion matrix.

혼동 행렬을 사용하면 모델의 성능을 향상하기 위해 데이터를 추가할 위치를 시각적으로 식별할 수 있습니다.