사용자 지정 명명된 엔터티 인식을 위해 자동 레이블 지정을 사용하는 방법
레이블 지정 프로세스는 데이터 세트 준비의 중요한 부분입니다. 이 프로세스에는 시간과 활동이 모두 필요하므로 자동 레이블 지정 기능을 사용하여 엔터티에 자동으로 레이블을 지정할 수 있습니다. 이전에 학습한 모델 또는 GPT 모델을 사용하여 자동 레이블 지정 작업을 시작할 수 있습니다. 이전에 학습한 모델을 기반으로 하는 자동 레이블 지정을 사용하면 몇 가지 문서에 레이블 지정을 시작하고 모델을 학습한 다음 자동 레이블 지정 작업을 만들어 해당 모델을 기반으로 다른 문서에 대한 엔터티 레이블을 만들 수 있습니다. GPT를 사용한 자동 레이블 지정을 사용하면 사전 모델 학습 없이 자동 레이블 지정 작업을 즉시 트리거할 수 있습니다. 이 기능을 사용하면 레이블을 엔터티에 수동으로 지정하는 시간과 노력을 절약할 수 있습니다.
필수 조건
학습한 모델을 기반으로 자동 레이블 지정을 사용하려면 먼저 다음이 필요합니다.
- 구성된 Azure Blob 스토리지 계정을 사용하여 성공적으로 만들어진 프로젝트
- 스토리지 계정에 업로드된 텍스트 데이터.
- 레이블이 지정된 데이터
- 모델을 학습시킴
자동 레이블 지정 작업 트리거
학습한 모델을 기반으로 자동 레이블 지정 작업을 트리거하는 경우 리소스당 매월 5,000개의 텍스트 레코드로 제한됩니다. 이는 동일한 리소스 내의 모든 프로젝트에 동일한 제한이 적용됨을 의미합니다.
팁
텍스트 레코드는 (문서의 문자 수/1,000)의 최댓값으로 계산됩니다. 예를 들어 문서에 8,921자가 있는 경우 텍스트 레코드 수는 다음과 같습니다.
ceil(8921/1000) = ceil(8.921)
- 9개 텍스트 레코드입니다.
왼쪽 탐색 메뉴에서 데이터 레이블 지정을 선택합니다.
페이지 오른쪽의 작업 창에서 자동 레이블 단추를 선택합니다.
[학습한 모델을 기반으로 한 자동 레이블 지정]을 선택하고 [다음]을 선택합니다.
학습된 모델을 선택합니다. 자동 레이블 지정에 사용하기 전에 모델 성능을 확인하는 것이 좋습니다.
자동 레이블 지정 작업에 포함할 엔터티를 선택합니다. 기본적으로 모든 엔터티가 선택됩니다. 각 엔터티의 총 레이블 수, 정밀도, 재현율을 볼 수 있습니다. 성능이 뛰어난 엔터티를 포함하여 자동으로 레이블이 지정된 엔터티의 품질을 보장하는 것이 좋습니다.
자동으로 레이블을 지정할 문서를 선택합니다. 각 문서의 텍스트 레코드 수가 표시됩니다. 하나 이상의 문서를 선택하면 선택한 텍스트 레코드 수가 표시됩니다. 필터에서 레이블이 지정되지 않은 문서를 선택하는 것이 좋습니다.
참고 항목
- 엔터티에 자동으로 레이블이 지정되었지만 사용자 정의 레이블이 있는 경우 사용자 정의 레이블만 사용되고 표시됩니다.
- 문서 이름을 클릭하여 문서를 볼 수 있습니다.
자동 레이블 지정 작업을 트리거하려면 자동 레이블을 선택합니다. 사용되는 모델, 자동 레이블 지정 작업에 포함된 문서 수, 자동으로 레이블이 지정될 텍스트 레코드 및 엔터티의 수가 표시됩니다. 자동 레이블 지정 작업은 어디서나 포함한 문서 수에 따라 몇 초에서 몇 분까지 걸릴 수 있습니다.
자동으로 레이블이 지정된 문서 검토
자동 레이블 지정 작업이 완료되면 Language Studio의 데이터 레이블 지정 페이지에서 출력 문서를 볼 수 있습니다. 자동 레이블이 있는 문서 검토를 선택하면 자동 레이블 지정됨 필터가 적용된 문서를 볼 수 있습니다.
자동으로 레이블이 지정된 엔터티는 점선으로 표시됩니다. 이러한 엔터티에는 자동 레이블을 수락하거나 거부할 수 있는 두 개의 선택기(확인 표시 및 "X")가 있습니다.
엔터티가 승인되면 점선이 실선으로 변경되고 레이블은 사용자 정의 레이블이 되는 추가 모델 학습에 포함됩니다.
또는 화면의 오른쪽 위 모서리에서 모두 수락 또는 모두 거부를 사용하여 문서 내에서 자동으로 레이블이 지정된 모든 엔터티를 수락하거나 거부할 수 있습니다.
레이블이 지정된 엔터티가 수락되거나 거부되면 레이블 저장을 선택하여 변경 내용을 적용합니다.
참고 항목
- 자동으로 레이블이 지정된 엔터티를 수락하기 전에 유효성을 검사하는 것이 좋습니다.
- 허용되지 않은 모든 레이블은 모델 학습 시 삭제됩니다.
다음 단계
- 데이터 레이블 지정에 대해 자세히 알아봅니다.