Azure AI 언어 서비스의 미리 빌드된 기능 이해
Azure AI 언어 서비스는 인간의 언어를 이해하기 위한 다양한 기능을 제공합니다. 각 기능을 사용하여 사용자와 더 잘 통신하거나, 들어오는 통신을 더 잘 이해하거나, 두 기능을 함께 사용하여 사용자가 말하고, 의도하고, 질문하는 내용에 대해 더 많은 인사이트를 제공할 수 있습니다.
Azure AI 언어 서비스 기능은 미리 구성된 기능과 학습된 기능의 두 가지 범주로 구분됩니다. 학습된 기능을 사용하려면 적절한 레이블을 정확하게 예측하기 위한 모델을 빌드하고 학습해야 합니다. 이에 대해서는 이 모듈의 다음 단원에서 다룹니다.
이 단원에서는 Azure AI 언어 서비스의 기능 대부분을 다루지만 빠른 시작과 사용 가능한 모든 항목에 대한 전체 설명을 포함한 전체 목록을 보려면 Azure AI 언어 서비스 설명서를 참조하세요.
앱에서 이러한 기능을 사용하려면 쿼리를 적절한 엔드포인트로 보내야 합니다. 특정 기능을 쿼리하는 데 사용되는 엔드포인트는 다양하지만, 모든 엔드포인트에는 REST 요청을 빌드하거나 SDK를 사용하여 클라이언트를 정의할 때 Azure 계정에서 만든 Azure AI 언어 리소스가 접두사로 추가됩니다. 각각의 예는 다음 단원에서 확인할 수 있습니다.
사전 구성된 기능
Azure AI 언어 서비스는 모델 레이블 지정이나 학습 없이 특정 기능을 제공합니다. 리소스를 만든 후에는 데이터를 보내고 앱 내에서 반환된 결과를 사용할 수 있습니다.
다음 기능은 모두 미리 구성되어 있습니다.
요약
요약은 문서와 대화 모두에 사용할 수 있으며 입력의 의미를 캡슐화할 것으로 예측되는 주요 문장으로 텍스트를 요약합니다.
명명된 엔터티 인식
명명된 엔터티 인식은 사람, 장소 또는 회사와 같은 엔터티를 추출하고 식별할 수 있으므로 앱이 향상된 자연어 응답을 위해 다양한 유형의 엔터티를 인식할 수 있습니다. 예를 들어 “해안가 부두는 내가 가장 좋아하는 시애틀의 관광명소입니다”라는 텍스트에서 시애틀은 위치로 식별되고 분류됩니다.
PII(개인 식별 정보) 검색
PII 검색을 사용하면 메일 주소, 집 주소, IP 주소, 이름 및 보호된 건강 정보와 같이 중요한 것으로 간주될 수 있는 정보를 식별, 분류 및 수정할 수 있습니다. 예를 들어 텍스트 “email@contoso.com”이 쿼리에 포함된 경우 전체 메일 주소를 식별하고 수정할 수 있습니다.
핵심 문구 추출
핵심 구 추출은 제공된 텍스트에서 주요 개념을 빠르게 끌어오는 기능입니다. 예를 들어, "Text Analytics는 Azure AI 서비스의 기능 중 하나입니다."라는 텍스트가 있는 경우 서비스는 "Azure AI 서비스" 및 "Text Analytics"를 추출합니다.
정서 분석
감정 분석은 문자열 또는 문서가 얼마나 긍정적 또는 부정적인지 식별합니다. 예를 들어 “좋은 호텔입니다. 걸어서 갈 수 있는 많은 식당과 관광 명소가 가까이에 있습니다”라는 텍스트에서 서비스는 상대적으로 높은 신뢰도 점수로 긍정적이라고 식별할 것입니다.
언어 감지
언어 감지는 하나 이상의 문서를 사용하고 각각에 대한 언어를 식별합니다. 예를 들어 문서 중 하나의 텍스트가 “Bonjour”인 경우, 서비스는 이를 프랑스어로 식별합니다.
학습된 기능
학습된 기능을 사용하려면 애플리케이션에서 사용할 수 있도록 데이터에 레이블을 지정하고, 모델을 학습시키고, 배포해야 합니다. 이러한 기능을 사용하면 예측되거나 추출되는 정보를 사용자 지정할 수 있습니다.
참고
데이터 품질은 모델의 정확도에 큰 영향을 줍니다. 사용되는 데이터, 태그나 레이블이 얼마나 잘 지정되었는지의 정도, 학습 데이터의 다양성 등을 고려해야 합니다. 자세한 내용은 데이터 태그 지정에 대한 중요한 지침을 포함하는 데이터 레이블 지정에 대한 권장 조치를 참조하세요. 또한 모델에 개선이 필요한 학습에 도움을 주는 평가 메트릭도 참조하세요.
CLU(대화 언어 이해)
CLU는 Azure AI 언어가 제공하는 코어 사용자 지정 기능 중 하나입니다. CLU를 사용하면 사용자가 사용자 지정 자연어 이해 모델을 빌드하여 전반적인 의도를 예측하고 들어오는 발언에서 중요한 정보를 추출할 수 있습니다. CLU에 의도 및 엔터티를 정확하게 예측하는 방법을 가르치려면 사용자가 데이터에 태그를 지정해야 합니다.
이 모듈의 연습에서는 CLU 모델을 빌드하고 이를 앱에서 사용합니다.
사용자 지정 명명된 엔터티 인식
사용자 지정 엔터티 인식은 사용자 지정 레이블이 지정된 데이터를 가져와서 구조화되지 않은 텍스트에서 지정된 엔터티를 추출합니다. 예를 들어 관련 당사자를 추출하려는 다양한 계약 문서가 있는 경우 예측 방법을 인식하도록 모델을 학습시킬 수 있습니다.
사용자 지정 텍스트 분류
사용자 지정 텍스트 분류를 사용하면 텍스트 또는 문서를 사용자 지정 정의 그룹으로 분류할 수 있습니다. 예를 들어 뉴스 기사를 살펴보고 해당하는 범주(예: 뉴스 또는 엔터테인먼트)를 식별하도록 모델을 학습시킬 수 있습니다.
질문 답변
질문 답변은 주로 입력으로 제공된 질문에 대한 답변을 제공하는 미리 구성된 기능입니다. 이러한 질문에 대답할 데이터는 FAQ 또는 설명서와 같은 문서에서 제공됩니다.
예를 들어 일반적인 질문에 대답하기 위해 회사 웹 사이트에서 가상 채팅 도우미를 만들고 싶다고 가정해 보겠습니다. 회사 FAQ를 입력 문서로 사용하여 질문 및 답변 쌍을 만들 수 있습니다. 일단 배포되면 채팅 도우미가 서비스에 입력 질문을 전달하고 결과로 답변을 얻을 수 있습니다.
전체 기능 목록과 사용 방법은 Azure AI 언어 설명서를 참조하세요.