Text Analytics
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
이 문서에서는 Machine Learning Studio(클래식)에 포함된 텍스트 분석 모듈에 대해 설명합니다. 이러한 모듈은 다음을 포함하여 구조화된 텍스트와 구조화되지 않은 텍스트를 모두 사용하기 위한 특수 계산 도구를 제공합니다.
- 텍스트를 전처리하기 위한 여러 옵션입니다.
- 언어 감지.
- 사용자 지정 가능한 n-gram 사전을 사용하여 텍스트에서 기능 만들기
- 전처리 또는 고급 언어 분석 없이 텍스트를 효율적으로 분석하는 기능 해시입니다.
- Vowpal Wabbit, 텍스트에 대한 매우 빠른 기계 학습. Vowpal Wabbit는 기능 해시, LDA(토픽 모델링) 및 분류를 지원합니다.
- 구조화되지 않은 텍스트에서 사람, 장소 및 조직의 이름을 추출하는 명명된 엔터티 인식입니다.
예
Machine Learning 사용하는 텍스트 분석의 예는 Azure AI 갤러리를 참조하세요.
뉴스 분류: 기능 해시를 사용하여 문서를 미리 정의된 범주 목록으로 분류합니다.
유사한 회사 찾기: 위키백과 문서의 텍스트를 사용하여 회사를 분류합니다.
텍스트 분류: 감정 분석(5부 샘플)에서 Twitter 메시지의 텍스트를 사용하는 엔드 투 엔드 프로세스를 보여 줍니다.
모듈 목록
Machine Learning Studio(클래식)의 Text Analytics 범주에는 다음 모듈이 포함됩니다.
- 언어 검색: 입력 파일에서 각 줄의 언어를 검색합니다.
- 텍스트에서 핵심 구 추출: 지정된 텍스트에서 핵심 구를 추출합니다.
- 텍스트에서 N-Gram 기능 추출: N-Gram 사전 기능을 만들고 해당 기능을 선택합니다.
- 기능 해싱: Vowpal Wabbit 라이브러리를 사용하여 텍스트 데이터를 정수로 인코딩된 기능으로 변환합니다.
- 잠재 Dirichlet 할당: LDA용 Vowpal Wabbit 라이브러리를 사용하여 토픽 모델링을 수행합니다.
- 명명된 엔터티 인식: 텍스트 열에서 명명된 엔터티를 인식합니다.
- 텍스트 전처리: 텍스트에 대한 정리 작업을 수행합니다.
- Vowpal Wabbit 7-4 모델 점수 매기기: Vowpal Wabbit 기계 학습 시스템의 버전 7-4를 사용하여 Azure에서 입력 점수를 매깁니다.
- Vowpal Wabbit 7-10 모델 점수 매기기: Vowpal Wabbit 기계 학습 시스템의 버전 7-10을 사용하여 Azure에서 입력 점수를 매깁니다.
- Vowpal Wabbit 8 모델 점수 매기기: Vowpal Wabbit 기계 학습 시스템의 버전 8을 사용하여 Azure에서 입력 점수를 매깁니다.
- Vowpal Wabbit 7-4 모델 학습: Vowpal Wabbit 기계 학습 시스템의 버전 7-4를 사용하여 모델을 학습시킵니다.
- Vowpal Wabbit 7-10 모델 학습: Vowpal Wabbit 기계 학습 시스템의 버전 7-10을 사용하여 모델을 학습시킵니다.
- Vowpal Wabbit 8 모델 학습: Vowpal Wabbit 기계 학습 시스템의 버전 8을 사용하여 모델을 학습시킵니다.