다음을 통해 공유


ML Studio(클래식) 모듈 설명

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

이 항목에서는 예측 모델을 쉽게 빌드하고 테스트할 수 있는 대화형 시각적 작업 영역인 Machine Learning Studio(클래식)에 포함된 모든 모듈에 대한 개요를 제공합니다.

참고

적용 대상: Machine Learning Studio(클래식)

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

모듈이란 무엇인가요?

Machine Learning Studio(클래식)에서 모듈은 실험을 만들기 위한 구성 요소입니다. 각 모듈은 작업 영역의 데이터에 대해 작동할 수 있는 특정 기계 학습 알고리즘, 함수 또는 코드 라이브러리를 캡슐화합니다. 모듈은 데이터를 공유하고 수정하기 위해 다른 모듈의 연결을 허용하도록 설계되었습니다.

각 모듈에서 실행되는 코드는 여러 소스에서 제공됩니다. 여기에는 오픈 소스 라이브러리 및 언어, Microsoft Research에서 개발한 알고리즘 및 Azure 및 기타 클라우드 서비스 작업을 위한 도구가 포함됩니다.

기계 학습 알고리즘을 찾고 계신가요? 의사 결정 트리, 클러스터링, 신경망 등에 대한 모듈이 포함된 Machine Learning 범주를 참조하세요. 학습평가 범주에는 모델을 학습하고 테스트하는 데 도움이 되는 모듈이 포함됩니다.

모듈을 연결하고 구성하면 외부 원본에서 데이터를 읽고, 분석을 위해 준비하고, 기계 학습 알고리즘을 적용하고, 결과를 생성하는 워크플로를 만들 수 있습니다.

실험이 Machine Learning Studio(클래식)에서 열리면 왼쪽 탐색 창에서 현재 모듈의 전체 목록을 볼 수 있습니다. 이러한 구성 요소를 실험으로 끌어서 연결하여 실험이라고 하는 완전한 기계 학습 워크플로를 만듭니다.

새 기능을 추가하거나 이전 코드를 제거하기 위해 모듈이 업데이트되는 경우도 있습니다. 이 경우 모듈을 사용하여 만든 모든 실험이 계속 실행됩니다. 하지만 다음에 실험을 열면 모듈을 업그레이드하거나 다른 모듈을 사용하라는 메시지가 표시됩니다.

전체 기계 학습 실험을 빌드하는 방법의 예는 다음 자습서를 참조하세요.

모듈 범주

관련 모듈을 더 쉽게 찾을 수 있도록 Machine Learning Studio(클래식)의 기계 학습 도구는 이러한 범주별로 그룹화됩니다.

데이터 형식 변환

이러한 모듈을 사용하여 다른 기계 학습 도구 또는 형식에 사용되는 형식 중 하나로 데이터를 변환합니다.

  • 데이터 입력 및 출력

    이러한 모듈을 사용하여 Hadoop 클러스터, Azure Table Storage 및 웹 URL을 비롯한 클라우드 데이터 원본에서 데이터 및 모델을 읽습니다. 이러한 모듈을 사용하여 스토리지 또는 데이터베이스에 결과를 쓸 수도 있습니다.

  • 데이터 변환

    이러한 모듈을 사용하여 분석을 위해 데이터를 준비합니다. 데이터 형식을 변경하고, 열을 기능 또는 레이블로 플래그를 지정하고, 기능을 생성하고, 데이터의 크기를 조정하거나 정규화할 수 있습니다.

  • Filter

    디지털 신호 처리에서 파생된 숫자 데이터를 변환합니다.

  • 개수가 있는 Learning

    공동 확률 분포를 사용하여 큰 데이터 세트를 간략하게 설명하는 기능을 빌드합니다.

  • 조작

    이 그룹은 데이터 과학을 위한 다양한 도구를 제공합니다. 예를 들어 누락된 값을 제거하거나 바꾸거나, 열의 하위 집합을 선택하거나, 열을 추가하거나, 두 데이터 세트를 연결할 수 있습니다.

  • 샘플링 및 분할

    데이터 세트를 조건 또는 크기로 나누어 학습 및 테스트 집합을 만들거나 특정 행을 격리합니다.

  • 확장 및 축소

    숫자 데이터를 변환합니다.

기능 선택

이러한 모듈을 사용하여 광범위하게 연구된 통계학적 방법론을 통해 데이터에서 최상의 기능을 식별할 수 있습니다.

Machine Learning

이 그룹에는 Machine Learning 지원하는 대부분의 기계 학습 알고리즘이 포함되어 있습니다.

또한 모델을 학습시키고, 점수를 생성하고, 모델 성능을 평가하여 알고리즘을 지원하기 위한 모듈도 포함되어 있습니다.

  • 평가

    모델을 학습한 후 이러한 도구를 사용하여 모델의 정확도를 측정합니다.

  • 초기화

    이러한 모듈은 매개 변수를 설정하여 사용자 지정할 수 있는 기계 학습 알고리즘을 제공합니다. 이 섹션의 알고리즘은 형식별로 그룹화됩니다.

  • 점수

    이러한 모듈을 사용하여 알고리즘을 통해 새 데이터를 전달하고 평가를 위한 결과 집합을 생성합니다. 또한 예측 서비스의 일부로 점수 매기기 결과를 사용할 수 있습니다.

  • 학습

    이러한 모듈은 사용자가 제공하는 데이터에 대해 초기화된 기계 학습 모델을 학습시킵니다.

OpenCV 라이브러리 모듈

이러한 모듈을 통해 이미지 처리 및 이미지 분류를 위해 널리 사용되는 오픈 소스 라이브러리에 쉽게 액세스할 수 있습니다.

R 언어 모듈

이러한 모듈을 사용하여 실험에 사용자 지정 R 코드를 추가하거나 R 패키지 기반 기계 학습 모델을 구현할 수 있습니다.

Python 언어 모듈

이러한 모듈을 사용하여 실험에 사용자 지정 Python 코드를 추가할 수 있습니다.

통계 함수

이러한 모듈을 사용하여 확률 분포를 계산하고, 사용자 지정 계산을 만들고, 숫자 변수 관련된 다양한 작업을 수행할 수 있습니다.

Text Analytics

이러한 모듈을 사용하여 기능 해시 및 명명된 엔터티 인식을 수행하거나 자연어 처리 도구를 사용하여 텍스트를 전처리합니다.

시계열

시계열 데이터를 위해 특별히 설계된 알고리즘을 사용하여 이러한 모듈을 사용하여 추세의 변칙을 평가합니다.

Machine Learning Studio(클래식) 모듈은 Azure Data Factory 같은 다른 도구에서 지원되는 데이터 통합 도구를 복제하려고 시도하지 않습니다. 대신, 모듈은 기계 학습과 관련된 기능을 제공합니다.

  • 데이터의 정규화, 그룹화 및 크기 조정
  • 데이터의 통계 분포 계산
  • 다른 기계 학습 형식으로 변환
  • 기계 학습 실험에 사용되는 데이터 가져오기 및 결과 내보내기
  • 텍스트 분석, 기능 선택 및 차원 감소

데이터 조작 및 스토리지를 위한 보다 정교한 기능이 필요한 경우 다음을 참조하세요.

  • Azure Data Factory: Enterprise 준비된 클라우드 데이터 처리 파이프라인입니다.
  • Azure SQL Database: 기계 학습에 대한 통합 액세스 권한이 있는 확장 가능한 스토리지입니다.
  • CosmosDB: NoSQL 데이터 저장소; 데이터를 Machine Learning Studio(클래식)로 가져옵니다.
  • Azure Data Lake Analytics: 빅 데이터에 대한 분산 분석입니다.
  • Stream Analytics: 사물 인터넷에 대한 이벤트 처리입니다.
  • Azure Text Analytics: 음성, 이미지 및 얼굴 인식을 위한 텍스트 처리 및 관련 Cognitive Services에 대한 여러 옵션입니다.
  • Azure Databricks: Spark 기반 분석 플랫폼.

참고 항목