다음을 통해 공유


데이터 변환

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

이 문서에서는 데이터 변환을 위해 Machine Learning Studio(클래식)에서 제공되는 모듈을 나열합니다. 기계 학습의 경우 데이터 변환에는 데이터 세트 조인 또는 열 이름 변경과 같은 매우 일반적인 작업이 수반됩니다. 그러나 정규화, 범주화 및 그룹화, 누락된 값 유추 등 기계 학습과 관련된 많은 작업도 포함됩니다.

참고

적용 대상: Machine Learning Studio(클래식) 전용

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

중요

Machine Learning Studio(클래식)에서 사용하는 데이터는 일반적으로 Machine Learning Studio(클래식)로 가져오기 전에 "깔끔한" 것으로 예상됩니다. 예를 들어 데이터 준비에는 데이터가 올바른 인코딩을 사용하는지 확인하고 데이터에 일관된 스키마가 있는지 확인하는 것이 포함될 수 있습니다.

데이터 변환을 위한 모듈은 다음 작업 기반 범주로 그룹화됩니다.

  • 디지털 신호 처리를 위한 필터 만들기: 디지털 신호 필터를 숫자 데이터에 적용하여 이미지 인식, 음성 인식 및 파형 분석과 같은 기계 학습 작업을 지원할 수 있습니다.
  • 개수 기반 기능 생성 및 사용: 카운트 기반 기능화 모듈은 기계 학습에 사용할 압축 기능을 개발하는 데 도움이 됩니다.
  • 일반 데이터 조작 및 준비: 데이터 세트 병합, 누락된 값 정리, 데이터 그룹화 및 요약, 열 이름 및 데이터 형식 변경 또는 레이블 또는 기능인 열을 나타냅니다.
  • 데이터 세트 샘플링 및 분할: 데이터를 학습 및 테스트 집합으로 나누거나, 데이터 세트를 백분율 또는 필터 조건으로 분할하거나, 샘플링을 수행합니다.
  • 데이터 크기 조정 및 감소: 정규화를 적용하거나 크기를 조정하여 분석을 위해 숫자 데이터를 준비합니다. 데이터를 그룹으로 비우거나, 이상값을 제거하거나 바꾸거나, PCA(보안 주체 구성 요소 분석)를 수행합니다.

모듈 목록

다음 모듈 범주는 데이터 변환 범주에 포함됩니다.

참고 항목