이동 평균 필터
중요
Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.
2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.
- ML Studio(클래식)에서 Azure Machine Learning으로 기계 학습 프로젝트 이동에 대한 정보를 참조하세요.
- Azure Machine Learning에 대한 자세한 정보.
ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.
추세 분석에 사용할 데이터를 부드럽게 만드는 데 사용되는 이동 평균 필터를 만듭니다.
범주: 데이터 변환/필터
모듈 개요
이 문서에서는 Machine Learning Studio(클래식)에서 이동 평균 필터 모듈을 사용하여 지정한 창 길이를 사용하여 데이터 세트에 대한 일련의 일방적 또는 양면 평균을 계산하는 방법을 설명합니다.
요구 사항을 충족하는 필터를 정의한 후 필터 적용 모듈에 연결하여 데이터 세트의 선택한 열에 적용 할 수 있습니다. 모듈은 모든 계산을 수행하고 숫자 열 내의 값을 해당 이동 평균으로 바꿉니다.
생성된 이동 평균을 그리기 및 시각화에 사용하거나, 모델링을 위한 새로운 부드러운 기준으로 사용하거나, 비슷한 기간의 계산에 대한 차이를 계산하는 등의 작업에 사용할 수 있습니다.
팁
데이터 세트에서 데이터를 필터링하거나 누락된 값을 제거해야 합니까? 대신 다음 모듈을 사용합니다.
- 누락된 데이터 정리: 이 모듈을 사용하여 누락된 값을 제거하거나 누락된 값을 자리 표시자로 바꿉 있습니다.
- 파티션 및 샘플: 이 모듈을 사용하여 날짜 범위, 특정 값 또는 정규식과 같은 기준으로 데이터 세트를 나누거나 필터링합니다.
- 클립 값: 이 모듈을 사용하여 범위를 설정하고 해당 범위 내에 값만 유지합니다.
이동 평균 이해 및 사용
이러한 유형의 평균은 회고 및 실시간 데이터에서 유용한 일시적 패턴을 나타내고 예측하는 데 도움이 됩니다. 가장 단순한 유형의 이동 평균은 계열의 일부 샘플에서 시작하고, 실제 값 대신 해당 위치와 이전의 n개 위치를 더한 값의 평균을 사용합니다. (원하는 대로 n을 정의할 수 있습니다.) 평균이 계산되는 기간 n이 길어질수록 값 간에 분산이 줄어듭니다. 또한 사용되는 값의 수를 늘리면 생성되는 평균에 미치는 단일 값의 영향이 적어집니다.
이동 평균은 단면 또는 양면일 수 있습니다. 단면 평균에서는 인덱스 값 이전의 값만 사용됩니다. 양면 평균에서는 이전 및 이후 값이 사용됩니다.
스트리밍 데이터를 읽고 있는 경우 누적 및 가중 이동 평균이 특히 유용합니다. 누적 이동 평균은 현재 기간 이전의 요소를 고려합니다.
평균을 계산할 때 모든 데이터 요소에 균일하게 가중치를 부여하거나, 현재 데이터 요소에 가까운 값일수록 가중치가 높게 부여되도록 할 수 있습니다. 가중 이동 평균에서 모든 가중치의 합계는 1이어야 합니다.
지수 이동 평균에서 평균은 가중치가 부여될 수 있는 앞면과 뒷면으로 구성됩니다. 가중치가 낮게 부여된 뒷면은 뒷면이 앞면을 매우 가깝게 뒤따름을 의미하므로 평균은 짧은 가중치 부여 기간에서 이동 평균처럼 동작합니다. 뒷면 가중치가 높아지면 평균은 더욱 긴 단순 이동 평균처럼 동작합니다.
이동 평균 필터를 구성하는 방법
실험에 이동 평균 필터 모듈을 추가합니다. 데이터 변환의 필터 범주에서 이 모듈을 찾을 수 있습니다.
Length의 경우 필터가 적용되는 창의 총 크기를 정의하는 양수 값을 입력합니다. 이를 필터 마스크라고도 하며, 이동 평균의 경우 필터 길이에 따라 슬라이딩 윈도우의 평균 값이 결정됩니다.
더 긴 필터는 더 높은 순서 필터라고도 하며, 더 큰 계산 창과 추세선의 근사치를 제공합니다.
더 짧거나 낮은 순서 필터는 더 작은 계산 창을 사용하며 원래 데이터와 더 유사합니다.
형식의 경우 적용할 이동 평균 유형을 선택합니다.
Machine Learning Studio(클래식)는 다음과 같은 유형의 이동 평균 계산을 지원합니다.
단순: 단순 이동 평균(SMA)은 비중이 없는 롤링 평균으로 계산됩니다.
삼각형: TMA(삼각형 이동 평균)는 더 부드러운 추세선에 대해 두 번 평균됩니다. 삼각형이라는 단어는 중앙 값을 강조하는 데이터에 적용되는 가중치의 모양에서 파생됩니다.
지수 단순: 지수 이동 평균(EMA)은 가장 최근 데이터에 더 많은 가중치를 부여합니다. 가중치는 지수 방식으로 낮아집니다.
지수: 수정된 지수 이동 평균은 실행 중인 이동 평균을 계산합니다. 여기서 한 지점에서 이동 평균을 계산하면 이전의 모든 지점에서 이전에 계산한 이동 평균을 고려합니다. 이 메서드는 더 부드러운 추세선을 생성합니다.
누적: 단일 지점과 현재 이동 평균을 감안할 때 CMA(누적 이동 평균)는 현재 지점에서 이동 평균을 계산합니다.
이동 평균을 계산할 값이 있는 데이터 세트를 추가하고 필터 적용 모듈을 추가합니다.
이동 평균 필터를 필터 적용의 왼쪽 입력으로 커넥트 데이터 세트를 오른쪽 입력에 연결합니다.
필터 적용 모듈에서 열 선택기를 사용하여 필터를 적용할 열을 지정합니다. 기본적으로 필터 변환은 모든 숫자 열에 적용되므로 적절한 데이터가 없는 열은 제외해야 합니다.
실험을 실행합니다.
필터 길이 매개 변수로 정의된 각 값 집합에 대해 현재(또는 인덱스) 값이 이동 평균 값으로 바뀝니다.
예
기계 학습에서 필터를 사용하는 방법에 대한 예제는 Azure AI 갤러리에서 다음 실험을 참조하세요.
- 필터: 이 실험에서는 엔지니어링된 파형 데이터 세트를 사용하여 모든 필터 형식을 보여 줍니다.
모듈 매개 변수
이름 | 범위 | Type | 기본값 | Description |
---|---|---|---|---|
길이 | >=1 | 정수 | 5 | 이동 평균 기간의 길이를 설정합니다. |
Type | 모두 | MovingAverageType | 작성할 이동 평균의 유형을 지정합니다. |
출력
이름 | Type | Description |
---|---|---|
Assert | IFilter 인터페이스 | 필터 구현입니다. |