IidChangePointEstimator 클래스
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
적응형 커널 밀도 예측 및 마틴갈에 따라 독립적으로 동일하게 분산된(즉, d.d.) 시계열에서 신호 변경을 감지합니다.
public sealed class IidChangePointEstimator : Microsoft.ML.Data.TrivialEstimator<Microsoft.ML.Transforms.TimeSeries.IidChangePointDetector>
type IidChangePointEstimator = class
inherit TrivialEstimator<IidChangePointDetector>
Public NotInheritable Class IidChangePointEstimator
Inherits TrivialEstimator(Of IidChangePointDetector)
- 상속
설명
이 추정기를 만들려면 DetectIidChangePoint를 사용합니다.
입력 및 출력 열
입력 열이 하나만 있습니다. 입력 열은 값이 Single 시계열의 타임스탬프 값을 나타내는 위치여야 합니다Single.
요소가 4개인 벡터인 열을 생성합니다. 출력 벡터에는 경고 수준(0이 아닌 값은 변경 지점을 의미함), 점수, p-value 및 martingale 값이 순차적으로 포함됩니다.
예측 도구 특성
이 추정기는 매개 변수를 학습하기 위해 데이터를 확인해야 합니까? | 아니요 |
입력 열 데이터 형식 | Single |
출력 열 데이터 형식 | 의 4개 요소 벡터Double |
ONNX로 내보낼 수 있습니다. | 아니요 |
예측 도구 특성
기계 학습 작업 | 이상 감지 |
정규화가 필요한가요? | 아니요 |
캐싱이 필요한가요? | 아니요 |
Microsoft.ML 외에도 필요한 NuGet | Microsoft.ML.TimeSeries |
학습 알고리즘 세부 정보
이 트레이너는 시계열에서 수집된 데이터 요소가 동일한 배포(독립적으로 동일하게 분산됨)에서 독립적으로 샘플링된다고 가정합니다. 따라서 현재 타임스탬프의 값을 예상한 다음 타임스탬프의 값으로 볼 수 있습니다. 타임스탬프 $t-1$에서 관찰된 값이 $p$이면 $t$ 타임스탬프의 예측 값도 $p$입니다.
변칙 득점자
타임스탬프의 원시 점수가 계산되면 변칙 점수 구성 요소에 공급되어 해당 타임스탬프에서 최종 변칙 점수를 계산합니다. 이 득점선수에는 p-value와 martingale 점수의 두 가지 통계가 있습니다.
P-값 점수
p-value 점수는 원시 점수 분포에 따라 현재 계산된 원시 점수의 p-값을 나타냅니다. 여기서 분포는 가장 최근의 원시 점수 값을 기준으로 기록에서 특정 깊이까지 예측됩니다. 더 구체적으로, 이 분포는 적응 대역폭의 가우스 커널과 커널 밀도 추정을 사용하여 추정됩니다. p-value 점수는 항상 $[0, 1]$이며 값이 낮을수록 현재 지점이 이상값(스파이크라고도 함)일 가능성이 높습니다.
martingale 점수에 따른 변경 지점 검색
martingale 점수는 p-value 점수를 기반으로 하는 추가 점수 수준입니다. 이 아이디어는 i.i.d. 값 스트림에 대한 분포 변경을 감지하는 Exchangeability Martingales 를 기반으로 합니다. 즉, 작은 p-값 시퀀스가 행에서 감지되면 martingale 점수의 값이 크게 증가하기 시작합니다. 이는 기본 데이터 생성 프로세스의 배포 변경 사항을 나타냅니다. 따라서 마팅게일 점수는 변경 지점 검색에 사용됩니다. 가장 최근에 관찰된 p-값의 시퀀스인 $p 1, \dots, p_n$를 감안할 때 martingale 점수는 다음과 같이 계산됩니다. $s(p1, \dots, p_n) = \prod_{i=1}^n \beta(p_i)$. $\beta$의 두 가지 선택 항목이 있습니다. $\beta(p) = e p^{\epsilon - 1}$ for $0 < \epsilon < 1$ 또는 $\beta(p) = \int_{0}^1 \epsilon p^{\epsilon - 1} d\epsilon$.
martingle 점수가 $q_i=1 - \frac{\text{confidence}}{100}$인 $s(q_1, \dots, q_n)$를 초과하면 관련 타임스탬프가 변경 지점 검색에 대해 0이 아닌 경고 값을 가져올 수 있습니다. $\text{confidence}$는 DetectChangePointBySsa 또는 DetectIidChangePoint의 서명에 정의되어 있습니다.
사용 예제에 대한 링크는 참고 섹션을 참조하세요.
메서드
Fit(IDataView) |
적응형 커널 밀도 예측 및 마틴갈에 따라 독립적으로 동일하게 분산된(즉, d.d.) 시계열에서 신호 변경을 감지합니다. (다음에서 상속됨 TrivialEstimator<TTransformer>) |
GetOutputSchema(SchemaShape) |
변환기에서 SchemaShape 생성할 스키마를 반환합니다. 파이프라인에서 스키마 전파 및 확인에 사용됩니다. |
확장 메서드
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
추정기 체인에 '캐싱 검사점'을 추가합니다. 이렇게 하면 다운스트림 추정기가 캐시된 데이터에 대해 학습됩니다. 여러 데이터 전달을 수행하는 트레이너 앞에 캐싱 검사점을 두는 것이 유용합니다. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
추정기가 지정된 경우 대리자를 호출한 후 Fit(IDataView) 호출되는 래핑 개체를 반환합니다. 예측 도구가 적합한 항목에 대한 정보를 반환하는 것이 중요한 경우가 많습니다. 따라서 Fit(IDataView) 메서드는 일반 ITransformer개체가 아닌 특별히 형식화된 개체를 반환합니다. 그러나 동시에 IEstimator<TTransformer> 개체가 많은 파이프라인으로 형성되는 경우가 많으므로 변압기를 가져올 추정기가 이 체인의 어딘가에 묻혀 있는 위치를 통해 EstimatorChain<TLastTransformer> 추정기 체인을 빌드해야 할 수도 있습니다. 이 시나리오에서는 fit이 호출되면 호출되는 대리자를 이 메서드를 통해 연결할 수 있습니다. |