ForecastingPipelineWrapperBase Classe
Classe base para wrapper de modelo de previsão.
- Herança
-
ForecastingPipelineWrapperBase
Construtor
ForecastingPipelineWrapperBase(ts_transformer: TimeSeriesTransformer | None = None, y_transformer: Pipeline | None = None, metadata: Dict[str, Any] | None = None)
Parâmetros
Nome | Description |
---|---|
ts_transformer
|
Valor padrão: None
|
y_transformer
|
Valor padrão: None
|
metadata
|
Valor padrão: None
|
Métodos
align_output_to_input |
Alinhar o quadro de dados de saída transformado ao quadro de dados de entrada. Observação: o quadro transformado será modificado por referência; nenhuma cópia é criada. :param X_input: o quadro de dados de entrada. :param transformed: o quadro de dados após a transformação. :returns: o quadro de dados transformado com o índice original, mas classificado como em X_input. |
fit |
Ajuste o modelo com entrada X e y. |
forecast |
Fazer previsão no quadro de dados X_pred. |
forecast_quantiles |
Obter a previsão e os quantis do pipeline ajustado. |
is_grain_dropped |
Retornar true se a granularidade for descartada. |
preaggregate_data_set |
Agregar o conjunto de dados de previsão. Observação: esse método não garante que o conjunto de dados será agregado. Isso ocorrerá somente se o conjunto de dados contiver carimbos de data/hora duplicados ou fora das datas de grade. :param df: o conjunto de dados a ser agregado. :patam y: os valores de destino. :param is_training_set: se true, os dados representam o conjunto de treinamento. :return: o conjunto de dados agregado ou intacto se nenhuma agregação for necessária. |
preprocess_pred_X_y |
Pré-processar previsão X e y. |
rolling_evaluation |
"Produzir previsões em uma origem contínua com relação ao conjunto de testes fornecido. Cada iteração faz uma previsão para os próximos períodos 'max_horizon' em relação à origem atual e, em seguida, avança a origem pela duração do horizonte. O contexto de cada previsão é definido para que o previsor use os valores de destino reais anteriores ao horário da origem atual para criar os recursos de atraso. Essa função retorna um quadro de dados concatenado de previsões contínuas unidas aos dados reais do conjunto de teste. Esse método foi preterido e será removido em uma versão futura. Em vez disso, use rolling_forecast(). |
rolling_forecast |
Produza previsões em uma origem sem interrupção em um conjunto de testes. Cada iteração faz uma previsão de períodos máximos de horizonte à frente usando informações até a origem atual e, em seguida, avança a origem por períodos de tempo de "etapa". O contexto de previsão para cada previsão é definido para que o preditor use os valores de destino reais antes do tempo de origem atual para construir recursos de pesquisa. Essa função retorna um DataFrame de previsões sem interrupção unidas aos reais do conjunto de testes. As colunas no quadro de dados retornado são as seguintes:
|
short_grain_handling |
Retornar true se a manipulação de granularidades curtas ou ausentes estiver habilitada para o modelo. |
static_preaggregate_data_set |
Agregar o conjunto de dados de previsão. Observação: esse método não garante que o conjunto de dados será agregado. Isso ocorrerá somente se o conjunto de dados contiver carimbos de data/hora duplicados ou fora das datas de grade. :param ts_transformer: o transformador de série temporal usado para o treinamento. :param time_column_name: nome da coluna de tempo. :param grain_column_names: lista de nomes de colunas de granularidade. :param df: o conjunto de dados a ser agregado. :patam y: os valores de destino. :param is_training_set: se true, os dados representam o conjunto de treinamento. :return: o conjunto de dados agregado ou intacto se nenhuma agregação for necessária. |
align_output_to_input
Alinhar o quadro de dados de saída transformado ao quadro de dados de entrada.
Observação: o quadro transformado será modificado por referência; nenhuma cópia é criada. :param X_input: o quadro de dados de entrada. :param transformed: o quadro de dados após a transformação. :returns: o quadro de dados transformado com o índice original, mas classificado como em X_input.
align_output_to_input(X_input: DataFrame, transformed: DataFrame) -> DataFrame
Parâmetros
Nome | Description |
---|---|
X_input
Obrigatório
|
|
transformed
Obrigatório
|
|
fit
Ajuste o modelo com entrada X e y.
fit(X: DataFrame, y: ndarray) -> ForecastingPipelineWrapperBase
Parâmetros
Nome | Description |
---|---|
X
Obrigatório
|
Dados X de entrada. |
y
Obrigatório
|
Dados de entrada y. |
forecast
Fazer previsão no quadro de dados X_pred.
forecast(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, forecast_destination: Timestamp | None = None, ignore_data_errors: bool = False) -> Tuple[ndarray, DataFrame]
Parâmetros
Nome | Description |
---|---|
X_pred
|
o quadro de dados de previsão que combina X_past e X_future de forma contínua. Os valores vazios em X_pred serão imputados. Valor padrão: None
|
y_pred
|
o valor de destino que combina os valores definitivos para y_past e os valores ausentes para Y_future. Se Nenhum, as previsões serão feitas para cada X_pred. Valor padrão: None
|
forecast_destination
|
<xref:pandas.Timestamp>
Forecast_destination: um valor de carimbo de data/hora. As previsões serão feitas até o tempo de previsão_destino, para todas as granularidades. Entrada do dicionário {granularidade - > carimbo de data/hora} não será aceita. Se forecast_destination não for fornecido, será imputado como a última vez que ocorrer em X_pred para cada granularidade. Valor padrão: None
|
ignore_data_errors
|
Ignorar erros nos dados do usuário. Valor padrão: False
|
Retornos
Tipo | Description |
---|---|
Y_pred, com o subquadro correspondente a Y_future preenchido com as respectivas previsões. Todos os valores ausentes em Y_past serão preenchidos pelo imputador. |
forecast_quantiles
Obter a previsão e os quantis do pipeline ajustado.
forecast_quantiles(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, quantiles: float | List[float] | None = None, forecast_destination: Timestamp | None = None, ignore_data_errors: bool = False) -> DataFrame
Parâmetros
Nome | Description |
---|---|
X_pred
|
o quadro de dados de previsão que combina X_past e X_future de forma contínua. Os valores vazios em X_pred serão imputados. Valor padrão: None
|
y_pred
|
o valor de destino que combina os valores definitivos para y_past e os valores ausentes para Y_future. Se Nenhum, as previsões serão feitas para cada X_pred. Valor padrão: None
|
quantiles
|
A lista de quantiles em que queremos prever. Valor padrão: None
|
forecast_destination
|
<xref:pandas.Timestamp>
Forecast_destination: um valor de carimbo de data/hora. As previsões serão feitas até o tempo de previsão_destino, para todas as granularidades. Entrada do dicionário {granularidade - > carimbo de data/hora} não será aceita. Se forecast_destination não for fornecido, será imputado como a última vez que ocorrer em X_pred para cada granularidade. Valor padrão: None
|
ignore_data_errors
|
Ignorar erros nos dados do usuário. Valor padrão: False
|
Retornos
Tipo | Description |
---|---|
Um dataframe que contém as colunas e previsões feitas em quantiles solicitados. |
is_grain_dropped
Retornar true se a granularidade for descartada.
is_grain_dropped(grain: Tuple[str] | str | List[str]) -> bool
Parâmetros
Nome | Description |
---|---|
grain
Obrigatório
|
A granularidade a ser testada quanto ao descarte. |
Retornos
Tipo | Description |
---|---|
True se a granularidade for descartada. |
preaggregate_data_set
Agregar o conjunto de dados de previsão.
Observação: esse método não garante que o conjunto de dados será agregado. Isso ocorrerá somente se o conjunto de dados contiver carimbos de data/hora duplicados ou fora das datas de grade. :param df: o conjunto de dados a ser agregado. :patam y: os valores de destino. :param is_training_set: se true, os dados representam o conjunto de treinamento. :return: o conjunto de dados agregado ou intacto se nenhuma agregação for necessária.
preaggregate_data_set(df: DataFrame, y: ndarray | None = None, is_training_set: bool = False) -> Tuple[DataFrame, ndarray | None]
Parâmetros
Nome | Description |
---|---|
df
Obrigatório
|
|
y
|
Valor padrão: None
|
is_training_set
|
Valor padrão: False
|
preprocess_pred_X_y
Pré-processar previsão X e y.
preprocess_pred_X_y(X_pred: DataFrame | None = None, y_pred: ndarray | DataFrame | None = None, forecast_destination: Timestamp | None = None) -> Tuple[DataFrame, DataFrame | ndarray, Dict[str, Any]]
Parâmetros
Nome | Description |
---|---|
X_pred
|
Valor padrão: None
|
y_pred
|
Valor padrão: None
|
forecast_destination
|
Valor padrão: None
|
rolling_evaluation
"Produzir previsões em uma origem contínua com relação ao conjunto de testes fornecido.
Cada iteração faz uma previsão para os próximos períodos 'max_horizon' em relação à origem atual e, em seguida, avança a origem pela duração do horizonte. O contexto de cada previsão é definido para que o previsor use os valores de destino reais anteriores ao horário da origem atual para criar os recursos de atraso.
Essa função retorna um quadro de dados concatenado de previsões contínuas unidas aos dados reais do conjunto de teste.
Esse método foi preterido e será removido em uma versão futura. Em vez disso, use rolling_forecast().
rolling_evaluation(X_pred: DataFrame, y_pred: DataFrame | ndarray, ignore_data_errors: bool = False) -> Tuple[ndarray, DataFrame]
Parâmetros
Nome | Description |
---|---|
X_pred
Obrigatório
|
o quadro de dados de previsão que combina X_past e X_future de forma contínua. Os valores vazios em X_pred serão imputados. |
y_pred
Obrigatório
|
o valor de destino correspondente a X_pred. |
ignore_data_errors
|
Ignorar erros nos dados do usuário. Valor padrão: False
|
Retornos
Tipo | Description |
---|---|
Y_pred, com o subquadro correspondente a Y_future preenchido com as respectivas previsões. Todos os valores ausentes em Y_past serão preenchidos pelo imputador. |
rolling_forecast
Produza previsões em uma origem sem interrupção em um conjunto de testes.
Cada iteração faz uma previsão de períodos máximos de horizonte à frente usando informações até a origem atual e, em seguida, avança a origem por períodos de tempo de "etapa". O contexto de previsão para cada previsão é definido para que o preditor use os valores de destino reais antes do tempo de origem atual para construir recursos de pesquisa.
Essa função retorna um DataFrame de previsões sem interrupção unidas aos reais do conjunto de testes. As colunas no quadro de dados retornado são as seguintes:
Colunas de ID de timeseries (opcional). Quando fornecido pelo usuário, os nomes de coluna fornecidos serão usados.
Coluna de origem de previsão que dá o tempo de origem para cada linha.
Nome da coluna: armazenado como a variável de membro do objeto forecast_origin_column_name.
Coluna de tempo. O nome da coluna fornecido pelo usuário será usado.
Coluna de valores de previsão. Nome da coluna: armazenado como o membro do objeto forecast_column_name
Coluna valores reais. Nome da coluna: armazenado como o membro do objeto actual_column_name
rolling_forecast(X_pred: DataFrame, y_pred: ndarray, step: int = 1, ignore_data_errors: bool = False) -> DataFrame
Parâmetros
Nome | Description |
---|---|
X_pred
Obrigatório
|
<xref:pd.DataFrame>
Quadro de dados de previsão |
y_pred
Obrigatório
|
<xref:np.ndarray>
valores de destino correspondentes a linhas no X_pred |
step
|
Número de períodos para avançar a janela de previsão em cada iteração. Valor padrão: 1
|
ignore_data_errors
|
Ignorar erros nos dados do usuário. Valor padrão: False
|
Retornos
Tipo | Description |
---|---|
<xref:pd.DataFrame>
|
Quadro de dados de previsões sem interrupção |
short_grain_handling
Retornar true se a manipulação de granularidades curtas ou ausentes estiver habilitada para o modelo.
short_grain_handling() -> bool
static_preaggregate_data_set
Agregar o conjunto de dados de previsão.
Observação: esse método não garante que o conjunto de dados será agregado. Isso ocorrerá somente se o conjunto de dados contiver carimbos de data/hora duplicados ou fora das datas de grade. :param ts_transformer: o transformador de série temporal usado para o treinamento. :param time_column_name: nome da coluna de tempo. :param grain_column_names: lista de nomes de colunas de granularidade. :param df: o conjunto de dados a ser agregado. :patam y: os valores de destino. :param is_training_set: se true, os dados representam o conjunto de treinamento. :return: o conjunto de dados agregado ou intacto se nenhuma agregação for necessária.
static static_preaggregate_data_set(ts_transformer: TimeSeriesTransformer, time_column_name: str, grain_column_names: List[str], df: DataFrame, y: ndarray | None = None, is_training_set: bool = False) -> Tuple[DataFrame, ndarray | None]
Parâmetros
Nome | Description |
---|---|
ts_transformer
Obrigatório
|
|
time_column_name
Obrigatório
|
|
grain_column_names
Obrigatório
|
|
df
Obrigatório
|
|
y
|
Valor padrão: None
|
is_training_set
|
Valor padrão: False
|
Atributos
actual_column_name
forecast_column_name
forecast_origin_column_name
grain_column_list
max_horizon
Retornar horizonte máximo usado no modelo.
origin_col_name
Retornar o nome da coluna de origem.
target_lags
Retornar os atrasos de destino, se houver.
target_rolling_window_size
Retornar o tamanho da janela com rolagem.
time_column_name
Retornar o nome da coluna de tempo.
user_target_column_name
y_max_dict
Retornar o dicionário com valores de destino máximos por ID de série temporal
y_min_dict
Retornar o dicionário com valores de destino mínimos por ID de série temporal
FATAL_NO_TARGET_IMPUTER
FATAL_NO_TARGET_IMPUTER = 'No target imputers were found in TimeSeriesTransformer.'
FATAL_NO_TS_TRANSFORM
FATAL_NO_TS_TRANSFORM = 'The time series transform is absent. Please try training model again.'