OutputPortBinding 클래스
파이프라인 단계의 명명된 출력을 정의합니다.
OutputPortBinding을 사용하여 한 단계에서 생성할 데이터의 형식과 데이터를 생성하는 방법을 지정할 수 있습니다. InputPortBinding과 함께 사용하여 단계 출력이 다른 단계의 필수 입력임을 지정할 수 있습니다.
OutputPortBinding을 초기화합니다.
- 상속
-
builtins.objectOutputPortBinding
생성자
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
매개 변수
Name | Description |
---|---|
name
필수
|
문자, 숫자 및 밑줄만 포함할 수 있는 OutputPortBinding 개체의 이름입니다. |
datastore
|
PipelineData가 상주할 데이터 저장소입니다. Default value: None
|
output_name
|
None 이름이 사용되는 경우 출력의 이름입니다. 문자, 숫자 및 밑줄만 포함할 수 있습니다. Default value: None
|
bind_mode
|
생성 단계에서 "upload" 또는 "mount" 또는 "hdfs" 메서드를 사용하여 데이터에 액세스할지 여부를 지정합니다. Default value: mount
|
path_on_compute
|
"upload" 모드의 경우 모듈이 출력을 쓰는 경로입니다. Default value: None
|
is_directory
|
출력이 디렉터리인지 아니면 단일 파일인지 나타냅니다. Default value: None
|
overwrite
|
"upload" 모드의 경우 기존 데이터를 덮어쓸지 여부를 나타냅니다. Default value: None
|
data_type
|
선택 사항입니다. 데이터 형식을 사용하여 예상되는 출력 유형을 지정하고 소비 단계에서 데이터를 사용하는 방법을 자세히 설명할 수 있습니다. 모든 사용자 정의 문자열이 될 수 있습니다. Default value: None
|
pipeline_output_name
|
제공될 경우 이 출력은 PipelineRun.get_pipeline_output()을 사용하여 이용할 수 있습니다. 파이프라인 출력 이름은 파이프라인에서 고유해야 합니다. Default value: None
|
training_output
|
학습 결과에 대한 출력을 정의합니다. 이는 메트릭 및 모델과 같은 다양한 종류의 출력을 생성하는 특정 학습에만 필요합니다. 예를 들어 AutoMLStep은 메트릭 및 모델을 생성합니다. 최상의 모델을 얻는 데 사용되는 특정 학습 반복 또는 메트릭을 정의할 수도 있습니다. HyperDriveStep의 경우 출력에 포함할 특정 모델 파일을 정의할 수도 있습니다. Default value: None
|
dataset_registration
|
선택 사항입니다. 내부 매개 변수입니다. PipelineData.as_dataset을 대신 사용해야 합니다. Default value: None
|
dataset_output
|
선택 사항입니다. 내부 매개 변수입니다. OutputFileDatasetConfig를 대신 사용해야 합니다. Default value: None
|
name
필수
|
문자, 숫자 및 밑줄만 포함할 수 있는 OutputPortBinding 개체의 이름입니다. |
datastore
필수
|
PipelineData가 상주할 데이터 저장소입니다. |
output_name
필수
|
None 이름이 사용되는 경우 출력의 이름입니다. 문자, 숫자 및 밑줄만 포함할 수 있습니다. |
bind_mode
필수
|
생성 단계에서 "upload" 또는 "mount" 또는 "hdfs" 메서드를 사용하여 데이터에 액세스할지 여부를 지정합니다. |
path_on_compute
필수
|
"upload" 모드의 경우 모듈이 출력을 쓰는 경로입니다. |
is_directory
필수
|
출력이 디렉터리인 경우 |
overwrite
필수
|
"upload" 모드의 경우 기존 데이터를 덮어쓸지 여부를 나타냅니다. |
data_type
필수
|
선택 사항입니다. 데이터 형식을 사용하여 예상되는 출력 유형을 지정하고 소비 단계에서 데이터를 사용하는 방법을 자세히 설명할 수 있습니다. 모든 사용자 정의 문자열이 될 수 있습니다. |
pipeline_output_name
필수
|
제공될 경우 이 출력은 PipelineRun.get_pipeline_output()을 사용하여 이용할 수 있습니다. 파이프라인 출력 이름은 파이프라인에서 고유해야 합니다. |
training_output
필수
|
학습 결과에 대한 출력을 정의합니다. 이는 메트릭 및 모델과 같은 다양한 종류의 출력을 생성하는 특정 학습에만 필요합니다. 예를 들어 AutoMLStep은 메트릭 및 모델을 생성합니다. 최상의 모델을 얻는 데 사용되는 특정 학습 반복 또는 메트릭을 정의할 수도 있습니다. HyperDriveStep의 경우 출력에 포함할 특정 모델 파일을 정의할 수도 있습니다. |
dataset_registration
필수
|
선택 사항입니다. 내부 매개 변수입니다. PipelineData.as_dataset을 대신 사용해야 합니다. |
dataset_output
필수
|
선택 사항입니다. 내부 매개 변수입니다. OutputFileDatasetConfig를 대신 사용해야 합니다. |
설명
OutputPortBinding은 파이프라인을 빌드하여 단계 입력 및 출력을 지정할 때 PipelineData와 비슷한 방식으로 사용할 수 있습니다. 차이점은 다른 단계에 대한 입력으로 사용하려면 OutputPortBinding를 InputPortBinding과 함께 사용해야 한다는 것입니다.
OutputPortBinding을 사용하여 파이프라인을 생성하는 예제는 다음과 같습니다.
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
이렇게 하면 두 단계로 파이프라인이 만들어집니다. 프로세스 단계가 실행되고 완료된 다음, 학습 단계가 실행됩니다. Azure ML은 OutputPortBinding 개체에 설명된 대로 프로세스 단계에서 생성된 출력을 학습 단계에 제공합니다.
특성
bind_mode
data_type
dataset_registration
datastore
PipelineData가 상주할 데이터 저장소입니다.
반환
형식 | Description |
---|---|
데이터 저장소 개체입니다. |