automl 套件
包含 Azure Machine Learning SDKv2 的自動化機器學習類別。
主要區域包括管理 AutoML 工作。
類別
ClassificationJob |
AutoML 分類作業的設定。 初始化新的 AutoML 分類工作。 |
ColumnTransformer |
資料行轉換程式設定。 |
ForecastingJob |
AutoML 預測工作的設定。 初始化新的 AutoML 預測工作。 |
ForecastingSettings |
AutoML 作業的預測設定。 |
ImageClassificationJob |
AutoML 多類別影像分類作業的設定。 初始化新的 AutoML 多類別影像分類作業。 |
ImageClassificationMultilabelJob |
AutoML 多標籤影像分類作業的設定。 初始化新的 AutoML 多標籤影像分類作業。 |
ImageClassificationSearchSpace |
AutoML 影像分類和影像分類多標籤工作的搜尋空間。 |
ImageInstanceSegmentationJob |
AutoML 映射實例分割作業的設定。 初始化新的 AutoML 映射實例分割作業。 |
ImageLimitSettings |
限制 AutoML 影像垂直設定。 ImageLimitSettings 是包含下列參數的類別:max_concurrent_trials、max_trials和timeout_minutes。 這是選擇性的組態方法,可用來設定限制參數,例如逾時等。 注意 同時執行之數目會受限於指定計算目標中的可用資源。 請確保計算目標有資源可用於所需的並行作業。 提示 最好讓max_concurrent_trials計數與叢集中的節點數目相符。 例如,如果您有具有 4 個節點的叢集,請將 max_concurrent_trials 設定為 4。 使用方式範例 ImageLimitSettings 的設定
初始化 ImageLimitSettings 物件。 AutoML 影像垂直的 ImageLimitSettings 建構函式。 |
ImageModelSettingsClassification |
AutoML 影像分類工作的模型設定。 |
ImageModelSettingsObjectDetection |
AutoML 影像物件偵測工作的模型設定。 |
ImageObjectDetectionJob |
AutoML 影像物件偵測作業的組態。 初始化新的 AutoML 影像物件偵測作業。 |
ImageObjectDetectionSearchSpace |
AutoML 影像物件偵測和影像實例分割工作的搜尋空間。 |
ImageSweepSettings |
所有 AutoML 影像垂直的掃掠設定。 |
NlpFeaturizationSettings |
所有 AutoML NLP Verticals 的特徵化設定。 |
NlpFixedParameters |
物件,可存放 NLP 作業的固定參數。 |
NlpLimitSettings |
限制所有 AutoML NLP Verticals 的設定。 |
NlpSearchSpace |
AutoML NLP 工作的搜尋空間。 |
NlpSweepSettings |
所有 AutoML NLP 工作的掃掠設定。 |
RegressionJob |
AutoML 回歸作業的組態。 初始化新的 AutoML 回歸工作。 |
SearchSpace |
AutoML 垂直的 SearchSpace 類別。 |
StackEnsembleSettings |
預先設定以自訂 StackEnsemble 執行。 |
TabularFeaturizationSettings |
AutoML 作業的特徵化設定。 |
TabularLimitSettings |
限制 AutoML 資料表垂直設定。 |
TextClassificationJob |
AutoML 文字分類作業的設定。 初始化新的 AutoML 文字分類工作。 |
TextClassificationMultilabelJob |
AutoML 文字分類多標籤作業的設定。 初始化新的 AutoML 文字分類多標籤工作。 |
TextNerJob |
AutoML 文字 NER 作業的設定。 初始化新的 AutoML 文字 NER 工作。 |
TrainingSettings |
Azure Machine Learning 的 TrainingSettings 類別。 Azure Machine Learning 的 TrainingSettings 類別。 |
列舉
BlockedTransformers |
AutoML 支援的所有分類模型列舉。 |
ClassificationModels |
AutoML 支援的所有分類模型列舉。 |
ClassificationMultilabelPrimaryMetrics |
分類多標籤工作的主要計量。 |
ClassificationPrimaryMetrics |
分類工作的主要計量。 |
FeaturizationMode |
特徵化模式 - 決定資料特徵化模式。 |
ForecastHorizonMode |
列舉,以判斷預測範圍選取模式。 |
ForecastingModels |
AutoML 支援的所有預測模型列舉。 |
ForecastingPrimaryMetrics |
預測工作的主要計量。 |
InstanceSegmentationPrimaryMetrics |
InstanceSegmentation 工作的主要計量。 |
LearningRateScheduler |
學習速率排程器列舉。 |
LogTrainingMetrics |
包含 Azure Machine Learning SDKv2 的自動化機器學習類別。 主要區域包括管理 AutoML 工作。 |
LogValidationLoss |
包含 Azure Machine Learning SDKv2 的自動化機器學習類別。 主要區域包括管理 AutoML 工作。 |
NCrossValidationsMode |
決定如何判斷 N-Cross 驗證值。 |
ObjectDetectionPrimaryMetrics |
Image ObjectDetection 工作的主要計量。 |
RegressionModels |
AutoML 支援的所有回歸模型列舉。 |
RegressionPrimaryMetrics |
回歸工作的主要計量。 |
SamplingAlgorithmType |
包含 Azure Machine Learning SDKv2 的自動化機器學習類別。 主要區域包括管理 AutoML 工作。 |
ShortSeriesHandlingConfiguration |
參數,定義 AutoML 是否應該處理簡短的時間序列。 |
StochasticOptimizer |
影像模型的隨機優化器。 |
TargetAggregationFunction |
目標彙總函式。 |
TargetLagsMode |
目標延隔選取模式。 |
TargetRollingWindowSizeMode |
目標滾動視窗大小模式。 |
UseStl |
設定時間序列目標資料行的 STL 分解。 |
ValidationMetricType |
用於映射工作中驗證計量的計量計算方法。 |
函數
classification
用來建立 ClassificationJob 的函式。
分類作業可用來定型最適合預測資料樣本類別的模型。 各種模型都是使用定型資料來定型。 根據主要計量,在驗證資料上具有最佳效能的模型會選取為最終模型。
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
參數
- training_data
- Input
實驗中使用的定型資料。 它應該同時包含訓練功能和標籤資料行 (範例加權資料行) 。
- target_column_name
- str
標籤資料行的名稱。
此參數適用于 training_data
、 validation_data
和 test_data
參數
- primary_metric
自動化 Machine Learning 將針對模型選取進行優化的計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric 。
可接受的值:精確度、AUC_weighted、norm_macro_recall、average_precision_score_weighted和precision_score_weighted精確度預設值
- enable_model_explainability
- bool
是否要在所有 AutoML 定型反復專案結束時啟用說明最佳 AutoML 模型。 預設值為 None。 如需詳細資訊,請參閱 自動化機器學習中的解譯性:模型說明。
- weight_column_name
- str
範例加權資料行的名稱。 自動化 ML 支援加權資料行做為輸入,導致資料中的資料列向上或向下加權。 如果輸入資料來自 pandas。沒有資料行名稱的資料框架,可以改用資料行索引,以整數表示。
此參數適用于 training_data
和 validation_data
參數
- validation_data_size
- float
未指定使用者驗證資料時,要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間,非包含。
指定 validation_data
以提供驗證資料,否則請設定 n_cross_validations
或 validation_data_size
從指定的定型資料擷取驗證資料。
針對自訂交叉驗證折迭,請使用 cv_split_column_names
。
如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證。
預設值為 None
未指定使用者驗證資料時要執行的交叉驗證數目。
指定 validation_data
以提供驗證資料,否則請設定 n_cross_validations
或 validation_data_size
,以從指定的定型資料中擷取驗證資料。
針對自訂交叉驗證折迭,請使用 cv_split_column_names
。
如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證。
預設值為 None
包含自訂交叉驗證分割之資料行的名稱清單。 每個 CV 分割資料行都代表一個 CV 分割,其中每個資料列都標示為 1 以進行定型或 0 進行驗證。
預設值為 None
- test_data
- Input
使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要用於測試回合的測試資料,將在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。
如果未指定此參數或 參數, test_data_size
則模型定型完成後,將不會自動執行任何測試回合。
測試資料應該同時包含功能和標籤資料行。
如果 test_data
已指定 , target_column_name
則必須指定 參數。
預設值為 None
- test_data_size
- float
使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要保留測試回合之測試資料的定型資料分數,這些測試回合會在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。
這應該介於 0.0 到 1.0 之間。
如果 test_data_size
同時指定 為 validation_data_size
,則在分割驗證資料之前,會先 training_data
分割測試資料。
例如,如果 validation_data_size=0.1
和 test_data_size=0.1
原始定型資料有 1000 個數據列,則測試資料會有 100 個數據列,驗證資料將包含 90 個數據列,而定型資料會有 810 個數據列。
針對回歸型工作,會使用隨機取樣。 針對分類工作,會使用分層取樣。 預測目前不支援使用定型/測試分割來指定測試資料集。
如果未指定此參數或 參數, test_data
則模型定型完成後,將不會自動執行任何測試回合。
預設值為 None
傳回
可提交至 Azure ML 計算以執行的工作物件。
傳回類型
forecasting
用來建立預測工作的函式。
預測工作是用來根據歷史資料預測未來時段的目標值。 各種模型都是使用定型資料來定型。 根據主要計量,在驗證資料上具有最佳效能的模型會選取為最終模型。
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
參數
- training_data
- Input
實驗中使用的定型資料。 它應該同時包含訓練功能和標籤資料行, (選擇性地包含範例加權資料行) 。
- target_column_name
- str
標籤資料行的名稱。
此參數適用于 training_data
、 validation_data
和 test_data
參數
- primary_metric
自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric 。
可接受的值:r2_score、normalized_mean_absolute_error、normalized_root_mean_squared_error預設值為 normalized_root_mean_squared_error
- enable_model_explainability
- bool
是否要在所有 AutoML 定型反復專案結束時啟用說明最佳 AutoML 模型。 預設值為 None。 如需詳細資訊,請參閱 可解譯性:自動化機器學習中的模型說明。
- weight_column_name
- str
範例加權資料行的名稱。 自動化 ML 支援加權資料行做為輸入,導致資料中的資料列向上或向下加權。 如果輸入資料來自 pandas。沒有資料行名稱的資料框架,可以改用資料行索引,以整數表示。
此參數適用于 training_data
和 validation_data
參數
- validation_data_size
- float
未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。
指定 validation_data
以提供驗證資料,否則請設定 n_cross_validations
或 validation_data_size
,以從指定的定型資料中擷取驗證資料。
針對自訂交叉驗證折迭,請使用 cv_split_column_names
。
如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證。
預設值為 None
未指定使用者驗證資料時要執行的交叉驗證數目。
指定 validation_data
以提供驗證資料,否則請設定 n_cross_validations
或 validation_data_size
,以從指定的定型資料中擷取驗證資料。
針對自訂交叉驗證折迭,請使用 cv_split_column_names
。
如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證。
預設值為 None
包含自訂交叉驗證分割之資料行的名稱清單。 每個 CV 分割資料行都代表一個 CV 分割,其中每個資料列都標示為 1 以進行定型或 0 進行驗證。
預設值為 None
- test_data
- Input
使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要用於測試回合的測試資料,將在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。
如果未指定此參數或 參數, test_data_size
則模型定型完成後,將不會自動執行任何測試回合。
測試資料應該同時包含功能和標籤資料行。
如果 test_data
已指定 , target_column_name
則必須指定 參數。
預設值為 None
- test_data_size
- float
使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要保留測試回合之測試資料的定型資料分數,這些測試回合會在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。
這應該介於 0.0 到 1.0 之間。
如果 test_data_size
同時指定 為 validation_data_size
,則在分割驗證資料之前,會先 training_data
分割測試資料。
例如,如果 validation_data_size=0.1
和 test_data_size=0.1
原始定型資料有 1000 個數據列,則測試資料會有 100 個數據列,驗證資料將包含 90 個數據列,而定型資料會有 810 個數據列。
針對回歸型工作,會使用隨機取樣。 針對分類工作,會使用分層取樣。 預測目前不支援使用定型/測試分割來指定測試資料集。
如果未指定此參數或 參數, test_data
則模型定型完成後,將不會自動執行任何測試回合。
預設值為 None
- forecasting_settings
- ForecastingSettings
預測工作的設定
傳回
可提交至 Azure ML 計算以執行的工作物件。
傳回類型
image_classification
建立 AutoML 影像多類別分類作業的物件。
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
參數
- training_data
- Input
實驗中使用的定型資料。
- target_column_name
- str
標籤資料行的名稱。
此參數適用于 training_data
和 validation_data
參數。
- primary_metric
自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric 。
可接受的值:精確度、AUC_weighted、norm_macro_recall、average_precision_score_weighted和precision_score_weighted預設值。
- validation_data
- Input
實驗中使用的驗證資料。
- validation_data_size
- float
未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。
指定 validation_data
以提供驗證資料,否則設定 validation_data_size
為從指定的定型資料擷取驗證資料。
預設值為 .2
- kwargs
- dict
其他組態參數的字典。
傳回
可以提交至 Azure ML 計算以進行執行的影像分類工作物件。
傳回類型
image_classification_multilabel
建立 AutoML 影像多重標籤分類作業的物件。
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
參數
- training_data
- Input
實驗中使用的定型資料。
- target_column_name
- str
標籤資料行的名稱。
此參數適用于 training_data
和 validation_data
參數。
- primary_metric
自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric 。
可接受的值:精確度、AUC_weighted、norm_macro_recall、average_precision_score_weighted、precision_score_weighted和 Iou 預設值為 Iou。
- validation_data
- Input
實驗中使用的驗證資料。
- validation_data_size
- float
未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。
指定 validation_data
以提供驗證資料,否則設定 validation_data_size
為從指定的定型資料擷取驗證資料。
預設值為 .2
- kwargs
- dict
其他組態參數的字典。
傳回
影像多標籤分類工作物件,可提交至 Azure ML 計算以供執行。
傳回類型
image_instance_segmentation
建立 AutoML 影像實例分割作業的物件。
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
參數
- training_data
- Input
實驗中使用的定型資料。
- target_column_name
- str
標籤資料行的名稱。
此參數適用于 training_data
和 validation_data
參數。
- primary_metric
自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric 。
可接受的值:MeanAveragePrecision 預設值為 MeanAveragePrecision。
- validation_data
- Input
實驗中使用的驗證資料。
- validation_data_size
- float
未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。
指定 validation_data
以提供驗證資料,否則設定 validation_data_size
為從指定的定型資料擷取驗證資料。
預設值為 .2
- kwargs
- dict
其他組態參數的字典。
傳回
影像實例分割作業
傳回類型
image_object_detection
建立 AutoML 影像物件偵測作業的物件。
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
參數
- training_data
- Input
實驗中使用的定型資料。
- target_column_name
- str
標籤資料行的名稱。
此參數適用于 training_data
和 validation_data
參數。
- primary_metric
自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric 。
可接受的值:MeanAveragePrecision 預設值為 MeanAveragePrecision。
- validation_data
- Input
實驗中使用的驗證資料。
- validation_data_size
- float
未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。
指定 validation_data
以提供驗證資料,否則設定 validation_data_size
為從指定的定型資料擷取驗證資料。
預設值為 .2
- kwargs
- dict
其他組態參數的字典。
傳回
可以提交至 Azure ML 計算以執行之影像物件偵測工作物件。
傳回類型
regression
用來建立回歸作業的函式。
回歸作業可用來定型模型,以從資料集預測目標變數的連續值。 各種模型都是使用定型資料來定型。 根據主要計量,在驗證資料上具有最佳效能的模型會選取為最終模型。
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
參數
- training_data
- Input
實驗中使用的定型資料。 它應該同時包含訓練功能和標籤資料行, (選擇性地包含範例加權資料行) 。
- target_column_name
- str
標籤資料行的名稱。
此參數適用于 training_data
、 validation_data
和 test_data
參數
- primary_metric
自動化機器學習會針對模型選取進行優化計量。 自動化機器學習會收集比優化更多的計量。 如需如何計算計量的詳細資訊,請參閱 https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric 。
可接受的值:spearman_correlation、r2_score、normalized_mean_absolute_error normalized_root_mean_squared_error。 預設為 normalized_root_mean_squared_error
- enable_model_explainability
- bool
是否要在所有 AutoML 定型反復專案結束時啟用說明最佳 AutoML 模型。 預設值為 None。 如需詳細資訊,請參閱 可解譯性:自動化機器學習中的模型說明。
- weight_column_name
- str
範例加權資料行的名稱。 自動化 ML 支援加權資料行做為輸入,導致資料中的資料列向上或向下加權。 如果輸入資料來自 pandas。沒有資料行名稱的資料框架,可以改用資料行索引,以整數表示。
此參數適用于 training_data
和 validation_data
參數
- validation_data_size
- float
未指定使用者驗證資料時要保留的資料分數以進行驗證。 這應該介於 0.0 到 1.0 之間。
指定 validation_data
以提供驗證資料,否則請設定 n_cross_validations
或 validation_data_size
,以從指定的定型資料中擷取驗證資料。
針對自訂交叉驗證折迭,請使用 cv_split_column_names
。
如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證。
預設值為 None
未指定使用者驗證資料時要執行的交叉驗證數目。
指定 validation_data
以提供驗證資料,否則請設定 n_cross_validations
或 validation_data_size
,以從指定的定型資料中擷取驗證資料。
針對自訂交叉驗證折迭,請使用 cv_split_column_names
。
如需詳細資訊,請參閱 在自動化機器學習中設定資料分割和交叉驗證。
預設值為 None
包含自訂交叉驗證分割之資料行的名稱清單。 每個 CV 分割資料行都代表一個 CV 分割,其中每個資料列都標示為 1 以進行定型或 0 進行驗證。
預設值為 None
- test_data
- Input
使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要用於測試回合的測試資料,將在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。
如果未指定此參數或 參數, test_data_size
則模型定型完成後,將不會自動執行任何測試回合。
測試資料應該同時包含功能和標籤資料行。
如果 test_data
已指定 , target_column_name
則必須指定 參數。
預設值為 None
- test_data_size
- float
使用測試資料集或測試資料分割的模型測試功能是處於預覽狀態的功能,隨時可能會變更。 要保留測試回合之測試資料的定型資料分數,這些測試回合會在模型定型完成後自動啟動。 測試回合會使用最佳模型取得預測,而且會計算這些預測的計量。
這應該介於 0.0 到 1.0 之間。
如果 test_data_size
同時指定 為 validation_data_size
,則在分割驗證資料之前,會先 training_data
分割測試資料。
例如,如果 validation_data_size=0.1
和 test_data_size=0.1
原始定型資料有 1000 個數據列,則測試資料會有 100 個數據列,驗證資料將包含 90 個數據列,而定型資料會有 810 個數據列。
針對回歸型工作,會使用隨機取樣。 針對分類工作,會使用分層取樣。 預測目前不支援使用定型/測試分割來指定測試資料集。
如果未指定此參數或 參數, test_data
則模型定型完成後,將不會自動執行任何測試回合。
預設值為 None
傳回
可提交至 Azure ML 計算以執行的工作物件。
傳回類型
text_classification
用來建立 TextClassificationJob 的函式。
文字分類作業可用來定型可預測文字資料類別/類別的模型。 輸入定型資料應該包含目標資料行,可將文字分類成一個類別。
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
參數
- training_data
- Input
實驗中使用的定型資料。 它應該同時包含訓練功能和目標資料行。
- target_column_name
- str
目標資料行的名稱。
- validation_data
- Input
實驗中使用的驗證資料。 它應該同時包含訓練功能和目標資料行。
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
工作的主要計量。 可接受的值:精確度、AUC_weighted、precision_score_weighted
- log_verbosity
- str
記錄詳細資訊層級。
- kwargs
- dict
其他組態參數的字典。
傳回
TextClassificationJob 物件。
傳回類型
text_classification_multilabel
用來建立 TextClassificationMultilabelJob 的函式。
文字分類多標籤作業可用來定型模型,以預測文字資料的類別/類別。 輸入訓練資料應包含目標資料行,可將文字分類為類別 (es) 。 如需多標籤資料格式的詳細資訊,請參閱: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
參數
- training_data
- Input
實驗中使用的定型資料。 它應該同時包含訓練功能和目標資料行。
- target_column_name
- str
目標資料行的名稱。
- validation_data
- Input
實驗中使用的驗證資料。 它應該同時包含訓練功能和目標資料行。
- primary_metric
- str
工作的主要計量。 可接受的值:精確度
- log_verbosity
- str
記錄詳細資訊層級。
- kwargs
- dict
其他組態參數的字典。
傳回
TextClassificationMultilabelJob 物件。
傳回類型
text_ner
用來建立 TextNerJob 的函式。
具名實體辨識作業的文字可用來定型模型,以預測文字中的具名實體。 輸入定型資料應該是 CoNLL 格式的文字檔。 如需文字 NER 資料格式的詳細資訊,請參閱: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
參數
- training_data
- Input
實驗中使用的定型資料。 它應該同時包含訓練功能和目標資料行。
- validation_data
- Input
實驗中使用的驗證資料。 它應該同時包含訓練功能和目標資料行。
- primary_metric
- str
工作的主要計量。 可接受的值:精確度
- log_verbosity
- str
記錄詳細資訊層級。
- kwargs
- dict
其他組態參數的字典。
傳回
TextNerJob 物件。