資料表
重要
Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning。
自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。
ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。
資料表類別
資料集是指已上傳至 Machine Learning Studio (傳統),因而可在模型化過程中使用的資料。 即使您以其他格式上傳資料,或是指定 CSV、ARFF 或 TSV 之類的儲存格式,每當實驗中的模組使用資料時,都會以隱含方式轉換成 DataTable
物件。
資料集是以 .NET資料表為基礎
資料行類型
DataTable
包含與中繼資料相關聯的資料行集合。 這些資料行實作 IArray
介面。 機器學習 Studio (傳統) 中的資料行,可視為一維陣列(也就是向量)。
.NET 陣列類別會 實 作為這些泛型介面: System.Collections.Generic.IList<T>
、 System.Collections.Generic.ICollection<T>
和 System.Collections.Generic.IEnumerable<T>
。
、 double
和 Boolean
類型 int
的資料行通常會以數值密集陣列來表示。 如果密集資料行包含遺漏值,則會將其視為遺漏值陣列或可為 null 物件密集陣列來處理。
包含字串的資料行會被當成物件密集陣列來處理。 如果有遺漏值,遺漏值會以 null 或類型 MissingValuesObjectArray<string>
表示。
如需詳細資訊,請參閱 陣列類別 (MSDN library) 。
取得 DataTable 中的資料行
您可以藉由在 DataTable 上呼叫 GetColumn
方法來取得資料行。 此 GetColumn
方法有兩個多載:
GetColumn(<Int64>)
會依據其索引取得資料行。GetColumn(<string>)
會依據其名稱取得資料行。
Studio (傳統) 中的其他介面
本節也會說明適用于機器學習 Studio (傳統) 的下列介面:
類型 | 說明 |
---|---|
ICluster 介面 | ICluster 介面會定義群集模型的結構。 |
IFilter 介面 | IFilter 介面會定義套用至整系列數值的數位信號處理篩選準則結構。 您可以建立篩選,然後將其儲存並套用至新的數列。 |
ILearner 介面 | .Ilearner 介面提供定義和儲存分析模型的泛型結構,但不包括某些特殊類型,例如群集模型。 |
ITransform 介面 | ITransform 介面提供定義和儲存轉換的泛型結構。 您可以使用機器學習 Studio (傳統) 建立 iTransform,然後將轉換套用至新的資料集。 |