Tabulka dat
Důležité
Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.
Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).
- Podívejte se na informace o přesunu projektů strojového učení z ML Studia (klasického) do Azure Machine Learning.
- Další informace o Azure Machine Learning.
Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.
Data Table – třída
Datová sada jsou data nahraná do Machine Learning Studio (klasické), aby je bylo možné použít v procesu modelování. I když nahrajete data v jiném formátu nebo zadáte formát úložiště, jako je CSV, ARFF nebo TSV, data DataTable
se implicitně převedou na objekt, kdykoli je modul v experimentu použije.
Poznámka
Platí pro: Machine Learning Studio (classic)
Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.
Datová sada je založená na tabulce dat .NET .
Typy sloupců
Sestává DataTable
z kolekce sloupců s přidruženými metadaty. Tyto sloupce implementují IArray
rozhraní . Sloupce dat v Machine Learning Studiu (klasickém) jsou srozumitelné jako jednorozměrná pole – vektory.
Třída .NET Array implementuje tato obecná rozhraní: System.Collections.Generic.IList<T>
, System.Collections.Generic.ICollection<T>
a System.Collections.Generic.IEnumerable<T>
.
Sloupce typů int
, double
a jsou Boolean
obvykle reprezentovány jako číselná hustota polí. Pokud sloupec dense obsahuje chybějící hodnoty, zřetězený buď jako pole chybějících hodnot, nebo jako pole s hodnotou nullable object dense.
Sloupce obsahující řetězce se zpracovávají jako pole s hustotou objektů. Pokud chybí hodnoty, chybějící hodnoty se reprezentují jako hodnoty null nebo jako typ MissingValuesObjectArray<string>
.
Další informace najdete v tématu Třída pole (knihovna MSDN).
Získání sloupců v tabulce DataTable
Sloupec můžete získat voláním metody GetColumn
v tabulce DataTable. Metoda GetColumn
má dvě přetížení:
GetColumn(<Int64>)
získá sloupec podle indexu.GetColumn(<string>)
získá sloupec podle názvu.
Další rozhraní v sadě Studio (klasická)
Tato část také popisuje následující rozhraní pro Machine Learning Studio (Classic):
Typ | Description |
---|---|
Rozhraní ICluster | Rozhraní ICluster definuje strukturu modelů clusteringu. |
IFilter – rozhraní | Rozhraní IFilter definuje strukturu filtrů zpracování digitálního signálu použitou na celou řadu číselných hodnot. Filtry je možné vytvořit a pak uložit a použít u nové řady. |
ILearner – rozhraní | Rozhraní ILearner poskytuje obecnou strukturu pro definování a ukládání analytických modelů s výjimkou některých speciálních typů, jako jsou modely clusteringu. |
ITransform – rozhraní | Rozhraní ITransform poskytuje obecnou strukturu pro definování a ukládání transformací. Pomocí aplikace Machine Learning Studio (classic) můžete vytvořit iTransformaci a pak transformaci použít na nové datové sady. |