Condividi tramite


DataOperationsCatalog.LoadFromEnumerable Metodo

Definizione

Overload

LoadFromEnumerable<TRow>(IEnumerable<TRow>, SchemaDefinition)

Creare un nuovo IDataView oggetto su un enumerabile degli elementi del tipo definito dall'utente. L'utente mantiene la proprietà dell'oggetto data e la visualizzazione dati risultante non altererà mai il contenuto di data. Poiché IDataView si presuppone che non sia modificabile, l'utente deve supportare più enumerazioni di data che restituirebbero gli stessi risultati, a meno che l'utente non sappia che i dati verranno filtrati una sola volta.

Un utilizzo tipico per la visualizzazione dati di streaming può essere: creare la visualizzazione dati che carica i dati in modo pigrimente in base alle esigenze, quindi applicare trasformazioni pre-training a esso e cursore attraverso di esso per i risultati della trasformazione.

LoadFromEnumerable<TRow>(IEnumerable<TRow>, DataViewSchema)

Creare un nuovo IDataView oggetto su un oggetto enumerabile degli elementi del tipo definito dall'utente usando l'oggetto specificato DataViewSchema, che potrebbe contenere più informazioni sullo schema rispetto al tipo in grado di acquisire.

LoadFromEnumerable<TRow>(IEnumerable<TRow>, SchemaDefinition)

Creare un nuovo IDataView oggetto su un enumerabile degli elementi del tipo definito dall'utente. L'utente mantiene la proprietà dell'oggetto data e la visualizzazione dati risultante non altererà mai il contenuto di data. Poiché IDataView si presuppone che non sia modificabile, l'utente deve supportare più enumerazioni di data che restituirebbero gli stessi risultati, a meno che l'utente non sappia che i dati verranno filtrati una sola volta.

Un utilizzo tipico per la visualizzazione dati di streaming può essere: creare la visualizzazione dati che carica i dati in modo pigrimente in base alle esigenze, quindi applicare trasformazioni pre-training a esso e cursore attraverso di esso per i risultati della trasformazione.

public Microsoft.ML.IDataView LoadFromEnumerable<TRow> (System.Collections.Generic.IEnumerable<TRow> data, Microsoft.ML.Data.SchemaDefinition schemaDefinition = default) where TRow : class;
member this.LoadFromEnumerable : seq<'Row (requires 'Row : null)> * Microsoft.ML.Data.SchemaDefinition -> Microsoft.ML.IDataView (requires 'Row : null)
Public Function LoadFromEnumerable(Of TRow As Class) (data As IEnumerable(Of TRow), Optional schemaDefinition As SchemaDefinition = Nothing) As IDataView

Parametri di tipo

TRow

Tipo di elemento definito dall'utente.

Parametri

data
IEnumerable<TRow>

I dati enumerabili contenenti il tipo TRow da convertire in un IDataViewoggetto .

schemaDefinition
SchemaDefinition

Definizione facoltativa dello schema della visualizzazione dati da creare. Se null, la definizione dello schema viene derivata da TRow.

Restituisce

Oggetto costruito IDataView.

Esempio

using System;
using System.Collections.Generic;
using Microsoft.ML;
using Microsoft.ML.Data;

namespace Samples.Dynamic
{
    public static class LoadFromEnumerable
    {
        // Creating IDataView from IEnumerable, and setting the size of the vector
        // at runtime. When the data model is defined through types, setting the
        // size of the vector is done through the VectorType annotation. When the
        // size of the data is not known at compile time, the Schema can be directly
        // modified at runtime and the size of the vector set there. This is
        // important, because most of the ML.NET trainers require the Features
        // vector to be of known size. 
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness.
            var mlContext = new MLContext();

            // Get a small dataset as an IEnumerable.
            IEnumerable<DataPointVector> enumerableKnownSize = new DataPointVector[]
            {
               new DataPointVector{ Features = new float[]{ 1.2f, 3.4f, 4.5f, 3.2f,
                   7,5f } },

               new DataPointVector{ Features = new float[]{ 4.2f, 3.4f, 14.65f,
                   3.2f, 3,5f } },

               new DataPointVector{ Features = new float[]{ 1.6f, 3.5f, 4.5f, 6.2f,
                   3,5f } },

            };

            // Load dataset into an IDataView. 
            IDataView data = mlContext.Data.LoadFromEnumerable(enumerableKnownSize);
            var featureColumn = data.Schema["Features"].Type as VectorDataViewType;
            // Inspecting the schema
            Console.WriteLine($"Is the size of the Features column known: " +
                $"{featureColumn.IsKnownSize}.\nSize: {featureColumn.Size}");

            // Preview
            //
            // Is the size of the Features column known? True.
            // Size: 5.

            // If the size of the vector is unknown at compile time, it can be set 
            // at runtime.
            IEnumerable<DataPoint> enumerableUnknownSize = new DataPoint[]
            {
               new DataPoint{ Features = new float[]{ 1.2f, 3.4f, 4.5f } },
               new DataPoint{ Features = new float[]{ 4.2f, 3.4f, 1.6f } },
               new DataPoint{ Features = new float[]{ 1.6f, 3.5f, 4.5f } },
            };

            // The feature dimension (typically this will be the Count of the array 
            // of the features vector known at runtime).
            int featureDimension = 3;
            var definedSchema = SchemaDefinition.Create(typeof(DataPoint));
            featureColumn = definedSchema["Features"]
                .ColumnType as VectorDataViewType;

            Console.WriteLine($"Is the size of the Features column known: " +
                $"{featureColumn.IsKnownSize}.\nSize: {featureColumn.Size}");

            // Preview
            //
            // Is the size of the Features column known? False.
            // Size: 0.

            // Set the column type to be a known-size vector.
            var vectorItemType = ((VectorDataViewType)definedSchema[0].ColumnType)
                .ItemType;
            definedSchema[0].ColumnType = new VectorDataViewType(vectorItemType,
                featureDimension);

            // Read the data into an IDataView with the modified schema supplied in
            IDataView data2 = mlContext.Data
                .LoadFromEnumerable(enumerableUnknownSize, definedSchema);

            featureColumn = data2.Schema["Features"].Type as VectorDataViewType;
            // Inspecting the schema
            Console.WriteLine($"Is the size of the Features column known: " +
                $"{featureColumn.IsKnownSize}.\nSize: {featureColumn.Size}");

            // Preview
            //
            // Is the size of the Features column known? True. 
            // Size: 3.
        }
    }

    public class DataPoint
    {
        public float[] Features { get; set; }
    }

    public class DataPointVector
    {
        [VectorType(5)]
        public float[] Features { get; set; }
    }
}

Si applica a

LoadFromEnumerable<TRow>(IEnumerable<TRow>, DataViewSchema)

Creare un nuovo IDataView oggetto su un oggetto enumerabile degli elementi del tipo definito dall'utente usando l'oggetto specificato DataViewSchema, che potrebbe contenere più informazioni sullo schema rispetto al tipo in grado di acquisire.

public Microsoft.ML.IDataView LoadFromEnumerable<TRow> (System.Collections.Generic.IEnumerable<TRow> data, Microsoft.ML.DataViewSchema schema) where TRow : class;
member this.LoadFromEnumerable : seq<'Row (requires 'Row : null)> * Microsoft.ML.DataViewSchema -> Microsoft.ML.IDataView (requires 'Row : null)
Public Function LoadFromEnumerable(Of TRow As Class) (data As IEnumerable(Of TRow), schema As DataViewSchema) As IDataView

Parametri di tipo

TRow

Tipo di elemento definito dall'utente.

Parametri

data
IEnumerable<TRow>

I dati enumerabili contenenti il tipo TRow da convertire in un IDataViewoggetto .

schema
DataViewSchema

Schema dell'oggetto restituito IDataView.

Restituisce

Oggetto IDataView con l'oggetto specificato schema.

Commenti

L'utente mantiene la proprietà dell'oggetto data e la visualizzazione dati risultante non altererà mai il contenuto di data. Poiché IDataView si presuppone che non sia modificabile, l'utente deve supportare più enumerazioni di data che restituirebbero gli stessi risultati, a meno che l'utente non sappia che i dati verranno filtrati una sola volta. Un utilizzo tipico per la visualizzazione dati di streaming può essere: creare la visualizzazione dati che carica i dati in modo pigrimente in base alle esigenze, quindi applicare trasformazioni pre-training a esso e cursore attraverso di esso per i risultati della trasformazione. Un utilizzo pratico di questo sarebbe fornire i nomi delle colonne di funzionalità tramite DataViewSchema.Annotations.

Si applica a