Partager via


TextLoader.Options Classe

Définition

Paramètres pour TextLoader

public class TextLoader.Options
type TextLoader.Options = class
Public Class TextLoader.Options
Héritage
TextLoader.Options

Constructeurs

TextLoader.Options()

Paramètres pour TextLoader

Champs

AllowQuoting

Indique si l’entrée peut inclure des valeurs entre guillemets doubles. Ce paramètre est utilisé pour distinguer les caractères de séparation dans une valeur d’entrée des séparateurs réels. Lorsque true, les séparateurs entre guillemets doubles sont traités dans le cadre de la valeur d’entrée. Quand false, tous les séparateurs, même ceux entre guillemets, sont traités comme délimitant une nouvelle colonne.

AllowSparse

Indique si l’entrée peut inclure des représentations éparses. Par exemple, une ligne contenant « 5 2:6 4:3 » signifie qu’il y a 5 colonnes, et les seules colonnes non nulles sont les colonnes 2 et 4, qui ont des valeurs 6 et 3, respectivement. Les index de colonne étant de base zéro, les colonnes 2 et 4 représentent les 3e et 5e colonnes. Une colonne peut également avoir des valeurs denses suivies de valeurs éparses représentées de cette façon. Par exemple, une ligne contenant « 1 2 5 2:6 4:3 » représente deux colonnes denses avec les valeurs 1 et 2, suivies de 5 colonnes partiellement représentées avec les valeurs 0, 0, 6, 0 et 3. Les index des colonnes éparses commencent à partir de 0, même si 0 représente la troisième colonne.

En outre, InputSize doit être utilisé lorsque le nombre d’éléments partiellement alloués (5 dans cet exemple) n’est pas présent dans chaque ligne. Il doit spécifier la taille totale, pas seulement la taille de la partie éparse. Toutefois, les indices de la partie éparse sont relatifs à l’endroit où commence la partie éparse. Si InputSize est défini sur 7, la ligne « 1 2 2:6 4:3 » est mappée à « 1 2 0 0 0 6 0 4 », mais si elle est définie sur 10, la même ligne est mappée à « 1 2 0 0 0 6 0 0 0 0 0 ».

Columns

Spécifie les colonnes d’entrée qui doivent être mappées aux IDataView colonnes.

DecimalMarker

Caractère qui doit être utilisé comme marqueur décimal. La valeur par défaut est '.'. Seuls « . » et « , » sont autorisés à être des marqueurs décimaux.

EscapeChar

Caractère à utiliser pour les guillemets d’échappement à l’intérieur des champs entre guillemets. Il ne peut pas s’agir d’un caractère utilisé comme séparateur.

HasHeader

Indique si le fichier a un en-tête avec des noms de fonctionnalités. Lorsque true, le chargeur ignore la première ligne quand Load(IMultiStreamSource) est appelé. L’exemple peut être utilisé pour déduire les annotations de nom d’emplacement, le cas échéant.

HeaderFile

Fichier contenant un en-tête avec des noms de fonctionnalités. S’il est spécifié, l’en-tête défini dans le fichier de données est ignoré indépendamment de HasHeader.

InputSize

Nombre de colonnes sources dans les données texte. Par défaut, les lignes éparses contiennent leurs informations de taille.

MaxRows

Nombre maximal de lignes à produire.

MissingRealsAsNaNs

Si la valeur est true, les champs réels manquants (c’est-à-dire les champs doubles ou simples) sont chargés en tant que NaN. Si la valeur est false, elles sont chargées sous la forme 0. La valeur par défaut est false. Un champ est considéré comme « manquant » s’il est vide, s’il n’a que des espaces blancs ou s’il manque des colonnes à la fin d’une ligne donnée.

ReadMultilines

Si la valeur est true, les nouveaux caractères de ligne sont acceptables à l’intérieur d’un champ entre guillemets. Par conséquent, un champ peut contenir plusieurs lignes de texte Si AllowQuoting a la valeur false, cette option est ignorée.

Separators

Caractères qui doivent être utilisés comme séparateurs de colonnes.

TrimWhitespace

Wheter pour supprimer les espaces blancs de fin des lignes.

UseThreads

Indique s’il faut utiliser des threads d’analyse distincts.

S’applique à