DataType 类

用于处理正确操作支持的列类型的帮助程序类 (int、bool、string 等 ) 。 当前与 MLTable.convert_column_types (...) & from_delimited_files (...) 一起使用,用于指定要将列转换为哪些类型。 使用 DataType.from_ ( ...) * 方法选择不同的类型。

继承
builtins.object
DataType

构造函数

DataType()

方法

to_bool

将转换配置为 bool。 true_values & false_values 必须为 None 或非空列表,否则将引发错误。

to_datetime

将转换配置为日期/时间。

to_float

将转换配置为 64 位 float。

to_int

将转换配置为 64 位整数。

to_stream

将转换配置为流。

to_string

将转换配置为字符串。

to_bool

将转换配置为 bool。 true_values & false_values 必须为 None 或非空列表,否则将引发错误。

static to_bool(true_values: List[str] | None = None, false_values: List[str] | None = None, mismatch_as: str | None = None)

参数

名称 说明
true_values

数据集中要指定为 True 的值的列表。 例如,['1', 'yes'] 将被替换为 [True, True]。 true_values需要存在于数据集中,否则对于不存在的值,将返回 None。

默认值: None
false_values

数据集中要指定为 False 的值的列表。 例如,['0', 'no'] 将被替换为 [False, False]。 数据集中需要存在false_values,否则对于不存在的值,将返回 None。

默认值: None
mismatch_as

如何强制转换不在 true_valuesfalse_values 中的字符串;“true”将全部强制转换为 True,“false”转换为 False,“error”将错误而不是强制转换。 默认为“无”,等于“error”。

默认值: None

to_datetime

将转换配置为日期/时间。

static to_datetime(formats: str | List[str], date_constant: str | None = None)

参数

名称 说明
formats
必需
strlist[str]

格式,用于尝试进行日期/时间转换。 例如 ,%d-%m-%Y 表示“day-month-year ”中的数据,% Y-%m-%dT%H:%M:%S.%f 表示“组合日期和时间表示形式”符合 ISO 8601。

  • %Y:年份(包含 4 位数字)

  • %y:年份(包含 2 位数字)

  • %m:月份(用数字表示)

  • %b:由 3 个字母的缩写名称表示的月份,如 Aug

  • %B:用全名表示的月份,如 August

  • %d:天(用数字表示)

  • %H:小时(以 24 小时制表示)

  • %I:小时(以 12 小时制表示)

  • %M:分钟(用两位数表示)

  • %S:秒(用两位数表示)

  • %f:微秒

  • %p:AM/PM 指示符

  • %z:时区,例如:0700

date_constant

如果列仅包含时间值,则为要应用于生成的 DateTime 的日期。

默认值: None

to_float

将转换配置为 64 位 float。

static to_float()

to_int

将转换配置为 64 位整数。

static to_int()

to_stream

将转换配置为流。

static to_stream()

to_string

将转换配置为字符串。

static to_string()