WhiteSpace 类
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
在单词边界处拆分文本的预标记器。 单词是一组字母、数字和下划线字符。
public sealed class WhiteSpace : Microsoft.ML.Tokenizers.PreTokenizer
type WhiteSpace = class
inherit PreTokenizer
Public NotInheritable Class WhiteSpace
Inherits PreTokenizer
- 继承
构造函数
WhiteSpace() |
在单词边界处拆分文本的预标记器。 单词是一组字母、数字和下划线字符。 |
字段
Instance |
获取 WhiteSpace 预 tokenizer 的单一实例。 |
方法
PreTokenize(String) |
在单词边界处拆分多个子字符串中的给定字符串,从而跟踪所述子字符串与原始字符串的偏移量。 |