字符串
string
类型将不可变的文本表示为 Unicode 字符序列。 string
是 System.String
在 .NET 中的别名。
注解
字符串字面量由引号 (") 字符分隔。 反斜杠字符 (\) 用于对某些特殊字符进行编码。 反斜杠和下一个字符共同被称为转义序列。 下表显示了 F# 字符串字面量中支持的转义序列。
字符 | 转义序列 |
---|---|
警报 | \a |
Backspace | \b |
换页 | \f |
换行符 | \n |
回车 | \r |
选项卡 | \t |
垂直制表符 | \v |
反斜杠 | \\ |
引号 | \" |
撇号 | \' |
Unicode 字符 | \DDD (其中 D 表示十进制数字;范围为 000 - 255;例如 \231 = "ç") |
Unicode 字符 | \xHH (其中 H 表示十六进制数字;范围为 00 - FF;例如 \xE7 = "ç") |
Unicode 字符 | \uHHHH (UTF-16)(其中 H 表示十六进制数字;范围为 0000 - FFFF;例如 \u00E7 = "ç") |
Unicode 字符 | \U00HHHHHH (UTF-32)(其中 H 表示十六进制数字;范围为 000000 - 10FFFF;例如 \U0001F47D = "👽") |
重要
\DDD
转义序列是十进制表示法,而不是像大多数其他语言那样的八进制表示法。 因此,数字 8
和 9
均有效,且 \032
序列表示一个空格 (U+0020),而八进制表示法中的相同码位将是 \040
。
注意
由于限制在 0 - 255 (0xFF) 的范围内,\DDD
和 \x
转义序列实际上是 ISO-8859-1 字符集,因为它匹配前 256 个 Unicode 码位。
逐字字符串
如果前面带有 @ 符号,则文本为逐字字符串。 声明逐字字符串意味着将忽略任何转义序列,但两个引号字符被解释为一个引号字符。
三引号字符串
此外,字符串可以用三引号括起来。 在这种情况下,所有转义序列将被忽略,包括双引号字符。 若要指定一个包含嵌入的带引号的字符串的字符串,可使用逐字字符串或带三引号的字符串。 如果你使用逐字字符串,则必须指定两个引号字符来表示一个单引号字符。 如果你使用带三引号的字符串,可使用单引号字符,而不会将它们分析为字符串的末尾。 当使用包含嵌入引号的 XML 或其他结构时,此方法会很有用。
// Using a verbatim string
let xmlFragment1 = @"<book author=""Milton, John"" title=""Paradise Lost"">"
// Using a triple-quoted string
let xmlFragment2 = """<book author="Milton, John" title="Paradise Lost">"""
在代码中,接受具有换行符的字符串,并将换行符解释为源中使用的换行符编码,除非反斜杠字符是换行符之前的最后一个字符。 使用反斜杠字符时,下一行的前导空格将被忽略。 以下代码生成一个值为 "abc\ndef"
的字符串 str1
和一个值为 "abcdef"
的字符串 str2
。
let str1 =
"abc
def"
let str2 =
"abc\
def"
字符串索引和切片
可使用类似数组的语法来访问字符串中的各个字符。 以下示例使用 []
对字符串编制索引。 F# 6.0 中引入了此语法。 你还可使用 .[]
来为所有版本中的字符串编制索引。 新语法为首选语法。
printfn "%c" str1[1]
输出为 b
。
或者,可使用数组切片语法来提取子字符串,如下面的代码所示。
printfn "%s" str1[0..2]
printfn "%s" str2[3..5]
输出如下所示。
abc
def
可按无符号字节数组(类型 byte[]
)表示 ASCII 字符串。 将后缀 B
添加到字符串字面量,以指示它是 ASCII 字符串。 与字节数组一起使用的 ASCII 字符串字面量支持与 Unicode 字符串相同的转义序列,但 Unicode 转义序列除外。
// "abc" interpreted as a Unicode string.
let str1: string = "abc"
// "abc" interpreted as an ASCII byte array.
let bytearray: byte[] = "abc"B
字符串运算符
+
运算符可用于连接字符串,保持与 .NET Framework 字符串处理功能的兼容性。 以下示例说明了字符串串联。
let string1 = "Hello, " + "world"
String 类
由于 F# 中的字符串类型实际上是 .NET Framework System.String
类型,因此所有 System.String
成员都可用。 System.String
包括用于连接字符串的 +
运算符、Length
属性和将字符串作为 Unicode 字符数组返回的 Chars
属性。 有关字符串的详细信息,请参阅 System.String
。
通过使用 System.String
的 Chars
属性,可通过指定索引来访问字符串中的各个字符,如以下代码所示。
let printChar (str: string) (index: int) =
printfn "First character: %c" (str.Chars(index))
String 模块
FSharp.Core
命名空间的 String
模块中包含其他字符串处理功能。 有关详细信息,请参阅 String 模块。