字串基本概念 (C# 程式設計手冊)
更新:2007 年 11 月
字串是型別 String 的物件,其值為文字。在內部處理上,文字是以 Char 物件的唯讀集合的方式儲存,其中每個物件都代表一個以 UTF-16 編碼的 Unicode 字元。C# 字串尾端沒有 null 結尾字元 (與 C 和 C++ 不同),因此 C# 字串可以包含任何數目的內嵌 null 字元 ('\0')。不論字元是否由 Unicode Surrogate 字組所構成,字串的長度代表字元的數目。若要存取字串中個別的 Unicode 字碼指標,請使用 StringInfo 物件。
string 與 System.String 的比較
C# 中的 string 關鍵字是 String 的別名。因此,String 和 string 是對等用法,而您可以依偏好使用其中一個命名慣例。String 類別提供許多方法,讓您可以安全地建立、處理和比較字串。除此之外,C# 語言可以多載部分運算子,進而簡化一般字串作業。如需關鍵字的詳細資訊,請參閱 string (C# 參考)。如需型別和其方法的詳細資訊,請參閱 String。
宣告和初始化字串
您可以使用許多方式宣告和初始化字串,如下列範例所示:
// Declare without initializing.
string message1;
// Initialize to null.
string message2 = null;
// Initialize as an empty string.
// Use the Empty constant instead of the literal "".
string message3 = System.String.Empty;
//Initialize with a regular string literal.
string oldPath = "c:\\Program Files\\Microsoft Visual Studio 8.0";
// Initialize with a verbatim string literal.
string newPath = @"c:\Program Files\Microsoft Visual Studio 9.0";
// Use System.String if you prefer.
System.String greeting = "Hello World!";
// In local variables (i.e. within a method body)
// you can use implicit typing.
var temp = "I'm still a strongly-typed System.String!";
// Use a const string to prevent 'message4' from
// being used to store another string value.
const string message4 = "You can't get rid of me!";
// Use the String constructor only when creating
// a string from a char*, char[], or sbyte*. See
// System.String documentation for details.
char[] letters = { 'A', 'B', 'C' };
string alphabet = new string(letters);
請注意,除了使用字元陣列初始化字串之外,其他情況下並不是使用 new 運算子來建立字串物件。
使用 Empty 常數值初始化字串,可以建立字串長度為零的新 String 物件。零長度字串的字串常值 (String Literal) 表示為 ""。藉由使用 Empty 值而非 null 來初始化字串,可以降低發生 NullReferenceException 的機會。請在嘗試存取字串值前,先使用 IsNullOrEmpty(String) 方法驗證該值。
字串物件的不變性
字串物件是「不可變」(Immutable):一旦建立就無法變更。看起來好像會修改字串的所有 String 方法和 C# 運算子,其實是傳回新字串物件的結果。下列範例中,在串連 s1 和 s2 的內容以構成單一字串時,並不會修改這兩個原始字串。+= 運算子會建立包含組合內容的新字串。該新物件會指派給變數 s1,並會將指派給 s1 的原始物件釋放以供記憶體回收,這是因為沒有其他的變數會參考到該原始物件。
string s1 = "A string is more ";
string s2 = "than the sum of its chars.";
// Concatenate s1 and s2. This actually creates a new
// string object and stores it in s1, releasing the
// reference to the original object.
s1 += s2;
System.Console.WriteLine(s1);
// Output: A string is more than the sum of its chars.
因為字串的「修改」實際上是新字串的建立,所以在建立字串參考時,您必須特別小心。如果您建立字串的參考,然後「修改」原始字串,此參考將會繼續指向原始的物件,而不是指向修改該字串後所建立的新物件。下列程式碼會說明這個行為:
string s1 = "Hello ";
string s2 = s1;
s1 += "World";
System.Console.WriteLine(s2);
//Output: Hello
如需如何依據修改建立新字串 (例如對原始字串進行搜尋和取代的作業) 的詳細資訊,請參閱 HOW TO:修改字串內容 (C# 程式設計手冊)。
規則和逐字翻譯字串的常值
在必須內嵌 C# 所提供的逸出字元 (Escape Character) 時,請使用規則字串常值,如下列範例所示:
string columns = "Column 1\tColumn 2\tColumn 3";
//Output: Column 1 Column 2 Column 3
string rows = "Row 1\r\nRow 2\r\nRow 3";
/* Output:
Row 1
Row 2
Row 3
*/
string title = "\"The \u00C6olean Harp\", by Samuel Taylor Coleridge";
//Output: "The Æolean Harp", by Samuel Taylor Coleridge
在字串文字包含反斜線字元時,例如檔案路徑,為了方便好讀,請使用逐字翻譯字串。因為逐字翻譯字串會保留字串文字中的新行字元,所以可以用來初始化多行字串。請使用雙引號內嵌逐字翻譯字串中的引號。下列範例顯示逐字翻譯字串的一些常見用法:
string filePath = @"C:\Users\scoleridge\Documents\";
//Output: C:\Users\scoleridge\Documents\
string text = @"My pensive SARA ! thy soft cheek reclined
Thus on mine arm, most soothing sweet it is
To sit beside our Cot,...";
/* Output:
My pensive SARA ! thy soft cheek reclined
Thus on mine arm, most soothing sweet it is
To sit beside our Cot,...
*/
string quote = @"Her name was ""Sara.""";
//Output: Her name was "Sara."
字串逸出序列
逸出序列 |
字元名稱 |
Unicode 編碼 |
---|---|---|
\' |
單引號 |
0x0027 |
\" |
雙引號 |
0x0022 |
\\ |
反斜線 |
0x005C |
\0 |
Null |
0x0000 |
\a |
警示 |
0x0007 |
\b |
退格鍵 (Backspace) |
0x0008 |
\f |
換頁字元 |
0x000C |
\n |
新行 |
0x000A |
\r |
歸位字元 (Carriage Return) |
0x000D |
\t |
水平 Tab |
0x0009 |
\U |
Surrogate 字組的 Unicode 逸出序列 |
\Unnnnnnnn |
\u |
Unicode 逸出序列 |
\u0041 = "A" |
\v |
垂直 Tab |
0x000B |
\x |
類似 "\u" 的 Unicode 逸出序列,但具有可變長度 |
\x0041 = "A" |
注意事項: |
---|
在編譯時期,逐字翻譯字串會轉換為一般字串再加上所有相同的逸出序列。因此,如果在偵錯工具監看式視窗中檢視逐字翻譯字串,就會看到編譯器加入的逸出字元,而不是原始程式碼中的逐字翻譯版本。例如,逐字翻譯字串 @"C:\files.txt" 在監看式視窗中會顯示為 "C:\\files.txt"。 |
格式字串
格式字串 (Format String) 這種字串的內容,可以在執行階段動態決定。建立格式字串的方式,是藉由使用靜態 Format 方法,並以大括號內嵌要在執行階段以其他值取代的替代符號 (Placeholder)。下列範例會使用格式字串,以輸出迴圈 (Loop) 中每次反覆運算的結果。
class FormatString
{
static void Main()
{
// Get user input.
System.Console.WriteLine("Enter a number");
string input = System.Console.ReadLine();
// Convert the input string to an int.
int j;
System.Int32.TryParse(input, out j);
// Write a different string each iteration.
string s;
for (int i = 0; i < 10; i++)
{
// A simple format string with no alignment formatting.
s = System.String.Format("{0} times {1} = {2}", i, j, (i * j));
System.Console.WriteLine(s);
}
//Keep the console window open in debug mode.
System.Console.ReadKey();
}
}
WriteLine 方法有一個多載會採用格式字串做為參數。因此,您只要內嵌格式字串常值,而不用明確呼叫方法。然而,如果是使用 WriteLine 方法在 Visual Studio [輸出] 視窗中顯示偵錯輸出,則必須明確呼叫 Format 方法,因為 WriteLine 只接受字串,而非格式字串。如需格式字串的詳細資訊,請參閱格式化型別。
子字串
子字串是包含在字串中的任何字元序列。使用 Substring 方法可以從原始字串的一部分建立新字串。藉由使用 IndexOf 方法,您可以搜尋子字串的一個或多個出現項目。使用 Replace 方法則會以新字串取代指定子字串的所有出現項目。跟 Substring 方法一樣,Replace 實際上會傳回新字串,而不會修改原始字串。如需詳細資訊,請參閱 HOW TO:使用字串方法搜尋字串 (C# 程式設計手冊) 和 HOW TO:修改字串內容 (C# 程式設計手冊)。
string s3 = "Visual C# Express";
System.Console.WriteLine(s3.Substring(7, 2));
// Output: "C#"
System.Console.WriteLine(s3.Replace("C#", "Basic"));
// Output: "Visual Basic Express"
// Index values are zero-based
int index = s3.IndexOf("C");
// index = 7
存取個別字元
您可以使用陣列標記法搭配索引值,取得個別字元的唯讀存取,如下列範例所示:
string s5 = "Printing backwards";
for (int i = 0; i < s5.Length; i++)
{
System.Console.Write(s5[s5.Length - i - 1]);
}
// Output: "sdrawkcab gnitnirP"
在修改字串中的個別字元時,如果 String 方法沒有提供您必須擁有的功能,則可以使用 StringBuilder 物件「就地」修改個別字元,然後再使用 StringBuilder 方法建立新字串以儲存結果。在下列範例中,假設您必須以特殊方式修改原始字串,並儲存該結果供日後使用:
string question = "hOW DOES mICROSOFT wORD DEAL WITH THE cAPS lOCK KEY?";
System.Text.StringBuilder sb = new System.Text.StringBuilder(question);
for (int j = 0; j < sb.Length; j++)
{
if (System.Char.IsLower(sb[j]) == true)
sb[j] = System.Char.ToUpper(sb[j]);
else if (System.Char.IsUpper(sb[j]) == true)
sb[j] = System.Char.ToLower(sb[j]);
}
// Store the new string.
string corrected = sb.ToString();
System.Console.WriteLine(corrected);
// Output: How does Microsoft Word deal with the Caps Lock key?
Null 字串和空字串
空字串是 System.String 物件的執行個體 (Instance),其中包含零個字元。空字串經常用於各種程式設計案例,以代表空白的文字欄位。您可以在空字串上呼叫方法,因為其為有效的 System.String 物件。空字串的初始化方式如下:
string s = String.Empty;
相較之下,null 字串不會參考 System.String 物件的執行個體,嘗試在 null 字串上呼叫方法會導致 NullReferenceException。不過,您可以使用 null 字串與其他字串進行串連和比較作業。下列範例說明參考 null 字串會不會導致例外狀況 (Exception) 擲回的一些案例:
static void Main()
{
string str = "hello";
string nullStr = null;
string emptyStr = "a";
string tempStr = str + nullStr; // tempStr = "hello"
bool b = (emptyStr == nullStr);// b = false;
string newStr = emptyStr + nullStr; // creates a new empty string
int len = nullStr.Length; // throws NullReferenceException
}
使用 StringBuilder 快速建立字串
.NET 的字串作業是經過高度最佳化的,而且在絕大部分的情況下不會大幅影響到效能。然而,在有些案例下的字串作業可能會影響到效能,例如會執行數千百次的緊密迴圈。如果程式會執行許多字串處理,StringBuilder 類別可以建立字串緩衝區以提供更好的效能。StringBuilder 字串也可以讓您重新指派內建字串資料型別不支援的某些個別字元。例如,這個程式碼會在不建立新字串的情況下變更字串內容:
System.Text.StringBuilder sb = new System.Text.StringBuilder("Rat: the ideal pet");
sb[0] = 'C';
System.Console.WriteLine(sb.ToString());
System.Console.ReadLine();
//Outputs Cat: the ideal pet
在這個範例中,會使用 StringBuilder 物件從一組數字型別 (Numeric Type) 中建立字串:
class TestStringBuilder
{
static void Main()
{
System.Text.StringBuilder sb = new System.Text.StringBuilder();
// Create a string composed of numbers 0 - 9
for (int i = 0; i < 10; i++)
{
sb.Append(i.ToString());
}
System.Console.WriteLine(sb); // displays 0123456789
// Copy one character of the string (not possible with a System.String)
sb[0] = sb[9];
System.Console.WriteLine(sb); // displays 9123456789
}
}
字串、擴充方法和 LINQ
因為 String 型別會實作 IEnumerable<T>,您可以對字串使用 Enumerable 類別中定義的擴充方法。為了看起來不會過於雜亂,String 型別的 IntelliSense 會排除這些方法,但是,您仍然可以使用這些方法。您也可以對字串使用 LINQ 查詢運算式。如需詳細資訊,請參閱 LINQ 和字串。
請參閱
工作
HOW TO:使用規則運算式搜尋字串 (C# 程式設計手冊)