共用方式為


字串基本概念 (C# 程式設計手冊)

更新:2007 年 11 月

字串是型別 String 的物件,其值為文字。在內部處理上,文字是以 Char 物件的唯讀集合的方式儲存,其中每個物件都代表一個以 UTF-16 編碼的 Unicode 字元。C# 字串尾端沒有 null 結尾字元 (與 C 和 C++ 不同),因此 C# 字串可以包含任何數目的內嵌 null 字元 ('\0')。不論字元是否由 Unicode Surrogate 字組所構成,字串的長度代表字元的數目。若要存取字串中個別的 Unicode 字碼指標,請使用 StringInfo 物件。

string 與 System.String 的比較

C# 中的 string 關鍵字是 String 的別名。因此,String 和 string 是對等用法,而您可以依偏好使用其中一個命名慣例。String 類別提供許多方法,讓您可以安全地建立、處理和比較字串。除此之外,C# 語言可以多載部分運算子,進而簡化一般字串作業。如需關鍵字的詳細資訊,請參閱 string (C# 參考)。如需型別和其方法的詳細資訊,請參閱 String

宣告和初始化字串

您可以使用許多方式宣告和初始化字串,如下列範例所示:

// Declare without initializing.
string message1;

// Initialize to null.
string message2 = null;

// Initialize as an empty string.
// Use the Empty constant instead of the literal "".
string message3 = System.String.Empty;

//Initialize with a regular string literal.
string oldPath = "c:\\Program Files\\Microsoft Visual Studio 8.0";

// Initialize with a verbatim string literal.
string newPath = @"c:\Program Files\Microsoft Visual Studio 9.0";

// Use System.String if you prefer.
System.String greeting = "Hello World!";

// In local variables (i.e. within a method body)
// you can use implicit typing.
var temp = "I'm still a strongly-typed System.String!";

// Use a const string to prevent 'message4' from
// being used to store another string value.
const string message4 = "You can't get rid of me!";

// Use the String constructor only when creating
// a string from a char*, char[], or sbyte*. See
// System.String documentation for details.
char[] letters = { 'A', 'B', 'C' };
string alphabet = new string(letters);

請注意,除了使用字元陣列初始化字串之外,其他情況下並不是使用 new 運算子來建立字串物件。

使用 Empty 常數值初始化字串,可以建立字串長度為零的新 String 物件。零長度字串的字串常值 (String Literal) 表示為 ""。藉由使用 Empty 值而非 null 來初始化字串,可以降低發生 NullReferenceException 的機會。請在嘗試存取字串值前,先使用 IsNullOrEmpty(String) 方法驗證該值。

字串物件的不變性

字串物件是「不可變」(Immutable):一旦建立就無法變更。看起來好像會修改字串的所有 String 方法和 C# 運算子,其實是傳回新字串物件的結果。下列範例中,在串連 s1 和 s2 的內容以構成單一字串時,並不會修改這兩個原始字串。+= 運算子會建立包含組合內容的新字串。該新物件會指派給變數 s1,並會將指派給 s1 的原始物件釋放以供記憶體回收,這是因為沒有其他的變數會參考到該原始物件。

string s1 = "A string is more ";
string s2 = "than the sum of its chars.";

// Concatenate s1 and s2. This actually creates a new
// string object and stores it in s1, releasing the
// reference to the original object.
s1 += s2;

System.Console.WriteLine(s1);
// Output: A string is more than the sum of its chars.

因為字串的「修改」實際上是新字串的建立,所以在建立字串參考時,您必須特別小心。如果您建立字串的參考,然後「修改」原始字串,此參考將會繼續指向原始的物件,而不是指向修改該字串後所建立的新物件。下列程式碼會說明這個行為:

string s1 = "Hello ";
string s2 = s1;
s1 += "World";

System.Console.WriteLine(s2);
//Output: Hello

如需如何依據修改建立新字串 (例如對原始字串進行搜尋和取代的作業) 的詳細資訊,請參閱 HOW TO:修改字串內容 (C# 程式設計手冊)

規則和逐字翻譯字串的常值

在必須內嵌 C# 所提供的逸出字元 (Escape Character) 時,請使用規則字串常值,如下列範例所示:

string columns = "Column 1\tColumn 2\tColumn 3";
//Output: Column 1        Column 2        Column 3

string rows = "Row 1\r\nRow 2\r\nRow 3";
/* Output:
  Row 1
  Row 2
  Row 3
*/

string title = "\"The \u00C6olean Harp\", by Samuel Taylor Coleridge";
//Output: "The Æolean Harp", by Samuel Taylor Coleridge

在字串文字包含反斜線字元時,例如檔案路徑,為了方便好讀,請使用逐字翻譯字串。因為逐字翻譯字串會保留字串文字中的新行字元,所以可以用來初始化多行字串。請使用雙引號內嵌逐字翻譯字串中的引號。下列範例顯示逐字翻譯字串的一些常見用法:

         string filePath = @"C:\Users\scoleridge\Documents\";
         //Output: C:\Users\scoleridge\Documents\

         string text = @"My pensive SARA ! thy soft cheek reclined
Thus on mine arm, most soothing sweet it is
To sit beside our Cot,...";
         /* Output:
         My pensive SARA ! thy soft cheek reclined
            Thus on mine arm, most soothing sweet it is
            To sit beside our Cot,... 
         */

         string quote = @"Her name was ""Sara.""";
         //Output: Her name was "Sara."

字串逸出序列

逸出序列

字元名稱

Unicode 編碼

\'

單引號

0x0027

\"

雙引號

0x0022

\\

反斜線

0x005C

\0

Null

0x0000

\a

警示

0x0007

\b

退格鍵 (Backspace)

0x0008

\f

換頁字元

0x000C

\n

新行

0x000A

\r

歸位字元 (Carriage Return)

0x000D

\t

水平 Tab

0x0009

\U

Surrogate 字組的 Unicode 逸出序列

\Unnnnnnnn

\u

Unicode 逸出序列

\u0041 = "A"

\v

垂直 Tab

0x000B

\x

類似 "\u" 的 Unicode 逸出序列,但具有可變長度

\x0041 = "A"

注意事項:

在編譯時期,逐字翻譯字串會轉換為一般字串再加上所有相同的逸出序列。因此,如果在偵錯工具監看式視窗中檢視逐字翻譯字串,就會看到編譯器加入的逸出字元,而不是原始程式碼中的逐字翻譯版本。例如,逐字翻譯字串 @"C:\files.txt" 在監看式視窗中會顯示為 "C:\\files.txt"。

格式字串

格式字串 (Format String) 這種字串的內容,可以在執行階段動態決定。建立格式字串的方式,是藉由使用靜態 Format 方法,並以大括號內嵌要在執行階段以其他值取代的替代符號 (Placeholder)。下列範例會使用格式字串,以輸出迴圈 (Loop) 中每次反覆運算的結果。

class FormatString
{
    static void Main()
    {
        // Get user input.
        System.Console.WriteLine("Enter a number");
        string input = System.Console.ReadLine();

        // Convert the input string to an int.
        int j;
        System.Int32.TryParse(input, out j);

        // Write a different string each iteration.
        string s;
        for (int i = 0; i < 10; i++)
        {
            // A simple format string with no alignment formatting.
            s = System.String.Format("{0} times {1} = {2}", i, j, (i * j));
            System.Console.WriteLine(s);
        }

        //Keep the console window open in debug mode.
        System.Console.ReadKey();
    }
}

WriteLine 方法有一個多載會採用格式字串做為參數。因此,您只要內嵌格式字串常值,而不用明確呼叫方法。然而,如果是使用 WriteLine 方法在 Visual Studio [輸出] 視窗中顯示偵錯輸出,則必須明確呼叫 Format 方法,因為 WriteLine 只接受字串,而非格式字串。如需格式字串的詳細資訊,請參閱格式化型別

子字串

子字串是包含在字串中的任何字元序列。使用 Substring 方法可以從原始字串的一部分建立新字串。藉由使用 IndexOf 方法,您可以搜尋子字串的一個或多個出現項目。使用 Replace 方法則會以新字串取代指定子字串的所有出現項目。跟 Substring 方法一樣,Replace 實際上會傳回新字串,而不會修改原始字串。如需詳細資訊,請參閱 HOW TO:使用字串方法搜尋字串 (C# 程式設計手冊)HOW TO:修改字串內容 (C# 程式設計手冊)

string s3 = "Visual C# Express";
System.Console.WriteLine(s3.Substring(7, 2));
// Output: "C#"

System.Console.WriteLine(s3.Replace("C#", "Basic"));
// Output: "Visual Basic Express"

// Index values are zero-based
int index = s3.IndexOf("C");
// index = 7

存取個別字元

您可以使用陣列標記法搭配索引值,取得個別字元的唯讀存取,如下列範例所示:

string s5 = "Printing backwards";

for (int i = 0; i < s5.Length; i++)
{
    System.Console.Write(s5[s5.Length - i - 1]);
}
// Output: "sdrawkcab gnitnirP"

在修改字串中的個別字元時,如果 String 方法沒有提供您必須擁有的功能,則可以使用 StringBuilder 物件「就地」修改個別字元,然後再使用 StringBuilder 方法建立新字串以儲存結果。在下列範例中,假設您必須以特殊方式修改原始字串,並儲存該結果供日後使用:

string question = "hOW DOES mICROSOFT wORD DEAL WITH THE cAPS lOCK KEY?";
System.Text.StringBuilder sb = new System.Text.StringBuilder(question);

for (int j = 0; j < sb.Length; j++)
{
    if (System.Char.IsLower(sb[j]) == true)
        sb[j] = System.Char.ToUpper(sb[j]);
    else if (System.Char.IsUpper(sb[j]) == true)
        sb[j] = System.Char.ToLower(sb[j]);
}
// Store the new string.
string corrected = sb.ToString();
System.Console.WriteLine(corrected);
// Output: How does Microsoft Word deal with the Caps Lock key?            

Null 字串和空字串

空字串是 System.String 物件的執行個體 (Instance),其中包含零個字元。空字串經常用於各種程式設計案例,以代表空白的文字欄位。您可以在空字串上呼叫方法,因為其為有效的 System.String 物件。空字串的初始化方式如下:

string s = String.Empty;

相較之下,null 字串不會參考 System.String 物件的執行個體,嘗試在 null 字串上呼叫方法會導致 NullReferenceException。不過,您可以使用 null 字串與其他字串進行串連和比較作業。下列範例說明參考 null 字串會不會導致例外狀況 (Exception) 擲回的一些案例:

static void Main()
{
    string str = "hello";
    string nullStr = null;
    string emptyStr = "a";

    string tempStr = str + nullStr; // tempStr = "hello"
    bool b = (emptyStr == nullStr);// b = false;
    string newStr = emptyStr + nullStr; // creates a new empty string
    int len = nullStr.Length; // throws NullReferenceException

}

使用 StringBuilder 快速建立字串

.NET 的字串作業是經過高度最佳化的,而且在絕大部分的情況下不會大幅影響到效能。然而,在有些案例下的字串作業可能會影響到效能,例如會執行數千百次的緊密迴圈。如果程式會執行許多字串處理,StringBuilder 類別可以建立字串緩衝區以提供更好的效能。StringBuilder 字串也可以讓您重新指派內建字串資料型別不支援的某些個別字元。例如,這個程式碼會在不建立新字串的情況下變更字串內容:

System.Text.StringBuilder sb = new System.Text.StringBuilder("Rat: the ideal pet");
sb[0] = 'C';
System.Console.WriteLine(sb.ToString());
System.Console.ReadLine();

//Outputs Cat: the ideal pet

在這個範例中,會使用 StringBuilder 物件從一組數字型別 (Numeric Type) 中建立字串:

class TestStringBuilder
{
    static void Main()
    {
        System.Text.StringBuilder sb = new System.Text.StringBuilder();

        // Create a string composed of numbers 0 - 9
        for (int i = 0; i < 10; i++)
        {
            sb.Append(i.ToString());
        }
        System.Console.WriteLine(sb);  // displays 0123456789

        // Copy one character of the string (not possible with a System.String)
        sb[0] = sb[9];

        System.Console.WriteLine(sb);  // displays 9123456789
    }
}

字串、擴充方法和 LINQ

因為 String 型別會實作 IEnumerable<T>,您可以對字串使用 Enumerable 類別中定義的擴充方法。為了看起來不會過於雜亂,String 型別的 IntelliSense 會排除這些方法,但是,您仍然可以使用這些方法。您也可以對字串使用 LINQ 查詢運算式。如需詳細資訊,請參閱 LINQ 和字串

請參閱

工作

HOW TO:使用規則運算式搜尋字串 (C# 程式設計手冊)

HOW TO:使用字串方法搜尋字串 (C# 程式設計手冊)

HOW TO:分割字串 (C# 程式設計手冊)

概念

C# 程式設計手冊

其他資源

剖析字串