延迟初始化
对象的迟缓初始化意味着推迟创建该对象,直到它被首次使用。 (在本主题中,术语“迟缓初始化”和“迟缓实例化”是同义词。)迟缓初始化主要用于提升性能、避免计算浪费和降低程序内存需求。 以下是常见方案:
对象创建成本高且程序可能不会使用它。 例如,假定内存中有具有
Orders
属性的Customer
对象,该对象包含大量Order
对象,初始化这些对象需要数据库连接。 如果用户永远不要求显示 Orders 或在计算中使用该数据,则无需使用系统内存或计算周期来创建它。 通过使用Lazy<Orders>
来声明Orders
对象用于迟缓初始化,可以避免在不使用该对象时浪费系统资源。对象创建成本高,且希望将其创建推迟到其他高成本操作完成后。 例如,假定程序在启动时加载多个对象实例,但是只需立即加载其中一部分。 可以通过推迟初始化不需要的对象,直到创建所需对象,提升程序的启动性能。
虽然可以编写自己的代码来执行迟缓初始化,但我们建议使用 Lazy<T>。 Lazy<T> 及其相关的类型还支持线程安全并提供一致的异常传播策略。
下表列出了 .NET Framework 版本 4 提供的在不同方案中启用迟缓初始化的类型。
类型 | 说明 |
---|---|
Lazy<T> | 为任何类库或用户定义类型提供迟缓初始化语义的包装类。 |
ThreadLocal<T> | 类似于 Lazy<T>,除了该包装类基于线程本地提供迟缓初始化语义。 每个线程都可以访问自己唯一的值。 |
LazyInitializer | 为对象的迟缓初始化提供高级 static (Visual Basic 中的 Shared )方法,无需支付类的成本。 |
基本迟缓初始化
若要定义迟缓初始化类型(例如 MyType
),使用 Lazy<MyType>
(Visual Basic 中的 Lazy(Of MyType)
),如以下示例所示。 如果没有在 Lazy<T> 构造函数中传入委托,则在首次访问值属性时,将使用 Activator.CreateInstance 创建包装类型。 如果该类型没有无参数构造函数,则会引发运行时异常。
在以下示例中,假定 Orders
是包含从数据库检索的大量 Order
对象的类。 Customer
对象包含 Orders
的实例,但根据用户操作,可能不需要 Orders
对象的数据。
// Initialize by using default Lazy<T> constructor. The
// Orders array itself is not created yet.
Lazy<Orders> _orders = new Lazy<Orders>();
' Initialize by using default Lazy<T> constructor. The
'Orders array itself is not created yet.
Dim _orders As Lazy(Of Orders) = New Lazy(Of Orders)()
还可以在 Lazy<T> 构造函数中传递委托(该委托在创建时调用包装类型上的特定构造函数重载),并执行所需的任何其他初始化步骤,如以下示例所示。
// Initialize by invoking a specific constructor on Order when Value
// property is accessed
Lazy<Orders> _orders = new Lazy<Orders>(() => new Orders(100));
' Initialize by invoking a specific constructor on Order
' when Value property is accessed
Dim _orders As Lazy(Of Orders) = New Lazy(Of Orders)(Function() New Orders(100))
创建迟缓对象后,在首次访问迟缓变量的 Value 属性前,不会创建 Orders
的实例。 首次访问时,会创建并返回包装类型,并将其存储起来以便将来访问。
// We need to create the array only if displayOrders is true
if (displayOrders == true)
{
DisplayOrders(_orders.Value.OrderData);
}
else
{
// Don't waste resources getting order data.
}
' We need to create the array only if _displayOrders is true
If _displayOrders = True Then
DisplayOrders(_orders.Value.OrderData)
Else
' Don't waste resources getting order data.
End If
Lazy<T> 对象总是返回其初始化的相同对象或值。 因此,Value 属性为只读。 如果 Value 存储了引用类型,将无法为其分配新对象。 (但是,可以更改其可设置的公共字段和属性的值。)如果 Value 存储了值类型,你无法修改其值。 但是,可以通过再次调用变量构造函数,使用新参数来创建新变量。
_orders = new Lazy<Orders>(() => new Orders(10));
_orders = New Lazy(Of Orders)(Function() New Orders(10))
新的迟缓实例与之前的实例一样,不会实例化 Orders
,直到首次访问其 Value 属性。
线程安全初始化
默认情况下,Lazy<T> 对象是线程安全的。 也就是说,如果构造函数没有指定线程安全性的类型,该函数创建的 Lazy<T> 对象是线程安全的。 在多线程方案中,访问线程安全 Lazy<T> 对象的 Value 属性的第一个线程会为所有线程上的所有后续访问对其初始化,且所有线程共享相同的数据。 因此,哪个线程初始化对象并不重要,争用条件是良性的。
备注
可以通过使用异常缓存将此一致性扩展到错误条件。 有关详细信息,请参阅下一部分迟缓对象的异常。
以下示例演示了相同的 Lazy<int>
实例对于三个单独的线程具有相同的值。
// Initialize the integer to the managed thread id of the
// first thread that accesses the Value property.
Lazy<int> number = new Lazy<int>(() => Thread.CurrentThread.ManagedThreadId);
Thread t1 = new Thread(() => Console.WriteLine("number on t1 = {0} ThreadID = {1}",
number.Value, Thread.CurrentThread.ManagedThreadId));
t1.Start();
Thread t2 = new Thread(() => Console.WriteLine("number on t2 = {0} ThreadID = {1}",
number.Value, Thread.CurrentThread.ManagedThreadId));
t2.Start();
Thread t3 = new Thread(() => Console.WriteLine("number on t3 = {0} ThreadID = {1}", number.Value,
Thread.CurrentThread.ManagedThreadId));
t3.Start();
// Ensure that thread IDs are not recycled if the
// first thread completes before the last one starts.
t1.Join();
t2.Join();
t3.Join();
/* Sample Output:
number on t1 = 11 ThreadID = 11
number on t3 = 11 ThreadID = 13
number on t2 = 11 ThreadID = 12
Press any key to exit.
*/
' Initialize the integer to the managed thread id of the
' first thread that accesses the Value property.
Dim number As Lazy(Of Integer) = New Lazy(Of Integer)(Function()
Return Thread.CurrentThread.ManagedThreadId
End Function)
Dim t1 As New Thread(Sub()
Console.WriteLine("number on t1 = {0} threadID = {1}",
number.Value, Thread.CurrentThread.ManagedThreadId)
End Sub)
t1.Start()
Dim t2 As New Thread(Sub()
Console.WriteLine("number on t2 = {0} threadID = {1}",
number.Value, Thread.CurrentThread.ManagedThreadId)
End Sub)
t2.Start()
Dim t3 As New Thread(Sub()
Console.WriteLine("number on t3 = {0} threadID = {1}",
number.Value, Thread.CurrentThread.ManagedThreadId)
End Sub)
t3.Start()
' Ensure that thread IDs are not recycled if the
' first thread completes before the last one starts.
t1.Join()
t2.Join()
t3.Join()
' Sample Output:
' number on t1 = 11 ThreadID = 11
' number on t3 = 11 ThreadID = 13
' number on t2 = 11 ThreadID = 12
' Press any key to exit.
如果每个线程需要单独的数据,使用 ThreadLocal<T> 类型,如本主题后面所述。
一些 Lazy<T> 构造函数具有名为 isThreadSafe
的布尔参数,该参数用于指定是否从多线程访问 Value 属性。 如果想要仅从一个线程访问属性,则传入 false
以获取适度的性能优势。 如果想要从多线程访问属性,则传入 true
以指示 Lazy<T> 实例正确处理争用条件(初始化时一个线程引发异常)。
一些 Lazy<T> 构造函数具有命名为 mode
的 LazyThreadSafetyMode 参数。 这些构造函数可提供其他线程安全模式。 下表显示了 Lazy<T> 对象的线程安全性如何受到指定线程安全性的构造函数参数的影响。 每个构造函最多具有一个此类参数。
对象的线程安全性 | LazyThreadSafetyMode mode 参数 |
布尔 isThreadSafe 参数 |
没有线程安全性参数 |
---|---|---|---|
完全线程安全;一次只有一个线程尝试初始化值。 | ExecutionAndPublication | true |
是的。 |
非线程安全。 | None | false |
不适用。 |
完全线程安全;线程争用以初始化值。 | PublicationOnly | 不适用。 | 不适用。 |
如此表所示,为 mode
参数指定 LazyThreadSafetyMode.ExecutionAndPublication 与为 isThreadSafe
参数指定 true
相同,并且指定 LazyThreadSafetyMode.None 与指定 false
相同。
有关 Execution
和 Publication
含义的详细信息,请参阅 LazyThreadSafetyMode。
指定 LazyThreadSafetyMode.PublicationOnly 允许多个线程尝试初始化 Lazy<T> 实例。 只有一个线程可以赢得此争用,而其他所有线程都将接收成功的线程初始化的值。 如果在初始化期间,某个线程引发了异常,则此线程不会接收成功的线程设置的值。 不会缓存异常,因此随后尝试访问 Value 属性可能会导致初始化成功。 这与其他模式中的异常处理方式不同,下面将对此进行描述。 有关详细信息,请参见 LazyThreadSafetyMode 枚举。
迟缓对象的异常
如前所述,Lazy<T> 对象始终返回其初始化的相同对象或值,因此 Value 属性是只读的。 如果启用异常缓存,则此永久性还会扩展到异常行为。 如果迟缓初始化对象启用了异常缓存,并在首次访问 Value 属性时从其初始化方法引发了异常,则随后每次尝试访问该 Value 属性时都会引发相同的异常。 也就是说,即使在多线程方案中,包装类型的构造函数也绝不会被重新调用。 因此,Lazy<T> 对象不能在一次访问时引发异常,并在随后访问时返回值。
当使用任何采用初始化方法(valueFactory
参数)的 System.Lazy<T> 构造函数时,都会启用异常缓存;例如,当使用 Lazy(T)(Func(T))
构造函数时,会启用异常缓存。 如果构造函数还使用 LazyThreadSafetyMode 值(mode
参数),请指定 LazyThreadSafetyMode.ExecutionAndPublication 或 LazyThreadSafetyMode.None。 指定初始化方法可启用这两种模式的异常缓存。 初始化方法非常简单。 例如,它可能会调用 T
的无参数构造函数:C# 中的 new Lazy<Contents>(() => new Contents(), mode)
或 Visual Basic 中的 New Lazy(Of Contents)(Function() New Contents())
。 如果使用不指定初始化方法的 System.Lazy<T> 构造函数,则不会缓存 T
无参数构造函数引发的异常。 有关详细信息,请参见 LazyThreadSafetyMode 枚举。
备注
如果通过将 isThreadSafe
构造函数参数设置为 false
或将 mode
构造函数参数设置为 LazyThreadSafetyMode.None 来创建 Lazy<T> 对象,则必须从单个线程访问 Lazy<T> 对象或提供你自己的同步。 这适用于对象的所有方面,包括异常缓存。
如上一节所述,通过指定 LazyThreadSafetyMode.PublicationOnly 创建的 Lazy<T> 对象会以不同方式处理异常。 通过 PublicationOnly,多个线程可以通过争用来初始化 Lazy<T> 实例。 在这种情况下,不会缓存异常,并且可以继续尝试访问 Value 属性,直到初始化成功。
下表总结了 Lazy<T> 构造函数控制异常缓存的方式。
构造函数 | 线程安全性 | 使用初始化方法 | 异常被缓存 |
---|---|---|---|
Lazy(T)() | %> | 否 | 否 |
Lazy(T)(Func(T)) | %> | 是 | 是 |
Lazy(T)(Boolean) | True (ExecutionAndPublication) 或 false (None) |
否 | 否 |
Lazy(T)(Func(T), Boolean) | True (ExecutionAndPublication) 或 false (None) |
是 | 是 |
Lazy(T)(LazyThreadSafetyMode) | 用户指定 | 否 | 否 |
Lazy(T)(Func(T), LazyThreadSafetyMode) | 用户指定 | 是 | 如果用户指定 PublicationOnly 则为 no;否则为 yes。 |
实现迟缓初始化的属性
若要通过使用迟缓初始化实现公共属性,则将该属性的支持字段定义为 Lazy<T>,并从该属性的 get
访问器返回 Value 属性。
class Customer
{
private Lazy<Orders> _orders;
public string CustomerID {get; private set;}
public Customer(string id)
{
CustomerID = id;
_orders = new Lazy<Orders>(() =>
{
// You can specify any additional
// initialization steps here.
return new Orders(this.CustomerID);
});
}
public Orders MyOrders
{
get
{
// Orders is created on first access here.
return _orders.Value;
}
}
}
Class Customer
Private _orders As Lazy(Of Orders)
Public Shared CustomerID As String
Public Sub New(ByVal id As String)
CustomerID = id
_orders = New Lazy(Of Orders)(Function()
' You can specify additional
' initialization steps here
Return New Orders(CustomerID)
End Function)
End Sub
Public ReadOnly Property MyOrders As Orders
Get
Return _orders.Value
End Get
End Property
End Class
Value 属性是只读的;因此,将其公开的属性没有 set
访问器。 如果需要由 Lazy<T> 对象支持的读取/写入属性,则 set
访问器必须创建一个新的 Lazy<T> 对象并将其分配到后备存储。 set
访问器必须创建一个 lambda 表达式(该表达式返回传递给 set
访问器的新属性值),并将该 lambda 表达式传递给新的 Lazy<T> 对象的构造函数。 下一次访问 Value 属性将导致新 Lazy<T> 的初始化,并且其 Value 属性此后会返回已分配给该属性的新值。 进行此复杂安排的原因是保留内置于 Lazy<T> 的多线程保护。 否则,属性访问器必须缓存由 Value 属性返回的第一个值并仅修改缓存值,而用户必须编写自己的线程安全代码才能执行此操作。 因为由 Lazy<T> 对象支持的读取/写入属性需要其他初始化,因此此性能可能不可接受。 此外,可能需要额外的协调以避免资源库与 getter 之间的争用条件,具体取决于特定方案。
线程本地迟缓初始化
在一些多线程方案中,可能需要为每个线程提供其专用数据。 此类数据称为线程本地数据。 在 .NET Framework 版本 3.5 及先前版本中,可以将 ThreadStatic
属性应用到静态变量,使其成为本地线程。 然而,使用 ThreadStatic
属性可能会导致细微的错误。 例如,即使是基本的初始化语句也将导致仅在访问其的首个线程上初始化变量,如以下示例所示。
[ThreadStatic]
static int counter = 1;
<ThreadStatic()>
Shared counter As Integer
在所有其他线程上,变量将通过使用其默认值(零)进行初始化。 作为 .NET Framework 版本 4 中的替代方法,可以使用 System.Threading.ThreadLocal<T> 类型创建一个基于实例的线程本地变量,该变量由你提供的 Action<T> 委托在所有线程上进行初始化。 在以下示例中,访问 counter
的所有线程都将其启动值视为 1。
ThreadLocal<int> betterCounter = new ThreadLocal<int>(() => 1);
Dim betterCounter As ThreadLocal(Of Integer) = New ThreadLocal(Of Integer)(Function() 1)
ThreadLocal<T> 包装其对象的方式与 Lazy<T> 非常相似,但存在以下主要区别:
每个线程都通过使用其自己的专有数据来初始化线程本地变量,这些数据不能从其他线程访问。
ThreadLocal<T>.Value 属性可以读取和写入,并且可以修改任意次数。 这可能会影响异常传播,例如,一个
get
操作可能会引发异常,但下一个操作可能会成功初始化该值。如果没有提供初始化委托,ThreadLocal<T> 将通过使用该类型的默认值初始化其包装类型。 在这一方面,ThreadLocal<T> 与 ThreadStaticAttribute 属性一致。
以下示例显示了每个访问 ThreadLocal<int>
实例的线程都将获取其数据的唯一副本。
// Initialize the integer to the managed thread id on a per-thread basis.
ThreadLocal<int> threadLocalNumber = new ThreadLocal<int>(() => Thread.CurrentThread.ManagedThreadId);
Thread t4 = new Thread(() => Console.WriteLine("threadLocalNumber on t4 = {0} ThreadID = {1}",
threadLocalNumber.Value, Thread.CurrentThread.ManagedThreadId));
t4.Start();
Thread t5 = new Thread(() => Console.WriteLine("threadLocalNumber on t5 = {0} ThreadID = {1}",
threadLocalNumber.Value, Thread.CurrentThread.ManagedThreadId));
t5.Start();
Thread t6 = new Thread(() => Console.WriteLine("threadLocalNumber on t6 = {0} ThreadID = {1}",
threadLocalNumber.Value, Thread.CurrentThread.ManagedThreadId));
t6.Start();
// Ensure that thread IDs are not recycled if the
// first thread completes before the last one starts.
t4.Join();
t5.Join();
t6.Join();
/* Sample Output:
threadLocalNumber on t4 = 14 ThreadID = 14
threadLocalNumber on t5 = 15 ThreadID = 15
threadLocalNumber on t6 = 16 ThreadID = 16
*/
' Initialize the integer to the managed thread id on a per-thread basis.
Dim threadLocalNumber As New ThreadLocal(Of Integer)(Function() Thread.CurrentThread.ManagedThreadId)
Dim t4 As New Thread(Sub()
Console.WriteLine("number on t4 = {0} threadID = {1}",
threadLocalNumber.Value, Thread.CurrentThread.ManagedThreadId)
End Sub)
t4.Start()
Dim t5 As New Thread(Sub()
Console.WriteLine("number on t5 = {0} threadID = {1}",
threadLocalNumber.Value, Thread.CurrentThread.ManagedThreadId)
End Sub)
t5.Start()
Dim t6 As New Thread(Sub()
Console.WriteLine("number on t6 = {0} threadID = {1}",
threadLocalNumber.Value, Thread.CurrentThread.ManagedThreadId)
End Sub)
t6.Start()
' Ensure that thread IDs are not recycled if the
' first thread completes before the last one starts.
t4.Join()
t5.Join()
t6.Join()
'Sample(Output)
' threadLocalNumber on t4 = 14 ThreadID = 14
' threadLocalNumber on t5 = 15 ThreadID = 15
' threadLocalNumber on t6 = 16 ThreadID = 16
Parallel.For 和 ForEach 中的线程本地变量
当使用 Parallel.For 方法或 Parallel.ForEach 方法来并行循环访问数据源时,可以使用包含针对线程本地数据的内置支持的重载。 在这些方法中,通过使用本地委托来创建、访问和清理数据,可以实现线程本地性。 有关详细信息,请参阅如何:编写具有线程局部变量的 Parallel.For 循环和如何:使用分区本地变量编写 Parallel.ForEach 循环。
将迟缓初始化用于开销较低的方案
在必须迟缓初始化大量对象的方案中,你可能会认为在 Lazy<T> 中包装每个对象需要过多的内存或过多的计算资源。 或者,你可能对如何公开迟缓初始化有严格要求。 在这种情况下,可以使用 System.Threading.LazyInitializer 类的 static
(Visual Basic 中的 Shared
)方法来迟缓初始化每个对象,而不会将其包装在 Lazy<T> 的实例中。
在以下示例中,假定你仅具有所需的迟缓初始化的单个Order
对象,而不是将整个 Orders
对象包装在一个 Lazy<T> 对象中。
// Assume that _orders contains null values, and
// we only need to initialize them if displayOrderInfo is true
if (displayOrderInfo == true)
{
for (int i = 0; i < _orders.Length; i++)
{
// Lazily initialize the orders without wrapping them in a Lazy<T>
LazyInitializer.EnsureInitialized(ref _orders[i], () =>
{
// Returns the value that will be placed in the ref parameter.
return GetOrderForIndex(i);
});
}
}
' Assume that _orders contains null values, and
' we only need to initialize them if displayOrderInfo is true
If displayOrderInfo = True Then
For i As Integer = 0 To _orders.Length
' Lazily initialize the orders without wrapping them in a Lazy(Of T)
LazyInitializer.EnsureInitialized(_orders(i), Function()
' Returns the value that will be placed in the ref parameter.
Return GetOrderForIndex(i)
End Function)
Next
End If
在此示例中,请注意循环的每次迭代都会调用初始化过程。 在多线程方案中,所有线程都会知道调用初始化过程的第一个线程的值。 后续线程也会调用初始化过程,但不会使用其值。 如果这种潜在的争用条件是不可接受的,请使用 LazyInitializer.EnsureInitialized 的重载,获取布尔参数和同步对象。