サービス ワークロード中のエラーのシミュレーション
Azure Service Fabric の Testability シナリオにより、開発者は個別のエラーの対応に追われることがなくなります。 ただし、クライアント ワークロードやエラーの明示的な割り込みが必要になるシナリオも存在します。 サービスはクライアント ワークロードとエラーの割り込みにより、エラーが発生した際に何らかのアクションを確実に実行します。 Testability が提供する高度な制御により、ワークロードの実行においてこれらが発生する可能性がある正確なポイントを特定できます。 このアプリケーションのさまざまな状態で発生するエラーがバグを発見し、品質の向上につながります。
サンプルのカスタム シナリオ
このテストは、 グレースフル エラーと非グレースフル エラーに対するビジネス ワークロードの割り込みについてのシナリオを示します。 最適な結果を得るには、サービスの運用中またはコンピューティング中にエラーを発生させる必要があります。
4 つのワークロード A、B、C、D を公開するサービスの例を見てみましょう。各ワークロードはワークフローのセットに対応し、コンピューティング、ストレージ、またはその両方の可能性があります。 わかりやすくするために、例からワークロードを抽出してみましょう。 この例では、次のエラーが実行されています。
- RestartNode: マシンの再起動をシミュレートするアングレースフル エラー。
- RestartDeployedCodePackage: サービス ホスト プロセスのクラッシュをシミュレートするアングレースフル エラー。
- RemoveReplica: レプリカの削除をシミュレートするグレースフル エラー。
- MovePrimary: Service Fabric ロード バランサーによってトリガーされるレプリカの移動をシミュレートするグレースフル エラー。
// Add a reference to System.Fabric.Testability.dll and System.Fabric.dll.
using System;
using System.Fabric;
using System.Fabric.Testability.Scenario;
using System.Threading;
using System.Threading.Tasks;
class Test
public static int Main(string[] args)
// Replace these strings with the actual version for your cluster and application.
string clusterConnection = "localhost:19000";
Uri applicationName = new Uri("fabric:/samples/PersistentToDoListApp");
Uri serviceName = new Uri("fabric:/samples/PersistentToDoListApp/PersistentToDoListService");
Console.WriteLine("Starting Workload Test...");
RunTestAsync(clusterConnection, applicationName, serviceName).Wait();
catch (AggregateException ae)
Console.WriteLine("Workload Test failed: ");
foreach (Exception ex in ae.InnerExceptions)
if (ex is FabricException)
Console.WriteLine("HResult: {0} Message: {1}", ex.HResult, ex.Message);
return -1;
Console.WriteLine("Workload Test completed successfully.");
return 0;
public enum ServiceWorkloads
public enum ServiceFabricFaults
public static async Task RunTestAsync(string clusterConnection, Uri applicationName, Uri serviceName)
// Create FabricClient with connection and security information here.
FabricClient fabricClient = new FabricClient(clusterConnection);
// Maximum time to wait for a service to stabilize.
TimeSpan maxServiceStabilizationTime = TimeSpan.FromSeconds(120);
// How many loops of faults you want to execute.
uint testLoopCount = 20;
Random random = new Random();
for (var i = 0; i < testLoopCount; ++i)
var workload = SelectRandomValue<ServiceWorkloads>(random);
// Start the workload.
var workloadTask = RunWorkloadAsync(workload);
// While the task is running, induce faults into the service. They can be ungraceful faults like
// RestartNode and RestartDeployedCodePackage or graceful faults like RemoveReplica or MovePrimary.
var fault = SelectRandomValue<ServiceFabricFaults>(random);
// Create a replica selector, which will select a primary replica from the given service to test.
var replicaSelector = ReplicaSelector.PrimaryOf(PartitionSelector.RandomOf(serviceName));
// Run the selected random fault.
await RunFaultAsync(applicationName, fault, replicaSelector, fabricClient);
// Validate the health and stability of the service.
await fabricClient.TestManager.ValidateServiceAsync(serviceName, maxServiceStabilizationTime);
// Wait for the workload to finish successfully.
await workloadTask;
private static async Task RunFaultAsync(Uri applicationName, ServiceFabricFaults fault, ReplicaSelector selector, FabricClient client)
switch (fault)
case ServiceFabricFaults.RestartNode:
await client.FaultManager.RestartNodeAsync(selector, CompletionMode.Verify);
case ServiceFabricFaults.RestartCodePackage:
await client.FaultManager.RestartDeployedCodePackageAsync(applicationName, selector, CompletionMode.Verify);
case ServiceFabricFaults.RemoveReplica:
await client.FaultManager.RemoveReplicaAsync(selector, CompletionMode.Verify, false);
case ServiceFabricFaults.MovePrimary:
await client.FaultManager.MovePrimaryAsync(selector.PartitionSelector);
private static Task RunWorkloadAsync(ServiceWorkloads workload)
throw new NotImplementedException();
// This is where you trigger and complete your service workload.
// Note that the faults induced while your service workload is running will
// fault the primary service. Hence, you will need to reconnect to complete or check
// the status of the workload.
private static T SelectRandomValue<T>(Random random)
Array values = Enum.GetValues(typeof(T));
T workload = (T)values.GetValue(random.Next(values.Length));
return workload;