ステートフル Reliable Services の構成

[アーティクル]
08/28/2024

Reliable Services の構成設定には 2 つのセットがあります。 1 つはクラスター内のすべての Reliable Services 用のグローバルな設定、もう 1 つは特定の Reliable Services に固有の設定です。

グローバル構成

Reliable Services のグローバル構成は、クラスターのクラスターマニフェストの KtlLogger セクションで指定されています。この構成を使用すると、共有ログの場所とサイズに加えて、ロガーによって使用されるグローバルメモリ制限を構成できます。クラスターマニフェストは、クラスター内のすべてのノードとサービスに適用される設定と構成を保持する単一の XML ファイルです。通常、このファイルは ClusterManifest.xml という名前です。 Get-ServiceFabricClusterManifest PowerShell コマンドを使用して、クラスターのクラスターマニフェストを確認できます。

構成名

名前	ユニット	既定値	解説
WriteBufferMemoryPoolMinimumInKB	キロバイト	8388608	ロガー書き込みバッファーメモリプールに対してカーネルモードで割り当てる最小 KB 数。このメモリプールは、ディスクに書き込む前の状態情報のキャッシュに使用されます。
WriteBufferMemoryPoolMaximumInKB	キロバイト	制限なし	ロガー書き込みバッファーメモリプールを拡張できる最大サイズ。
SharedLogId	GUID	""	クラスター内のすべてのノードの Reliable Services のうち、サービス固有の構成で SharedLogId が指定されていないすべてのサービスによって使用される既定の共有ログファイルの指定に使用される、一意の GUID を指定します。 SharedLogId を指定する場合は、SharedLogPath も指定する必要があります。
SharedLogPath	完全修飾パス名	""	クラスター内のすべてのノードの Reliable Services のうち、サービス固有の構成で SharedLogPath が指定されていないすべてのサービスによって使用される共有ログファイルの完全修飾パスを指定します。 SharedLogPath を指定した場合は、SharedLogId も指定する必要があります。
SharedLogSizeInMB	メガバイト	8192	共有ログ用に静的に割り当てるディスク領域の MB 数を指定します。 2048 以上の値を指定する必要があります。

Azure ARM またはオンプレミスの JSON テンプレートでは、次の例は、ステートフルサービスの信頼性の高いコレクションを戻すために作成される共有トランザクションログを変更する方法を示しています。

"fabricSettings": [{
    "name": "KtlLogger",
    "parameters": [{
        "name": "SharedLogSizeInMB",
        "value": "4096"
    }]
}]

開発者のローカルクラスターマニフェストセクションのサンプル

ローカル開発環境でこれを変更する場合は、ローカル clustermanifest.xml ファイルを編集する必要があります。

   <Section Name="KtlLogger">
     <Parameter Name="SharedLogSizeInMB" Value="4096"/>
     <Parameter Name="WriteBufferMemoryPoolMinimumInKB" Value="8192" />
     <Parameter Name="WriteBufferMemoryPoolMaximumInKB" Value="8192" />
     <Parameter Name="SharedLogId" Value="{7668BB54-FE9C-48ed-81AC-FF89E60ED2EF}"/>
     <Parameter Name="SharedLogPath" Value="f:\SharedLog.Log"/>
   </Section>

解説

ロガーには、非ページカーネルメモリから割り当てられるメモリのグローバルプールがあります。ノード上のすべての Reliable Services は、Reliable Services レプリカに関連付けられている専用ログに書き込まれる前の状態データのキャッシュに、このプールを使用できます。プールのサイズは、WriteBufferMemoryPoolMinimumInKB および WriteBufferMemoryPoolMaximumInKB の設定によって制御されます。 WriteBufferMemoryPoolMinimumInKB は、このメモリプールの初期サイズと、メモリプールを縮小できる最小サイズの両方を指定します。 WriteBufferMemoryPoolMaximumInKB は、メモリプールが拡大できる最大サイズです。開かれている各 Reliable Services レプリカは、WriteBufferMemoryPoolMaximumInKB 以下のシステムによって決定される大きさまで、メモリプールのサイズを増やすことができます。メモリプールのメモリをさらに使用する必要がある場合、メモリの要求はメモリが使用可能になるまで遅延されます。そのため、書き込みバッファーメモリプールが特定の構成に対して小さすぎる場合、パフォーマンスが低下します。

SharedLogId と SharedLogPath の設定は常に一緒に使用されて、クラスター内のすべてのノードに対する既定の共有ログの GUID と場所を定義します。既定の共有ログは、settings.xml でサービス固有の設定が指定されていないすべての Reliable Services に使用されます。最善のパフォーマンスを得るには、競合が減るように、共有ログファイルを専用のディスクに配置する必要があります。

SharedLogSizeInMB では、すべてのノードで既定の共有ログに前もって割り当てるディスク領域の量を指定します。 SharedLogSizeInMB を指定するために SharedLogId と SharedLogPath を指定する必要はありません。

サービス固有の構成

ステートフル Reliable Services の既定の構成は、構成パッケージ (Config) か、サービス実装 (コード) を通じて変更できます。

Config - 構成パッケージを使用して構成する場合は、アプリケーションの各サービスの Config フォルダーの下にある Microsoft Visual Studio パッケージルートに生成された Settings.xml ファイルを変更します。
コード - コードを使用して構成する場合は、適切なオプションが設定された ReliableStateManagerConfiguration オブジェクトを使用して ReliableStateManager を作成します。

既定では、Azure Service Fabric ランタイムは settings.xml ファイルで定義済みのセクション名を検索し、基になるランタイムコンポーネントの作成中に構成値を使用します。

Note

コードを使用してサービスを構成する予定でない限り、Visual Studio ソリューションで生成された Settings.xml ファイルの次の構成のセクション名は削除 しない でください。構成パッケージまたはセクションの名前を変更するには、ReliableStateManager の構成時にコードを変更する必要があります。

レプリケーターのセキュリティ構成

レプリケーション時に使用される通信チャネルをセキュリティで保護するには、レプリケーターのセキュリティ構成を使用します。これは、サービスは互いのレプリケーショントラフィックを表示できないため、高可用性データもセキュリティ保護されることを意味します。既定では、セキュリティ構成セクションが空の場合、レプリケーションセキュリティは有効になりません。

重要

Linux ノードでは、証明書は PEM 形式でなければなりません。 Linux での証明書の場所と構成について詳しくは、Linux 上での証明書の構成に関する記事をご覧ください。

既定のセクション名

ReplicatorSecurityConfig

Note

このセクション名を変更するには、このサービスの ReliableStateManager を作成するときに replicatorSecuritySectionName パラメーターを ReliableStateManagerConfiguration コンストラクターにオーバーライドします。

レプリケーター構成

レプリケーター構成は、状態をローカルにレプリケートして永続化することでステートフル Reliable Service の状態の信頼性を高める役割を持つレプリケーターを構成します。既定の構成は Visual Studio テンプレートによって生成され、これで十分なはずです。このセクションでは、レプリケーターのチューニングに使用できる追加の構成について説明します。

既定のセクション名

ReplicatorConfig

Note

このセクション名を変更するには、このサービスの ReliableStateManager を作成するときに replicatorSettingsSectionName パラメーターを ReliableStateManagerConfiguration コンストラクターにオーバーライドします。

構成名

名前	ユニット	既定値	解説
BatchAcknowledgementInterval	Seconds	0.015	操作を受信してからプライマリに受信確認を返すまで、セカンダリでレプリケーターが待機する期間です。この期間内で処理された操作に対して送信される他の受信確認は、1 つの応答として送信されます。
ReplicatorEndpoint	該当なし	既定値なし - 必須パラメーター	プライマリとセカンダリのレプリケーターがレプリカセットの他のレプリケーターと通信するために使用する IP アドレスとポートです。これは、サービスマニフェストの TCP リソースエンドポイントを参照する必要があります。サービスマニフェストでのエンドポイントリソース定義の詳細については、サービスマニフェストのリソースに関する記事を参照してください。
MaxPrimaryReplicationQueueSize	操作数	8192	プライマリキューの操作の最大数です。操作は、プライマリレプリケーターがすべてのセカンダリレプリケーターから受信確認を受信した後に解放されます。この値は 64 より大きく、2 のべき乗である必要があります。
MaxSecondaryReplicationQueueSize	操作数	16384	セカンダリキューの操作の最大数です。操作は、永続性によってその状態の高可用性が実現されてから解放されます。この値は 64 より大きく、2 のべき乗である必要があります。
CheckpointThresholdInMB	MB	50	その後で状態がチェックポイントされるログファイル領域の量。
MaxRecordSizeInKB	KB	1024	レプリケーターがログに書き込むことができるレコードの最大サイズです。この値は 4 の倍数で 16 より大きい必要があります。
MinLogSizeInMB	MB	0 (システムによって決定)	トランザクションログの最小サイズ。この設定を下回るサイズまでログを切り捨てることはできません。 0 は、レプリケーターによって最少ログサイズが決定されることを示します。この値を大きくすると、関連するログレコードが切り捨てられる可能性が低くなるため、部分的なコピーと増分バックアップが実行される可能性が高くなります。
TruncationThresholdFactor	要素	2	ログがどのサイズになった時点で切り捨てがトリガーされるかを指定します。切り捨てのしきい値は、MinLogSizeInMB に TruncationThresholdFactor を乗算して決定されます。 TruncationThresholdFactor は 1 より大きくする必要があります。 MinLogSizeInMB * TruncationThresholdFactor は MaxStreamSizeInMB より小さくする必要があります。
ThrottlingThresholdFactor	要素	4	ログがどのサイズになった時点でレプリカのスロットルが開始されるかを指定します。スロットルのしきい値 (MB) は、Max((MinLogSizeInMB * ThrottlingThresholdFactor),(CheckpointThresholdInMB * ThrottlingThresholdFactor)) によって決定されます。スロットルのしきい値 (MB) は、切り捨てのしきい値 (MB) より大きくする必要があります。切り捨てのしきい値 (MB) は MaxStreamSizeInMB より小さくする必要があります。
MaxAccumulatedBackupLogSizeInMB	MB	800	1 つのバックアップログチェーンに含まれるバックアップログの最大累積サイズ (MB)。増分バックアップを実行してバックアップログが生成されると関連する完全バックアップ以降の累積バックアップログがこのサイズを超える場合は、増分バックアップ要求が失敗します。そのような場合には、ユーザーは完全バックアップを取得する必要があります。
SharedLogId	GUID	""	このレプリカで使用される共有ログファイルの識別に使用する一意の GUID を指定します。通常、サービスではこの設定を使用しないはずですが、 SharedLogId を指定した場合は、SharedLogPath も指定する必要があります。
SharedLogPath	完全修飾パス名	""	このレプリカの共有ログファイルが作成される完全修飾パスを指定します。通常、サービスではこの設定を使用しないはずですが、 SharedLogPath を指定した場合は、SharedLogId も指定する必要があります。
SlowApiMonitoringDuration	Seconds	300	マネージド API 呼び出しの監視間隔を設定します。たとえば、バックアップのコールバック関数を用意しておき、一定時間が経過したときに、警告の状態レポートを Health Manager に送信します。
LogTruncationIntervalSeconds	Seconds	0	各レプリカでログの切り捨てが開始される、構成可能な間隔です。ログのサイズだけでなく時間に基づいてログが切り捨てられるようにする場合にも使用されます。この設定により、リライアブルディクショナリの削除済みエントリも強制的に消去されます。そのため、この設定を使用すると、削除済みの項目を適切なタイミングで消去できます。
EnableStableReads	Boolean	False	安定した読み取りを有効にすると、セカンダリレプリカは、クォーラムで確認された戻り値に限定されます。

コードによるサンプル構成

class Program
{
    /// <summary>
    /// This is the entry point of the service host process.
    /// </summary>
    static void Main()
    {
        ServiceRuntime.RegisterServiceAsync("HelloWorldStatefulType",
            context => new HelloWorldStateful(context, 
                new ReliableStateManager(context, 
        new ReliableStateManagerConfiguration(
                        new ReliableStateManagerReplicatorSettings()
            {
                RetryInterval = TimeSpan.FromSeconds(3)
                        }
            )))).GetAwaiter().GetResult();
    }
}

class MyStatefulService : StatefulService
{
    public MyStatefulService(StatefulServiceContext context, IReliableStateManagerReplica stateManager)
        : base(context, stateManager)
    { }
    ...
}

サンプル構成ファイル

<?xml version="1.0" encoding="utf-8"?>
<Settings xmlns:xsd="https://www.w3.org/2001/XMLSchema" xmlns:xsi="https://www.w3.org/2001/XMLSchema-instance" xmlns="http://schemas.microsoft.com/2011/01/fabric">
   <Section Name="ReplicatorConfig">
      <Parameter Name="ReplicatorEndpoint" Value="ReplicatorEndpoint" />
      <Parameter Name="BatchAcknowledgementInterval" Value="0.05"/>
      <Parameter Name="CheckpointThresholdInMB" Value="512" />
   </Section>
   <Section Name="ReplicatorSecurityConfig">
      <Parameter Name="CredentialType" Value="X509" />
      <Parameter Name="FindType" Value="FindByThumbprint" />
      <Parameter Name="FindValue" Value="9d c9 06 b1 69 dc 4f af fd 16 97 ac 78 1e 80 67 90 74 9d 2f" />
      <Parameter Name="StoreLocation" Value="LocalMachine" />
      <Parameter Name="StoreName" Value="My" />
      <Parameter Name="ProtectionLevel" Value="EncryptAndSign" />
      <Parameter Name="AllowedCommonNames" Value="My-Test-SAN1-Alice,My-Test-SAN1-Bob" />
   </Section>
</Settings>

解説

BatchAcknowledgementInterval は、レプリケーションの待機時間を制御します。値が '0' の場合、待機時間は最短になりますが、スループットに影響します (送信および処理が必要な受信確認メッセージが増え、それぞれに含まれる受信確認が少なくなります)。 BatchAcknowledgementInterval の値が大きいほど、全体的なレプリケーションのスループットが高くなり、操作の待機時間が長くなります。これは、トランザクションのコミットの待機時間に直結します。

CheckpointThresholdInMB の値により、レプリケーターがレプリカの専用ログファイルの状態情報の保存に使用できるディスク領域の量を制御します。この値を既定値よりも大きくすると、セットに新しいレプリカを追加したときの再構成時間が短くなります。これは、ログで使用できる操作履歴が増えることで部分的な状態転送が発生するためです。ただし、クラッシュ後のレプリカの復旧時間は長くなる可能性があります。

MaxRecordSizeInKB 設定は、レプリケーターがログファイルに書き込むことのできるレコードの最大サイズを定義します。ほとんどすべてのケースで、最適なレコードのサイズは既定の 1,024 KB ですが、サービスで大きなデータ項目を状態情報に含めようとしている場合、この値を増やさなければならない場合があります。小さいレコードは小さいレコードに必要な領域しか使用しないため、MaxRecordSizeInKB を 1024 より小さくしてもほとんど効果はありません。これを変更する必要があるのは、まれなケースだけであると予想されます。

SharedLogId と SharedLogPath の設定は常に一緒に使用して、サービスがノードの既定の共有ログとは別の共有ログを使用できるようにします。最適な効率を得るため、できるだけ多くのサービスで同じ共有ログを指定してください。共有ログファイルは、ヘッドの移動の競合が減るように、共有ログファイル専用に使用されるディスクに配置する必要があります。これを変更する必要があるのは、まれなケースだけであると予想されます。

次の方法で共有

ステートフル Reliable Services の構成

グローバル構成

構成名

開発者のローカルクラスターマニフェストセクションのサンプル

解説

サービス固有の構成

レプリケーターのセキュリティ構成

既定のセクション名

レプリケーター構成

既定のセクション名

構成名

コードによるサンプル構成

サンプル構成ファイル

解説

次のステップ

フィードバック

その他のリソース

次の方法で共有

ステートフル Reliable Services の構成

グローバル構成

構成名

開発者のローカル クラスター マニフェスト セクションのサンプル

解説

サービス固有の構成

レプリケーターのセキュリティ構成

既定のセクション名

レプリケーター構成

既定のセクション名

構成名

コードによるサンプル構成

サンプル構成ファイル

解説

次のステップ

フィードバック

その他のリソース

開発者のローカルクラスターマニフェストセクションのサンプル