Azure Event Hubs と Kafka データフローエンドポイントを構成する

[アーティクル]
11/21/2024

重要

このページには、プレビュー段階にある Kubernetes デプロイマニフェストを使用して Azure IoT Operations コンポーネントを管理する手順が含まれます。この機能はいくつかの制限を設けて提供されており、運用環境のワークロードには使用しないでください。

ベータ版、プレビュー版、または一般提供としてまだリリースされていない Azure の機能に適用される法律条項については、「Microsoft Azure プレビューの追加使用条件」を参照してください。

Azure IoT Operations と Apache Kafka ブローカー間の双方向通信を設定するために、データフローエンドポイントを構成できます。この構成では、エンドポイント、トランスポート層セキュリティ (TLS)、認証、およびその他の設定を指定できます。

前提条件

Azure IoT Operations のインスタンス

Azure Event Hubs

Azure Event Hubs は Kafka プロトコルと互換性があり、いくつかの制限付きでデータフローとともに使用できます。

Azure Event Hubs 名前空間とイベントハブを作成する

まず、Kafka 対応の Azure Event Hubs 名前空間を作成します

次に、名前空間にイベントハブを作成します。個々のイベントハブは、Kafka トピックに対応します。同じ名前空間に複数のイベントハブを作成して、複数の Kafka トピックを表すことができます。

マネージド ID にアクセス許可を割り当てる

Azure Event Hubs のデータフローエンドポイントを構成するには、ユーザー割り当てマネージド ID またはシステム割り当てマネージド ID のいずれかを使用することをお勧めします。この方法は安全であり、認証情報を手動で管理する必要がありません。

Azure Event Hubs 名前空間とイベントハブが作成されたら、イベントハブのメッセージを送受信するためのアクセス許可を付与するロールを、Azure IoT Operations マネージド ID に割り当てる必要があります。

システム割り当てマネージド ID を使用する場合は、Azure portal で、Azure IoT Operations インスタンスに移動し、[概要] を選択します。 Azure IoT Operations Arc 拡張機能の後一覧表示されている拡張機能の名前をコピーします。たとえば、azure-iot-operations-xxxx7。システム割り当てマネージド ID を見つけるには、Azure IoT Operations Arc 拡張機能の同じ名前を使用します。

次に、Event Hubs 名前空間 >[アクセス制御 (IAM)]>[ロールの割り当ての追加] に移動します。

[ロール] タブで、Azure Event Hubs Data Sender、Azure Event Hubs Data Receiver などの適切なロールを選択します。これにより、名前空間内のすべてのイベントハブのメッセージを送受信するために必要なアクセス許可がマネージド ID に付与されます。詳細については、「Event Hubs リソースにアクセスするための Microsoft Entra ID によりアプリケーションを認証する」を参照してください。
[メンバー] タブで次の操作を行います。
1. システム割り当てマネージド ID を使用している場合、[アクセスの割り当て先] で [ユーザー、グループ、またはサービスプリンシパル] オプションを選択し、[+ メンバーの選択] を選択して、Azure IoT Operations Arc 拡張機能の名前を検索します。
2. ユーザー割り当てマネージド ID を使用している場合、[アクセスの割り当て先] で [マネージド ID] オプションを選択し、[+ メンバーの選択] を選択して、クラウド接続用に設定されたユーザー割り当てマネージド ID を検索します。

Azure Event Hubs のデータフローエンドポイントを作成する

Azure Event Hubs 名前空間とイベントハブが構成されたら、Kafka 対応 Azure Event Hubs 名前空間のデータフローエンドポイントを作成できます。

Operations Experience で、[データフローエンドポイント] タブを選択します。
[新しいデータフローエンドポイントの作成] で、[Azure Event Hubs]>[新規] を選びます。

エンドポイントに関する次の設定を入力します。

設定	内容
Name	データフローエンドポイントの名前。
Host	形式 `<NAMESPACE>.servicebus.windows.net:9093` の Kafka ブローカーのホスト名。 Event Hubs のホスト設定にポート番号 `9093` を含めます。
認証方法	認証に使用する方式。 "システム割り当てマネージド ID" または "ユーザー割り当てマネージド ID" を選択することをお勧めします。

[適用] を選択してエンドポイントをプロビジョニングします。

次の内容を含む Bicep .bicep ファイルを作成します。

param aioInstanceName string = '<AIO_INSTANCE_NAME>'
param customLocationName string = '<CUSTOM_LOCATION_NAME>'
param endpointName string = '<ENDPOINT_NAME>'
param hostName string = '<NAMESPACE>.servicebus.windows.net:9093'

resource aioInstance 'Microsoft.IoTOperations/instances@2024-11-01' existing = {
  name: aioInstanceName
}
resource customLocation 'Microsoft.ExtendedLocation/customLocations@2021-08-31-preview' existing = {
  name: customLocationName
}
resource kafkaEndpoint 'Microsoft.IoTOperations/instances/dataflowEndpoints@2024-11-01' = {
  parent: aioInstance
  name: endpointName
  extendedLocation: {
    name: customLocation.id
    type: 'CustomLocation'
  }
  properties: {
    endpointType: 'Kafka'
    kafkaSettings: {
      host: hostName
      authentication: {
        // See available authentication methods section for method types
        // method: <METHOD_TYPE>
      }
      tls: {
        mode: 'Enabled'
      }
    }
  }
}

次に、Azure CLI を使用してデプロイします。

az deployment group create --resource-group <RESOURCE_GROUP> --template-file <FILE>.bicep

次の内容を含む Kubernetes マニフェスト .yaml ファイルを作成します。

apiVersion: connectivity.iotoperations.azure.com/v1
kind: DataflowEndpoint
metadata:
  name: <ENDPOINT_NAME>
  namespace: azure-iot-operations
spec:
  endpointType: Kafka
  kafkaSettings:
    host: <NAMESPACE>.servicebus.windows.net:9093
    authentication:
      # See available authentication methods section for method types
      # method: <METHOD_TYPE>
    tls:
      mode: Enabled

次に、このマニフェストファイルを Kubernetes クラスターに適用します。

kubectl apply -f <FILE>.yaml

Note

Kafka トピックまたは個々のイベントハブは、後でデータフローを作成するときに構成されます。 Kafka トピックは、データフローメッセージの宛先です。

Event Hubs への認証に接続文字列を使用する

重要

操作エクスペリエンスポータルを使用してシークレットを管理するには、まず、安全な設定で Azure IoT Operations を有効にする必要があります。それには Azure Key Vault を構成し、ワークロード ID を有効にします。詳細については、Azure IoT Operations デプロイでの安全な設定の有効化に関する記事を参照してください。

Operations Experience のデータフローエンドポイント設定ページで、[基本] タブを選択し、[認証方法]>[SASL] を選択します。

エンドポイントに関する次の設定を入力します。

設定	説明
SASL の種類	`Plain` を選択します。
同期されたシークレット名	接続文字列を含む Kubernetes シークレットの名前を入力します。
ユーザー名参照またはトークンシークレット	SASL 認証に使用されるユーザー名への参照またはトークンシークレット。 Key Vault の一覧から選択するか、新しく作成します。値は `$ConnectionString` である必要があります。
パスワード参照またはトークンシークレット	SASL 認証に使用されるパスワードへの参照またはトークンシークレット。 Key Vault の一覧から選択するか、新しく作成します。値は `Endpoint=sb://<NAMESPACE>.servicebus.windows.net/;SharedAccessKeyName=<KEY-NAME>;SharedAccessKey=<KEY>` の形式でなければなりません。

[参照の追加] を選択した後、[新規作成] を選択した場合は、次の設定を入力します。

設定	説明
シークレット名	Azure Key Vault 内のシークレットの名前。覚えやすい名前にして、後でリストからそのシークレットを選択できるようにしてください。
シークレットの値	ユーザーには「`$ConnectionString`」を入力します。パスワードには接続文字列を `Endpoint=sb://<NAMESPACE>.servicebus.windows.net/;SharedAccessKeyName=<KEY-NAME>;SharedAccessKey=<KEY>` 形式で入力します。
アクティブ化する日を設定する	オンにした場合、シークレットがアクティブになる日付。
有効期限を設定する	オンにした場合、シークレットの有効期限が切れる日付。

シークレットの詳細については、Azure IoT Operations でのシークレットの作成と管理に関する記事を参照してください。

kafkaSettings: {
  authentication: {
    method: 'Sasl'
    saslSettings: {
      saslType: 'Plain'
      secretRef: '<SECRET_NAME>'
    }
  }
  tls: {
    mode: 'Enabled'
  }
}

Event Hubs への認証に接続文字列を使用するには、SASL 認証方法を使用し、SASL の種類を "Plain" として構成し、接続文字列を含むシークレットの名前を構成します。

まず、接続文字列を含む Kubernetes シークレットを作成します。このシークレットは、Kafka データフローエンドポイントと同じ名前空間に存在する必要があります。シークレットには、ユーザー名とパスワードの両方が、キーと値のペアの形式で必要です。次に例を示します。

kubectl create secret generic <SECRET_NAME> -n azure-iot-operations \
  --from-literal=username='$ConnectionString' \
  --from-literal=password='Endpoint=sb://<NAMESPACE>.servicebus.windows.net/;SharedAccessKeyName=<KEY-NAME>;SharedAccessKey=<KEY>'

ヒント

接続文字列のスコープを (個々のイベントハブではなく) 名前空間に設定すると、データフローは複数の異なるイベントハブと Kafka トピックからメッセージを送受信できます。

kafkaSettings:
  authentication:
    method: Sasl
    saslSettings:
      saslType: Plain
      secretRef: <SECRET_NAME>
  tls:
    mode: Enabled

制限事項

Azure Event Hubs は、Kafka がサポートするすべての圧縮の種類をサポートするわけではありません。現在、Azure Event Hubs の Premium および Dedicated レベルでサポートされているのは GZIP 圧縮だけです。他の圧縮の種類を使用すると、エラーが発生する可能性があります。

カスタム Kafka ブローカー

Event-Hub 以外の Kafka ブローカーのデータフローエンドポイントを構成するには、必要に応じてホスト、TLS、認証、およびその他の設定を設定します。

Operations Experience で、[データフローエンドポイント] タブを選択します。
[新しいデータフローエンドポイントの作成] で、[Custom Kafka Broker] (カスタム Kafka ブローカー)>[新規] を選びます。

エンドポイントに関する次の設定を入力します。

設定	内容
Name	データフローエンドポイントの名前。
Host	形式 `<Kafka-broker-host>:xxxx` の Kafka ブローカーのホスト名。ホスト設定にポート番号を含めます。
認証方法	認証に使用する方式。 [SASL] を選択します。
SASL の種類	SASL 認証の種類。 [Plain]、[ScramSha256]、または [ScramSha512] を選びます。 [SASL] を使用する場合は必須です。
同期されたシークレット名	シークレットの名前。 [SASL] を使用する場合は必須です。
Username reference of token secret (トークンシークレットのユーザー名参照)	SASL トークンシークレット内のユーザー名への参照。 [SASL] を使用する場合は必須です。

[適用] を選択してエンドポイントをプロビジョニングします。

Note

現在、Operations Experience は、ソースとしての Kafka データフローエンドポイントの使用をサポートしていません。ソース Kafka データフローエンドポイントを使用したデータフローの作成は、Kubernetes または Bicep を使用して行うことができます。

resource kafkaEndpoint 'Microsoft.IoTOperations/instances/dataflowEndpoints@2024-11-01' = {
 parent: aioInstance
  name: '<ENDPOINT NAME>'
  extendedLocation: {
    name: '<CUSTOM_LOCATION_NAME>'
    type: 'CustomLocation'
  }
  properties: {
    endpointType: 'Kafka'
    host: '<KAFKA-HOST>:<PORT>'
    kafkaSettings: {
      authentication: {
        method: 'Sasl'
        saslSettings: {
            saslType: '<TYPE>'
            secretRef: '<SECRET_NAME>'
        }
      }
      tls: {
        mode: 'Enabled'
      }
    }
  }
}

apiVersion: connectivity.iotoperations.azure.com/v1
kind: DataflowEndpoint
metadata:
  name: <ENDPOINT NAME>
  namespace: azure-iot-operations
spec:
  endpointType: Kafka
  kafkaSettings:
    host: <KAFKA-HOST>:<PORT>
    authentication:
      method: Sasl
      saslSettings:
        saslType: <TYPE>
        secretRef: <SECRET_NAME>
    tls:
      mode: Enabled

エンドポイント設定をカスタマイズする場合は、次のセクションを使用して詳細を確認してください。

使用可能な認証方法

Kafka データフローエンドポイントで使用できる認証方法は次のとおりです。

システム割り当てマネージド ID

データフローエンドポイントを構成する前に、Kafka ブローカーに接続するアクセス許可を付与するロールを Azure IoT Operations マネージド ID に割り当てます。

Azure portal で、Azure IoT Operations インスタンスに移動し、[概要] を選択します。
Azure IoT Operations Arc 拡張機能の後一覧表示されている拡張機能の名前をコピーします。たとえば、azure-iot-operations-xxxx7。
アクセス許可を付与する必要があるクラウドリソースに移動します。たとえば、Event Hubs 名前空間 >[アクセス制御 (IAM)]>[ロールの割り当ての追加] に移動します。
[ロール] タブで、適切なロールを選択します。
[メンバー] タブの [アクセスの割り当て先] で [ユーザー、グループ、またはサービスプリンシパル] オプションを選択し、[+ メンバーの選択] を選択して、Azure IoT Operations マネージド ID を検索します。たとえば、azure-iot-operations-xxxx7。

次に、システム割り当てマネージド ID の設定を使ってデータフローエンドポイントを構成します。

Operations Experience のデータフローエンドポイント設定ページで、[基本] タブを選択し、[認証方法]>[システム割り当てマネージド ID] を選択します。

kafkaSettings: {
  authentication: {
    method: 'SystemAssignedManagedIdentity'
    systemAssignedManagedIdentitySettings: {}
  }
}

kafkaSettings:
  authentication:
    method: SystemAssignedManagedIdentity
    systemAssignedManagedIdentitySettings:
      {}

この構成では、既定の対象ユーザーを使用してマネージド ID を作成します。これは、https://<NAMESPACE>.servicebus.windows.net という形式の Event Hubs 名前空間のホスト値と同じです。ただし、既定の対象ユーザーをオーバーライドする必要がある場合は、audience フィールドを目的の値に設定できます。

Operations Experience ではサポートされていません。

kafkaSettings: {
  authentication: {
    method: 'SystemAssignedManagedIdentity'
    systemAssignedManagedIdentitySettings: {
        audience: '<YOUR_AUDIENCE_OVERRIDE_VALUE>'
    }
  }
}

kafkaSettings:
  authentication:
    method: SystemAssignedManagedIdentity
    systemAssignedManagedIdentitySettings:
      audience: <YOUR_AUDIENCE_OVERRIDE_VALUE>

ユーザー割り当てマネージド ID

認証にユーザー割り当てマネージド ID を使用するには、まず、セキュリティで保護された設定を有効にして Azure IoT Operations をデプロイする必要があります。次に、クラウド接続用にユーザー割り当てマネージド ID を設定する必要があります。詳細については、Azure IoT Operations デプロイでの安全な設定の有効化に関する記事を参照してください。

データフローエンドポイントを構成する前に、Kafka ブローカーに接続するアクセス許可を付与するロールをユーザー割り当てマネージド ID に割り当てます。

Azure portal で、アクセス許可を付与する必要があるクラウドリソースに移動します。たとえば、Event Grid 名前空間 >[アクセス制御 (IAM)]>[ロールの割り当ての追加] に移動します。
[ロール] タブで、適切なロールを選択します。
[メンバー] タブの [アクセスの割り当て先] で [マネージド ID] オプションを選択し、[+ メンバーの選択] を選択して、ユーザー割り当てマネージド ID を検索します。

次に、ユーザー割り当てマネージド ID の設定を使ってデータフローエンドポイントを構成します。

Operations Experience のデータフローエンドポイント設定ページで、[基本] タブを選択し、[認証方法]>[ユーザー割り当てマネージド ID] を選択します。

kafkaSettings: {
  authentication: {
    method: 'UserAssignedManagedIdentity'
    UserAssignedManagedIdentitySettings: {
      clientId: '<CLIENT_ID>'
      tenantId: '<TENANT_ID>'
      // Optional, defaults to https://<NAMESPACE>.servicebus.windows.net/.default
      // Matching the Event Hub namespace you configured as host
      // scope: 'https://<SCOPE_URL>'
    }
  }
  ...
}

kafkaSettings:
  authentication:
    method: UserAssignedManagedIdentity
    userAssignedManagedIdentitySettings:
      clientId: <CLIENT_ID>
      tenantId: <TENANT_ID>
      # Optional, defaults to https://<NAMESPACE>.servicebus.windows.net/.default
      # Matching the Event Hub namespace you configured as host
      # scope: https://<SCOPE_URL>

ここでは、スコープはマネージド ID の対象ユーザーです。既定値は、Event Hubs 名前空間のホスト値と同じで、形式は https://<NAMESPACE>.servicebus.windows.net です。ただし、既定の対象ユーザーをオーバーライドする必要がある場合は、Bicep または Kubernetes を使用してスコープフィールドを目的の値に設定できます。

SASL

認証に SASL を使用するには、SASL 認証方法を指定し、SASL の種類と、SASL トークンを含むシークレットの名前を持つシークレット参照を構成します。

Operations Experience のデータフローエンドポイント設定ページで、[基本] タブを選択し、[認証方法]>[SASL] を選択します。

エンドポイントに関する次の設定を入力します。

設定	説明
SASL の種類	使用する SASL 認証の種類。サポートされている型は、`Plain`、`ScramSha256`、`ScramSha512` です。
同期されたシークレット名	SASL トークンを含む Kubernetes シークレットの名前。
ユーザー名参照またはトークンシークレット	SASL 認証に使用されるユーザー名への参照またはトークンシークレット。
パスワード参照またはトークンシークレット	SASL 認証に使用されるパスワードへの参照またはトークンシークレット。

kafkaSettings: {
  authentication: {
    method: 'Sasl' // Or ScramSha256, ScramSha512
    saslSettings: {
      saslType: 'Plain' // Or ScramSha256, ScramSha512
      secretRef: '<SECRET_NAME>'
    }
  }
}

kubectl create secret generic sasl-secret -n azure-iot-operations \
  --from-literal=token='<YOUR_SASL_TOKEN>'

kafkaSettings:
  authentication:
    method: Sasl
    saslSettings:
      saslType: Plain # Or ScramSha256, ScramSha512
      secretRef: <SECRET_NAME>

サポートされている SASL の種類は次のとおりです。

Plain
ScramSha256
ScramSha512

このシークレットは、Kafka データフローエンドポイントと同じ名前空間に存在する必要があります。シークレットには、SASL トークンが、キーと値のペアの形式で存在する必要があります。

匿名

匿名認証を使用するには、Anonymous メソッドを使用するように Kafka 設定の認証セクションを更新します。

Operations Experience のデータフローエンドポイント設定ページで、[基本] タブを選択し、[認証方法]>[なし] を選択します。

kafkaSettings: {
  authentication: {
    method: 'Anonymous'
  }
}

kafkaSettings:
  authentication:
    method: Anonymous
    anonymousSettings:
      {}

詳細設定

TLS、信頼された証明機関証明書、Kafka メッセージング設定、バッチ処理、CloudEvents などの、Kafka データフローエンドポイントの詳細設定を設定できます。これらの設定は、データフローエンドポイントの [詳細設定] ポータルタブ、またはデータフローエンドポイントのリソース内で設定できます。

Operations Experience で、データフローエンドポイントの [詳細設定] タブを選択します。

Operations Experience を使って Kafka データフローエンドポイントの詳細設定を行っているスクリーンショット。

kafkaSettings に、Kafka エンドポイントの追加設定を構成できます。

// See sections below for more details
kafkaSettings: {
  consumerGroupId: '<ID>'
  compression: 'Gzip'
  copyMqttProperties: 'Disabled'
  kafkaAcks: 'All'
  partitionStrategy: 'Default'
  tls: {
    mode: 'Enabled'
    trustedCaCertificateConfigMapRef: '<YOUR_CA_CERTIFICATE>'
  }
  batching: {
    mode: 'Enabled'
    latencyMs: 1000
    maxMessages: 100
    maxBytes: 1024
  }
}

kafkaSettings に、Kafka エンドポイントの追加設定を構成できます。

# See sections below for more details
kafkaSettings:
  consumerGroupId: <ID>
  compression: Gzip
  copyMqttProperties: Disabled
  kafkaAcks: All
  partitionStrategy: Default
  tls:
    mode: Enabled
    trustedCaCertificateConfigMapRef: <YOUR_CA_CERTIFICATE>
  batching:
    mode: Enabled
    latencyMs: 1000
    maxMessages: 100
    maxBytes: 1024

TLS の設定

TLS モード

Kafka エンドポイントの TLS を有効または無効にするには、TLS 設定の mode 設定を更新します。

Operations Experience のデータフローエンドポイント設定ページで、[詳細設定] タブを選択し、[TLS モードが有効] の横にあるチェックボックス使用します。

kafkaSettings: {
  tls: {
    mode: 'Enabled' // Or Disabled
  }
}

kafkaSettings:
  tls:
    mode: Enabled # Or Disabled

TLS モードは、Enabled または Disabled に設定できます。モードが Enabled に設定されている場合、データフローは Kafka ブローカーに対して安全な接続を使用します。モードが Disabled に設定されている場合、データフローは Kafka ブローカーに対して安全ではない接続を使用します。

信頼された証明機関証明書

Kafka ブローカーへのセキュリティで保護された接続を確立するように、Kafka エンドポイントの信頼された CA 証明書を構成します。この設定は、Kafka ブローカーが自己署名証明書または既定では信頼されていないカスタム証明機関によって署名された証明書を使用する場合に重要です。

Operations Experience のデータフローエンドポイント設定ページで、[詳細設定] タブを選択し、[信頼された CA 証明書構成マップ] フィールドを使用して、信頼された CA 証明書を含む ConfigMap を指定します。

kafkaSettings: {
  tls: {
    trustedCaCertificateConfigMapRef: '<YOUR_CA_CERTIFICATE>'
  }
}

kafkaSettings:
  tls:
    trustedCaCertificateConfigMapRef: <YOUR_CA_CERTIFICATE>

この ConfigMap には、PEM 形式の証明機関証明書が含まれている必要があります。この ConfigMap は、Kafka データフローリソースと同じ名前空間に存在する必要があります。次に例を示します。

kubectl create configmap client-ca-configmap --from-file root_ca.crt -n azure-iot-operations

ヒント

Azure Event Hubs に接続する場合、Event Hubs サービスは既定で信頼されているパブリック CA によって署名された証明書を使用するため、CA 証明書は必要ありません。

コンシューマーグループ ID

コンシューマーグループ ID は、Kafka トピックからのメッセージの読み取りにデータフローが使用するコンシューマーグループを識別するために使用されます。コンシューマーグループ ID は、Kafka ブローカー内で一意である必要があります。

重要

Kafka エンドポイントをソースとして使用する場合は、コンシューマーグループ ID が必要です。それ以外の場合、データフローでは Kafka トピックからメッセージを読み取ることができないので、"Kafka 型のソースエンドポイントには consumerGroupId が定義されている必要があります" というエラーが表示されます。

Operations Experience のデータフローエンドポイント設定ページで、[詳細設定] タブを選択し、[コンシューマーグループ ID] フィールドを使用してコンシューマーグループ ID を指定します。

kafkaSettings: {
  consumerGroupId: '<ID>'
}

spec:
  kafkaSettings:
    consumerGroupId: <ID>

この設定は、ソースとして (つまり、データフローがコンシューマーである) エンドポイントが使用される場合にのみ有効になります。

圧縮

圧縮フィールドを使用すると、Kafka トピックに送信されるメッセージの圧縮が可能になります。圧縮は、データ転送に必要なネットワーク帯域幅とストレージ領域を減らすのに役立ちます。ただし、圧縮により、オーバーヘッドと待機時間もプロセスに追加されます。サポートされている圧縮の種類を次の表に示します。

値	説明
`None`	圧縮またはバッチ処理は適用されません。 compression が指定されていない場合、既定値は None です。
`Gzip`	GZIP 圧縮とバッチ処理が適用されます。 GZIP は、圧縮率と速度のバランスが良い汎用圧縮アルゴリズムです。現在、Azure Event Hubs の Premium および Dedicated レベルでサポートされているのは GZIP 圧縮だけです。
`Snappy`	すばやい圧縮とバッチ処理が適用されます。 Snappy は、中程度の圧縮率と速度を提供する高速圧縮アルゴリズムです。この圧縮モードは、Azure Event Hubs ではサポートされていません。
`Lz4`	LZ4 圧縮とバッチ処理が適用されます。 LZ4は、低圧縮比と高速を提供する高速圧縮アルゴリズムです。この圧縮モードは、Azure Event Hubs ではサポートされていません。

圧縮を構成するには:

Operations Experience のデータフローエンドポイント設定ページで、[詳細設定] タブを選択し、[圧縮] フィールドを使用して圧縮の種類を指定します。

kafkaSettings: {
  compression: 'Gzip' // Or Snappy, Lz4
}

kafkaSettings:
  compression: Gzip # Or Snappy, Lz4

この設定は、データフローがプロデューサーである宛先としてエンドポイントが使用される場合にのみ有効になります。

バッチ処理

圧縮とは別に、Kafka トピックに送信する前にメッセージのバッチ処理を構成することもできます。バッチ処理を使用すると、複数のメッセージをグループ化して 1 つの単位として圧縮できるため、圧縮効率が向上し、ネットワークのオーバーヘッドが削減されます。

フィールド	Description	必須
`mode`	`Enabled` または `Disabled` を指定できます。 Kafka には "バッチ処理されない" メッセージングという概念がないため、既定値は `Enabled` です。 `Disabled` に設定すると、バッチ処理が最小化され、毎回 1 つのメッセージでバッチが作成されます。	いいえ
`latencyMs`	メッセージをバッファー処理してから送信できる最大時間間隔 (ミリ秒単位)。この間隔に達した場合、バッファー内のすべてのメッセージは、メッセージの数や大きさに関係なく、バッチとして送信されます。設定しない場合、既定値は 5 です。	いいえ
`maxMessages`	送信前にバッファーに格納できるメッセージの最大数。この数に達すると、バッファーに格納されているメッセージの大きさやバッファーの時間に関係なく、バッファー内のすべてのメッセージがバッチとして送信されます。設定しない場合、既定値は 100000 です。	いいえ
`maxBytes`	送信前にバッファーに格納できる最大サイズ (バイト単位)。このサイズに達すると、バッファーに格納されているメッセージの数やバッファーの時間に関係なく、バッファー内のすべてのメッセージがバッチとして送信されます。既定値は 1000000 (1 MB) です。	いいえ

たとえば、latencyMs を 1000 に、maxMessages を 100 に、maxBytes を 1024 に設定した場合、バッファーのメッセージが 100 件になるか、バッファーのバイト数が 1,024 になるか、最後の送信から 1,000 ミリ秒が経過するかのいずれかが最初に発生したときにメッセージが送信されます。

バッチ処理を構成するには:

Operations Experience のデータフローエンドポイント設定ページで、[詳細設定] タブを選択し、[バッチ処理が有効] フィールドを使用してバッチ処理を有効にします。 [バッチ処理の待機時間]、[最大バイト数]、[メッセージ数] フィールドを使用してバッチ処理の設定を指定します。

kafkaSettings: {
  batching: {
    mode: 'Enabled' // Or Disabled
    latencyMs: 1000
    maxMessages: 100
    maxBytes: 1024
  }
}

kafkaSettings:
  batching:
    mode: Enabled # Or Disabled
    latencyMs: 1000
    maxMessages: 100
    maxBytes: 1024

この設定は、データフローがプロデューサーである宛先としてエンドポイントが使用される場合にのみ有効になります。

パーティション処理戦略

パーティション処理戦略は、Kafka トピックに送信するときにメッセージを Kafka パーティションに割り当てる方法を制御します。 Kafka パーティションは、並列処理とフォールトトレランスを可能にする Kafka トピックの論理セグメントです。 Kafka トピック内の各メッセージには、メッセージの識別と順序付けに使用されるパーティションとオフセットがあります。

この設定は、データフローがプロデューサーである宛先としてエンドポイントが使用される場合にのみ有効になります。

既定では、データフローはラウンドロビンアルゴリズムを使用して、ランダムなパーティションにメッセージを割り当てます。ただし、MQTT トピック名や MQTT メッセージプロパティなど、いくつかの条件に基づいてパーティションにメッセージを割り当てるには、さまざまな方法を使用できます。これは、負荷分散、データの局所性、またはメッセージの順序付けを改善するのに役立ちます。

値	説明
`Default`	ラウンドロビンアルゴリズムを使用して、ランダムパーティションにメッセージを割り当てます。これは、戦略が指定されていない場合の既定値です。
`Static`	データフローのインスタンス ID から派生した固定パーティション番号にメッセージを割り当てます。これは、各データフローインスタンスが異なるパーティションにメッセージを送信することを意味します。これにより、負荷分散とデータの局所性が向上します。
`Topic`	パーティション分割のキーとして、データフローソースから取得する MQTT トピック名を使用します。これは、同じ MQTT トピック名のメッセージが同じパーティションに送信されることを意味します。これは、メッセージの順序付けとデータの局所性の向上に役立ちます。
`Property`	パーティション分割のキーとして、データフローソースから取得する MQTT メッセージプロパティを使用します。 `partitionKeyProperty` フィールドにプロパティの名前を指定します。これは、同じプロパティ値を持つメッセージが同じパーティションに送信されることを意味します。これにより、カスタム条件に基づいてメッセージの順序付けとデータの局所性を向上させることができます。

たとえば、パーティション処理戦略を Property に設定し、パーティションキープロパティを device-id に設定した場合、同じ device-id プロパティを持つメッセージは同じパーティションに送信されます。

パーティション処理戦略を構成するには:

Operations Experience のデータフローエンドポイント設定ページで、[詳細設定] タブを選択し、[パーティション処理戦略] フィールドを使用してパーティション処理戦略を指定します。戦略が Property に設定されている場合は、パーティションキープロパティ フィールドを使用して、パーティション化に使用するプロパティを指定します。

kafkaSettings: {
  partitionStrategy: 'Default' // Or Static, Topic, Property
  partitionKeyProperty: '<PROPERTY_NAME>'
}

kafkaSettings:
  partitionStrategy: Default # Or Static, Topic, Property
  partitionKeyProperty: <PROPERTY_NAME>

Kafka の受信確認

Kafka 受信確認 (ACK) は、Kafka トピックに送信されるメッセージの持続性と一貫性を制御するために使用されます。プロデューサーは、Kafka トピックにメッセージを送信するときに、メッセージがトピックに正常に書き込まれ、Kafka クラスター全体にレプリケートされたことを確認するために、Kafka ブローカーにさまざまなレベルの受信確認を要求できます。

この設定は、宛先として (つまり、データフローがプロデューサーである) エンドポイントが使用される場合にのみ有効になります。

Value	説明
`None`	データフローは、Kafka ブローカーからの受信確認を待機しません。この設定は最も高速ですが、最も持続性の低いオプションです。
`All`	データフローは、メッセージがリーダーパーティションとすべてのフォロワーパーティションに書き込まれるのを待機します。この設定は最も低速ですが、最も持続性の高いオプションです。この設定は既定のオプションでもあります
`One`	データフローは、メッセージがリーダーパーティションと少なくとも 1 個のフォロワーパーティションに書き込まれるのを待機します。
`Zero`	データフローは、メッセージがリーダーパーティションに書き込まれるのを待機しますが、フォロワーからの受信確認を待機しません。これは `One` よりも高速ですが、持続性は低くなります。

たとえば、Kafka 受信確認を All に設定した場合、データフローでは、メッセージがリーダーパーティションとすべてのフォロワーパーティションに書き込まれるまで待機してから、次のメッセージを送信します。

Kafka の受信確認を構成するには:

操作エクスペリエンスのデータフローエンドポイント設定ページで、[詳細設定] タブを選択し、[Kafka 受信確認] フィールドを使用して Kafka 受信確認レベルを指定します。

kafkaSettings: {
  kafkaAcks: 'All' // Or None, One, Zero
}

kafkaSettings:
  kafkaAcks: All # Or None, One, Zero

この設定は、データフローがプロデューサーである宛先としてエンドポイントが使用される場合にのみ有効になります。

MQTT プロパティをコピー

既定では、MQTT プロパティのコピー設定は有効になっています。これらのユーザープロパティには、メッセージを送信する資産の名前を格納する subject などの値が含まれます。

Operations Experience のデータフローエンドポイント設定ページで、[詳細設定] タブを選択し、[MQTT プロパティのコピー] フィールドの横にあるチェックボックスを使用して、MQTT プロパティのコピーを有効または無効にします。

kafkaSettings: {
  copyMqttProperties: 'Enabled' // Or Disabled
}

kafkaSettings:
  copyMqttProperties: Enabled # Or Disabled

以降のセクションでは、設定が有効になっているときに MQTT プロパティを Kafka ユーザーヘッダーに変換する方法と、その逆を行う方法について説明します。

Kafka エンドポイントが宛先である

Kafka エンドポイントがデータフローの宛先であるとき、MQTT v5 仕様に定義されているすべてのプロパティが Kafka ユーザーヘッダーに変換されます。たとえば、Kafka に転送される MQTT v5 メッセージに "Content Type" が指定されている場合、Kafka のユーザーヘッダーの "Content Type":{specifiedValue} に変換されます。次の表に定義されている他の組み込みの MQTT プロパティにも同様の規則が適用されます。

MQTT プロパティ	変換動作
Payload Format Indicator	キー: "Payload Format Indicator" 値: "0" (ペイロードはバイト) または "1" (ペイロードは UTF-8)
Response Topic	キー: "Response Topic" 値: 元のメッセージからの応答トピックのコピー。
Message Expiry Interval	キー: "Message Expiry Interval" 値: メッセージの有効期限が切れるまでの秒数の UTF-8 表現。詳細については、「Message Expiry Interval プロパティ」を参照してください。
Correlation Data:	キー: "Correlation Data" 値: 元のメッセージからの相関関係データのコピー。 UTF-8 でエンコードされた多くの MQTT v5 プロパティとは異なり、相関関係データは無作為のデータになる可能性があります。
コンテンツの種類:	キー: "Content Type" 値: 元のメッセージからの Content Type のコピー。

MQTT v5 ユーザープロパティのキーと値のペアは、Kafka のユーザーヘッダーに直接変換されます。メッセージ内のユーザーヘッダーに、組み込みの MQTT プロパティと同じ名前 (たとえば、"Correlation Data" という名前のユーザーヘッダー) がある場合、MQTT v5 仕様プロパティ値やユーザープロパティを転送するかどうかは未定義になります。

データフローが、MQTT ブローカーからこれらのプロパティを受け取ることはありません。このため、データフローで次の項目は転送されません。

トピックの別名
サブスクリプション識別子

Message Expiry Interval プロパティ

Message Expiry Interval は、メッセージが破棄されるまで MQTT ブローカー内に滞在できる長さを指定します。

Message Expiry Interval が指定された MQTT メッセージをデータフローが受信すると、次のようにします。

メッセージが受信された日時を記録します。
メッセージが宛先に出力される前に、元の有効期限間隔の時間から、メッセージがキューに入れられてからの時間が減算されます。
メッセージの有効期限が切れていない (上記の演算結果が > 0 である) 場合、メッセージは宛先に出力され、更新された Message Expiry Time が格納されます。
メッセージの有効期限が切れている (上記の演算結果が 0 以下である) 場合、メッセージはターゲットによって出力されません。

例 :

Message Expiry Interval が 3,600 秒に指定された MQTT メッセージをデータフローが受信するとします。対応する宛先は一時的に切断されますが、再接続できます。この MQTT メッセージがターゲットに送信されるまでに 1,000 秒が経過します。この場合、宛先のメッセージの Message Expiry Interval は 2,600 (3,600 - 1,000) 秒に設定されます。
Message Expiry Interval が 3,600 秒に指定された MQTT メッセージをデータフローが受信するとします。対応する宛先は一時的に切断されますが、再接続できます。ただし、この場合、再接続には 4,000 秒かかります。メッセージの有効期限が切れ、データフローはこのメッセージを宛先に転送しません。

Kafka エンドポイントがデータフローソースである

Note

Event Hubs エンドポイントをデータフローソースとして使用するとき、Kafka ヘッダーが MQTT に変換されると破損するという既知の問題があります。これは、内部で AMQP を使用するイベントハブクライアントでイベントハブを使用する場合にのみ発生します。たとえば、"foo"="bar" の場合、"foo" は変換されますが、値は "\xa1\x03bar" になります。

Kafka エンドポイントがデータフローソースであるときは、Kafka のユーザーヘッダーが MQTT v5 プロパティに変換されます。次の表で、Kafka のユーザーヘッダーを MQTT v5 プロパティに変換する方法について説明します。

Kafka ヘッダー	変換動作
キー	キー: "Key" 値: 元のメッセージからの Key のコピー。
タイムスタンプ	キー: "Timestamp" 値: Kafka タイムスタンプの UTF-8 エンコード。これは、Unix エポック以降のミリ秒数です。

Kafka のユーザーヘッダーのキーと値のペア (すべて UTF-8 でエンコードされている場合) は、MQTT のユーザーキーと値のプロパティに直接変換されます。

UTF-8/バイナリの不一致

MQTT v5 は、UTF-8 ベースのプロパティのみをサポートできます。データフローが UTF-8 以外のヘッダーを 1 つ以上含む Kafka メッセージを受信した場合、データフローは次のようにします。

問題のあるプロパティを削除します。
前の規則に従って、メッセージの残りの部分を転送します。

Kafka のソースヘッダーを MQTT ターゲットプロパティにバイナリ転送する必要があるアプリケーションは、まずそれらを UTF-8 で (たとえば、Base64 経由で) エンコードする必要があります。

64KB 以上のプロパティという不一致

MQTT v5 プロパティは 64 KB 未満である必要があります。データフローが 64KB 以上のヘッダーを 1 つ以上含む Kafka メッセージを受信した場合、データフローは次のようにします。

問題のあるプロパティを削除します。
前の規則に従って、メッセージの残りの部分を転送します。

AMQP を使用する Event Hubs およびプロデューサーを使用するときのプロパティ変換

クライアントがメッセージを転送している場合、Kafka データフローソースエンドポイントは次のいずれかのアクションを実行しています。

Azure.Messaging.EventHubs などのクライアントライブラリを使用して Event Hubs にメッセージを送信
AMQP を直接使用

注意する必要があるプロパティ変換の微妙な違いがあります。

次のいずれかを実行する必要があります。

プロパティの送信を避ける。
プロパティを送信する必要がある場合は、UTF-8 としてエンコードされた値を送信する。

Event Hubs は、プロパティを AMQP から Kafka に変換するときに、基盤の AMQP エンコード型をメッセージに含めます。動作の詳細については、「異なるプロトコルを使用してコンシューマーとプロデューサー間でイベントを交換する (英語)」を参照してください。

次のコード例では、データフローエンドポイントが値 "foo":"bar" を受け取ると、<0xA1 0x03 "bar"> としてプロパティを受け取ります。

using global::Azure.Messaging.EventHubs;
using global::Azure.Messaging.EventHubs.Producer;

var propertyEventBody = new BinaryData("payload");

var propertyEventData = new EventData(propertyEventBody)
{
  Properties =
  {
    {"foo", "bar"},
  }
};

var propertyEventAdded = eventBatch.TryAdd(propertyEventData);
await producerClient.SendAsync(eventBatch);

データが UTF-8 ではないため、データフローエンドポイントはペイロードプロパティ <0xA1 0x03 "bar"> を MQTT メッセージに転送できません。ただし、UTF-8 文字列を指定した場合、データフローエンドポイントは MQTT に送信する前に文字列を変換します。 UTF-8 文字列を使用すると、MQTT メッセージにユーザープロパティとして "foo":"bar" が含められます。

UTF-8 ヘッダーのみが変換されます。たとえば、プロパティが float として設定されている次のシナリオを考えます。

Properties = 
{
  {"float-value", 11.9 },
}

データフローエンドポイントは、"float-value" フィールドを含むパケットを破棄します。

propertyEventData.correlationId を含むすべてのイベントデータプロパティが転送されないわけではありません。詳細については、「イベントのユーザープロパティ (英語)」を参照してください。

CloudEvents

CloudEvents は、イベントデータを一般的な方法で記述する方法です。 CloudEvents の設定は、CloudEvents 形式でメッセージを送受信するために使われます。 CloudEvents は、同じ、または異なるクラウドプロバイダー内にある異なるサービスが相互に通信する必要があるイベント駆動型アーキテクチャに使用できます。

CloudEventAttributes オプションは、Propagate または CreateOrRemap です。

Operations Experience のデータフローエンドポイント設定ページで、[詳細設定] タブを選択し、[クラウドイベント属性] フィールドを使用して CloudEvents 設定を指定します。

kafkaSettings: {
  cloudEventAttributes: 'Propagate' // Or CreateOrRemap
}

kafkaSettings:
  cloudEventAttributes: Propagate # Or CreateOrRemap

以下のセクションでは、CloudEvent プロパティがどのように伝達または作成され、再マップされるかについて説明します。

Propagate の設定

CloudEvent プロパティは、必要なプロパティを含むメッセージではパススルーされます。メッセージに必要なプロパティが含まれていない場合、メッセージはそのまま通過します。必要なプロパティが存在する場合は、ce_ プレフィックスが CloudEvent プロパティ名に追加されます。

名前	必須	サンプルの値	出力名	出力値
`specversion`	はい	`1.0`	`ce-specversion`	そのままパススルーされます
`type`	はい	`ms.aio.telemetry`	`ce-type`	そのままパススルーされます
`source`	はい	`aio://mycluster/myoven`	`ce-source`	そのままパススルーされます
`id`	はい	`A234-1234-1234`	`ce-id`	そのままパススルーされます
`subject`	いいえ	`aio/myoven/telemetry/temperature`	`ce-subject`	そのままパススルーされます
`time`	いいえ	`2018-04-05T17:31:00Z`	`ce-time`	そのままパススルーされます。タイムスタンプは更新されません。
`datacontenttype`	いいえ	`application/json`	`ce-datacontenttype`	オプションの変換ステージの後で、出力データのコンテンツタイプに変更されます。
`dataschema`	いいえ	`sr://fabrikam-schemas/123123123234234234234234#1.0.0`	`ce-dataschema`	変換構成に出力データ変換スキーマが指定されている場合、`dataschema` は出力スキーマに変更されます。

CreateOrRemap の設定

CloudEvent プロパティは、必要なプロパティを含むメッセージではパススルーされます。メッセージに必要なプロパティが含まれていない場合は、プロパティが生成されます。

名前	必須	出力名	不足している場合に生成される値
`specversion`	はい	`ce-specversion`	`1.0`
`type`	イエス	`ce-type`	`ms.aio-dataflow.telemetry`
`source`	イエス	`ce-source`	`aio://<target-name>`
`id`	はい	`ce-id`	ターゲットクライアントで生成された UUID
`subject`	いいえ	`ce-subject`	メッセージが送信される出力トピック
`time`	いいえ	`ce-time`	ターゲットクライアントで RFC 3339 として生成
`datacontenttype`	いいえ	`ce-datacontenttype`	オプションの変換ステージの後で、出力データのコンテンツタイプに変更
`dataschema`	いいえ	`ce-dataschema`	スキーマレジストリで定義されているスキーマ

次のステップ

データフローの詳細については、データフローの作成に関するページを参照してください。

次の方法で共有

Azure Event Hubs と Kafka データフローエンドポイントを構成する

前提条件

Azure Event Hubs

Azure Event Hubs 名前空間とイベントハブを作成する

マネージド ID にアクセス許可を割り当てる

Azure Event Hubs のデータフローエンドポイントを作成する

Event Hubs への認証に接続文字列を使用する

制限事項

カスタム Kafka ブローカー

使用可能な認証方法

システム割り当てマネージド ID

ユーザー割り当てマネージド ID

SASL

匿名

詳細設定

TLS の設定

TLS モード

信頼された証明機関証明書

コンシューマーグループ ID

圧縮

バッチ処理

パーティション処理戦略

Kafka の受信確認

MQTT プロパティをコピー

Kafka エンドポイントが宛先である

Message Expiry Interval プロパティ

Kafka エンドポイントがデータフローソースである

UTF-8/バイナリの不一致

64KB 以上のプロパティという不一致

AMQP を使用する Event Hubs およびプロデューサーを使用するときのプロパティ変換

CloudEvents

Propagate の設定

CreateOrRemap の設定

次のステップ

フィードバック

その他のリソース

次の方法で共有

Azure Event Hubs と Kafka データフロー エンドポイントを構成する

前提条件

Azure Event Hubs

Azure Event Hubs 名前空間とイベント ハブを作成する

マネージド ID にアクセス許可を割り当てる

Azure Event Hubs のデータフロー エンドポイントを作成する

Event Hubs への認証に接続文字列を使用する

制限事項

カスタム Kafka ブローカー

使用可能な認証方法

システム割り当てマネージド ID

ユーザー割り当てマネージド ID

SASL

匿名

詳細設定

TLS の設定

TLS モード

信頼された証明機関証明書

コンシューマー グループ ID

圧縮

バッチ処理

パーティション処理戦略

Kafka の受信確認

MQTT プロパティをコピー

Kafka エンドポイントが宛先である

Message Expiry Interval プロパティ

Kafka エンドポイントがデータフロー ソースである

UTF-8/バイナリの不一致

64KB 以上のプロパティという不一致

AMQP を使用する Event Hubs およびプロデューサーを使用するときのプロパティ変換

CloudEvents

Propagate の設定

CreateOrRemap の設定

次のステップ

フィードバック

その他のリソース

Azure Event Hubs と Kafka データフローエンドポイントを構成する

Azure Event Hubs 名前空間とイベントハブを作成する

Azure Event Hubs のデータフローエンドポイントを作成する

コンシューマーグループ ID

Kafka エンドポイントがデータフローソースである