次の方法で共有


変更データ キャプチャ リソースの概要

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

企業向けのオールインワン分析ソリューション、Microsoft Fabric の Data Factory をお試しください。 Microsoft Fabric は、データ移動からデータ サイエンス、リアルタイム分析、ビジネス インテリジェンス、レポートまで、あらゆるものをカバーしています。 無料で新しい試用版を開始する方法について説明します。

複雑なデータ統合と ETL パイプラインの構築を担当するデータ エンジニアにとって、クラウドファーストのビッグ データの世界への適応は非常に困難な場合があります。

Azure Data Factory では、データ エンジニアの暮らしを楽にする新しいメカニズムが導入されています。

ADF を使うと、複雑な設計やコーディングを必要とせずにソースでのデータの変化を自動的に検出でき、これらのプロセスのスケーリングが簡単になります。 変更データ キャプチャは、Azure Data Factory スタジオでの新しいネイティブ トップレベル リソースになっており、データ エンジニアは、大量のビッグ データを非常に効率的に処理するように、継続的に実行されるジョブを迅速に構成できます。

ADF の新しい変更データ キャプチャ リソースを使うと、ガイド付き構成エクスペリエンスを通じ準リアルタイムで継続的に実行される完全に忠実な変更データ キャプチャが可能になります。

[ファクトリのリソース] パネルでの新しい最上位リソースのスクリーンショット。

Note

Azure Data Factory の変更データ キャプチャ リソースは現在パブリック プレビュー段階です

サポートされるデータ ソース

  • Avro
  • Azure Cosmos DB (SQL API)
  • Azure SQL データベース
  • Azure SQL Managed Instance
  • 区切りテキスト
  • JSON
  • ORC
  • Parquet
  • SQL Server
  • XML
  • Snowflake

サポート対象

  • Avro
  • Azure SQL データベース
  • SQL Managed Instance
  • 区切りテキスト
  • Delta
  • JSON
  • ORC
  • Parquet
  • Azure Synapse Analytics

既知の制限事項

  • 現在、ソースとターゲットのマッピングを作成するときは、各ソースとターゲットを 1 回だけ使用できます。
  • 現在、複合型はサポートされていません。
  • セルフホステッド統合ランタイム (SHIR) は現在サポートされていません。

既知の制限事項とトラブルシューティングのサポートについて詳しくは、トラブルシューティング ガイドをご覧ください。

ターゲットとしての Azure Synapse Analytics

Azure Synapse Analytics をターゲットとして使用すると、メイン テーブル キャンバスでステージング設定を使用できます。 ターゲットとして Azure Synapse Analytics を選択するときは、ステージングの有効化が必須です。 これにより、COPY INTO コマンドなどのパフォーマンスの高い一括読み込み機能を利用することで、書き込みパフォーマンスが大幅に向上します。 ステージング設定は、ファクトリ設定の利用、またはカスタム設定の選択という 2 つの方法で構成できます。 ファクトリ設定はファクトリ レベルで適用されます。 初回に、これらの設定が構成されていない場合は、構成のグローバル ステージング設定セクションに転送されます。 設定すると、すべての CDC 最上位リソースでこの構成が採用されます。 カスタム設定のスコープは、その構成対象の CDC リソースに対してのみ設定され、ファクトリ設定をオーバーライドします。

Note

COPY INTO コマンドを利用してステージング場所から Azure Synapse Analytics にデータを転送するため、必要なすべてのアクセス許可が Azure Synapse Analytics 内で事前に構成されるようにすることをお勧めします。

Note

CDC を開始するときは、常に最後に発行された構成を使用します。 CDC を実行する場合、データの処理中に、General Purpose データ フローの 4 v コアが課金されます。