Databricks レイクハウスにデータを取り込む
Azure Databricks には、Delta Lake によってサポートされるレイクハウスに、さまざまなソースからのデータを取り込むための多様な方法が用意されています。 この記事では、データ ソースの一覧を示し、各ソースの種類からデータを取り込む手順へのリンクを示します。
クラウド オブジェクト ストレージ
クラウド オブジェクト ストレージからの増分インジェストを構成する方法については、「クラウド オブジェクト ストレージからのデータの取り込み」を参照してください。
LakeFlow Connect
Databricks LakeFlow Connect には、エンタープライズ アプリケーションやデータベースから取り込むためのネイティブ コネクタが用意されています。 結果として生成されるインジェスト パイプラインは Unity Catalog によって管理され、サーバーレス コンピューティングと Delta Live Tables を利用します。
LakeFlow Connect は、効率的な増分読み取りと書き込みを利用して、データ インジェストを高速化し、よりスケーラブルにし、コスト効率を高めながら、データをダウンストリームで使用できるように最新の状態に保ちます。
ストリーミング ソース
Azure Databricks を使用すると、レイクハウスへの凖リアルタイムのデータ インジェストを目的として、ストリーム メッセージング サービスと統合することができます。 「ストリーミングとインジェストの増分」を参照してください。
ローカル データ ファイル
ローカル データ ファイルを安全にアップロードしたり、公開用 URL からファイルをダウンロードしたりできます。 「Azure Databricks にファイルをアップロードする」を参照してください。
Delta Lake にデータを移行する
既存のデータを Delta Lake に移行する方法については、「データを Delta Lake に移行する」を参照してください。