Databricks レイクハウスにデータを取り込む
Azure Databricks には、Delta Lake によってサポートされるレイクハウスに、さまざまなソースからのデータを取り込むための多様な方法が用意されています。 この記事では、データ ソースの一覧を示し、各ソースの種類からデータを取り込む手順へのリンクを示します。
クラウド オブジェクト ストレージ
クラウド オブジェクト ストレージからの増分インジェストを構成する方法については、「クラウド オブジェクト ストレージからのデータの取り込み」を参照してください。
LakeFlow Connect
Databricks LakeFlow Connect には、エンタープライズ アプリケーションやデータベースから取り込むためのネイティブ コネクタが用意されています。 結果として得られるインジェスト パイプラインは、Unity Catalog によって管理され、サーバーレス コンピューティングと Delta Live Tablesを利用します。
LakeFlow Connect は、効率的な増分読み取りと書き込みを利用して、データ インジェストを高速化し、よりスケーラブルにし、コスト効率を高めながら、データをダウンストリームで使用できるように最新の状態に保ちます。
ストリーミング ソース
Azure Databricks を使用すると、レイクハウスへの凖リアルタイムのデータ インジェストを目的として、ストリーム メッセージング サービスと統合することができます。 「ストリーミングとインジェストの増分」を参照してください。
ローカル データ ファイル
ローカル データ ファイルを安全にアップロードしたり、公開用 URL からファイルをダウンロードしたりできます。 「Azure Databricks にファイルをアップロードする」を参照してください。
Delta Lake にデータを移行する
既存のデータを Delta Lake に移行する方法については、「データを Delta Lake に移行する」を参照してください。