イベントハウス OneLake の可用性
OneLake 可用性をオンにすると、イベントハウス内の KQL データベース データの論理コピーを 1 つ作成できます。 OneLake 可用性をオンにすることは、KQL データベースにおいて、Power BI の Direct Lake モード、Warehouse、Lakehouse、Notebooks などの他の Fabric エンジンを経由して、Delta Lake 形式でデータのクエリを実行できることを意味します。
Delta Lake は、Microsoft Fabric のすべてのコンピューティング エンジンにわたってシームレスなデータ アクセスを実現する統合データ レイク テーブル形式です。 Delta Lake の詳細については、「Delta Lake とは」を参照してください。
この記事では、OneLake で KQL データベース データの可用性をオンにする方法を説明します。
しくみ
次の表で、OneLake 可用性をオンまたはオフにしたときの KQL データベースとテーブルの動作について説明します。
オン | 無効にする | |
---|---|---|
KQL Database | - 既存のテーブルは影響を受けません。 OneLake で新しいテーブルを使用できるようになります。 - KQL データベースのデータ保存ポリシーは、OneLake 内のデータにも適用されます。 保存期間の終了時に KQL データベースから削除されるデータは、OneLake からも削除されます。 |
- 既存のテーブルは影響を受けません。 OneLake では新しいテーブルを使用できません。 |
KQL データベース内のテーブル | - OneLake で新しいデータを使用できるようになります。 - 既存のデータはバックフィルされません。 - データの削除、切り詰め、消去はできません。 - テーブル スキーマは変更できず、テーブルの名前は変更できません。 - 行レベルのセキュリティはテーブルに適用できません。 |
- OneLake で新しいデータを使用できるようになりません。 - データの削除、切り詰め、消去はできます。 - テーブル スキーマは変更でき、テーブルの名前は変更できます。 - データは OneLake から論理的に削除されます。 |
重要
OneLake にデータが表示されるまで、最大で数時間かかることがあります。 詳細については、「アダプティブ動作」を参照してください。
[OneLake の可用性] をオンにするための追加のストレージ コストはありません。 詳細については、「リソースの使用」を参照してください。
前提条件
- Microsoft Fabric 対応容量を持つワークスペース
- 編集アクセス許可を持っていてデータがある KQL データベース
OneLake 可用性をオンにする
KQL データベースまたはテーブル レベルで OneLake 可用性をオンにできます。
[OneLake 可用性] をオンにするには、KQL データベースまたはテーブルの詳細ペインの [OneLake] セクションを参照してください。
[可用性] を [オン] にします。
データベースは自動的に更新されます。
KQL データベースで OneLake 可用性 をオンにしました。 指定した OneLake パスでデータベースに追加されたすべての新しいデータに、Delta Lake 形式でアクセスできるようになりました。 Lakehouse やデータ ウェアハウスからの OneLake ショートカットを作成すること、Power BI Direct Lake モードを介して直接データにクエリを実行することも選択できます。
アダプティブ動作
イベントハウスは、受信データ ストリームを分析用に構造化された 1 つ以上の Parquet ファイルにインテリジェントにバッチ処理する堅牢なメカニズムを提供します。 データ ストリームのバッチ処理は、トリクリング データを処理する際に重要です。 多数の小さな Parquet ファイルをレイクに書き込むのは非効率的であり、コストが高くなり、パフォーマンスが低下する可能性があります。
イベントハウスのアダプティブ メカニズムでは、最適な Parquet ファイルを作成するのに十分なデータがない場合、書き込み操作を数時間遅延させることができます。 これにより、Parquet ファイルのサイズが最適になり、Delta Lake のベスト プラクティスに準拠します。 イベントハウス アダプティブ メカニズムにより、Parquet ファイルが分析用に準備され、迅速なデータ可用性の必要性とコストとパフォーマンスに関する考慮事項のバランスが保たれます。
.show table mirroring operations コマンドを使用して、データの待機時間を確認することで、新しいデータがレイクに追加された時間を監視できます。
結果は、前回データが追加された時点から測定されます。 待機時間が 00:00:00 になると、KQL データベース内のすべてのデータを OneLake で使用できます。
ファイルの表示
テーブルで OneLake 可用性をオンにすると、デルタ ログ フォルダーが作成され、対応する JSON ファイルや Parquet ファイルがあればそれらも作成されます。 リアルタイムインテリジェンス内に留まりながら、OneLake およびそのプロパティで利用可能になったファイルを表示できます。
ファイルを表示するには、[エクスプローラー] ペインのテーブルにカーソルを合わせ、[その他] メニュー [...]>[ファイルの表示] を選択します。
デルタ ログ フォルダーまたは個々のファイルのプロパティを表示するには、フォルダーまたはファイルをポイントし、[その他] メニュー [...]>[プロパティ] を選択します。
デルタ ログ フォルダー内のファイルを表示するには:
- [_delta_log] フォルダーを選択します。
- テーブルのメタデータとスキーマを表示するファイルを選択します。 開いたエディターは読み取り専用の形式です。
アクセス ミラーリング ポリシー
既定では、OneLake の可用性が有効である場合、ミラーリング ポリシー が有効になります。 このポリシーを使用して、データ待機時間を監視したり、デルタ テーブルをパーティション分割するように変更したりできます。
Note
OneLake の可用性をオフにすると、ミラーリング ポリシーの IsEnabled
プロパティは false (IsEnabled=false
) に設定されます。
デルタ テーブルのパーティション分割
デルタ テーブルをパーティション分割して、クエリ速度を向上させることができます。 OneLake ファイルをパーティション分割するタイミングについての詳細は、「テーブルをパーティション分割するタイミング」を参照してください。 各パーティションは、[パーティション] リストに表示されている PartitionName を使用して個別の列として表されます。 OneLake コピーには、ソース テーブルよりも多くの列があることを意味します。
差分テーブルをパーティション分割するには、.alter-merge table policy mirroring コマンドを使用します。
関連するコンテンツ
- OneLake でデータを公開するには、「OneLake 内にショートカットを作成する」を参照してください
- Lakehouse で OneLake ショートカットを作成するには、「Lakehouseのショートカットとは」を参照してください。
- KQL データベースまたはテーブル内の OneLake から参照されるデータに対してクエリを実行するには、「KQL データベース内に OneLake ショートカットを作成する」を参照してください