Microsoft Fabric の用語
Fabric Data Warehouse、Fabric Data Engineering、Fabric Data Science、Real-Time Intelligence、Data Factory、Power BI に固有の用語など、Microsoft Fabric で使用される用語の定義について説明します。
一般的な用語
容量: 容量は、特定の時点で使用できる専用のリソース セットです。 容量は、アクティビティを実行する、または出力を生成するリソースの機能を定義します。 アイテムが異なると、一定の時点で異なる容量が消費されます。 Fabric は、Fabric SKU と試用版を通じて容量を提供します。 詳細については、「容量とは」を参照してください。
エクスペリエンス: 特定の機能を対象とする機能のコレクション。 Fabric エクスペリエンスには、Fabric Data Warehouse、Fabric Data Engineering、Fabric Data Science、Real-Time Intelligence、Data Factory、Power BI が含まれます。
項目: エクスペリエンス内の一連の機能を含む項目。 ユーザーは作成、編集、および削除できます。 項目の種類ごとに異なる機能が提供されます。 たとえば、Data Engineering エクスペリエンスには、lakehouse、Notebook、Spark ジョブ定義項目が含まれます。
テナント: テナントは、組織の Fabric の単一インスタンスであり、Microsoft Entra ID と一致します。
ワークスペース: ワークスペースは、コラボレーション用に設計された 1 つの環境でさまざまな機能を組み合わせる項目のコレクションです。 これは、実行される作業の容量を使用するコンテナーとして機能し、その中の項目にアクセスできるユーザーを制御します。 たとえば、ワークスペースでは、ユーザーはレポート、ノートブック、セマンティック モデルなどを作成します。詳細については、ワークスペースの に関する記事を参照してください。
ファブリック データ エンジニアリング
Lakehouse: A lakehouse は、ビッグ データ処理のために Apache Spark エンジンと SQL エンジンによって使用されるデータ レイク上のデータベースを表すファイル、フォルダー、テーブルのコレクションです。 Lakehouse には、オープンソースの Delta 形式のテーブルを使用する場合の ACID トランザクションの機能が強化されています。 Lakehouse アイテムは、Microsoft OneLake内の一意のワークスペース フォルダーにホストされます。 フォルダーとサブフォルダーに整理されたさまざまな形式 (構造化および非構造化) のファイルが含まれています。 詳細については、「レイクハウスとは」を参照してください。
Notebook: A Fabric ノートブックは、豊富な機能を備えた多言語の対話型プログラミング ツールです。 これには、コードとマークダウンの作成、Spark ジョブの実行と監視、結果の表示と視覚化、チームとの共同作業が含まれます。 データ エンジニアとデータ サイエンティストがデータを探索して処理し、コードとロー コードの両方のエクスペリエンスを使用して機械学習実験を構築するのに役立ちます。 オーケストレーション用のパイプライン アクティビティに簡単に変換できます。
Spark アプリケーション: Apache Spark アプリケーションは、Spark の API 言語 (Scala、Python、Spark SQL、または Java) または Microsoft が追加した言語 (C# または F# を使用する .NET) のいずれかを使用してユーザーによって記述されたプログラムです。 アプリケーションを実行すると、データをより高速に処理するために並列で実行される 1 つ以上の Spark ジョブに分割されます。 詳細については、「Spark アプリケーションの監視」を参照してください。
Apache Spark ジョブ: Spark ジョブは、アプリケーション内の他のジョブと並行して実行される Spark アプリケーションの一部です。 ジョブは複数のタスクで構成されます。 詳細については、Spark ジョブの監視に関するページを参照してください。
Apache Spark ジョブ定義: Spark ジョブ定義は、Spark アプリケーションの実行方法を示す、ユーザーが設定するパラメーターのセットです。 これにより、バッチ ジョブまたはストリーミング ジョブを Spark クラスターに送信できます。 詳細については、「Apache Spark ジョブ定義とは」を参照してください。
V オーダー: 高速読み取りを可能にし、コスト効率とパフォーマンスを向上させる Parquet ファイル形式への書き込みの最適化。 既定では、すべての Fabric エンジンが v オーダーの Parquet ファイルを書き込みます。
データファクトリー
コネクタ: Data Factory には、さまざまな種類のデータ ストアに接続できる豊富なコネクタ セットが用意されています。 接続したら、データを変換できます。 詳細については、「のコネクタ」を参照してください。
データ パイプライン: Data Factory の、データの移動と変換を調整するためにデータ パイプラインが使用されます。 これらのパイプラインは、Fabric のデプロイ パイプラインとは異なります。 詳細については、「Data Factory の概要」の「Pipelines」を参照してください。
Dataflow Gen2: データフローは、数百のデータ ソースからデータを取り込み、データを変換するためのロー コード インターフェイスを提供します。 Fabric のデータフローは、Dataflow Gen2 と呼ばれます。 データフロー Gen1 は Power BI に存在します。 Dataflow Gen2 には、Azure Data Factory または Power BI のデータフローに比べて追加の機能が用意されています。 Gen1 から Gen2 にアップグレードすることはできません。 詳細については、「Data Factory の概要」の「データフロー」を参照してください。
トリガー: スケジュールやデータの可用性など、特定の条件に基づいてパイプラインを開始する Data Factory の自動化機能。
Fabric Data Science
Data Wrangler: Data Wrangler は、探索的データ分析を実行するためのイマーシブ エクスペリエンスをユーザーに提供するノートブック ベースのツールです。 この機能は、グリッドに似たデータ表示と動的な概要統計と一連の一般的なデータ クレンジング操作を組み合わせたものであり、選択したアイコンがいくつか用意されています。 各操作では、再利用可能なスクリプトとしてノートブックに保存できるコードが生成されます。
実験: 機械学習実験は、関連するすべての機械学習実行の組織と制御の主要な単位です。 詳細については、Microsoft Fabric での機械学習の実験を参照してください。
モデル: 機械学習モデルは、特定の種類のパターンを認識するようにトレーニングされたファイルです。 一連のデータに対してモデルをトレーニングし、そのデータ セットを推論して学習するために使用するアルゴリズムを提供します。 詳細については、「機械学習モデルの 」を参照してください。
実行: 実行は、モデル コードの 1 回の実行に対応します。 MLflowでは、追跡は実験と実行に基づいています。
Fabric Data Warehouse
SQL 分析エンドポイント: 各 Lakehouse には、ユーザーが TDS 経由で TSQL を使用してデルタ テーブル データに対してクエリを実行できる SQL 分析エンドポイントがあります。 詳細については、SQL 分析エンドポイントの に関するページを参照してください。
Fabric Data Warehouse: Fabric Data Warehouse は従来のデータ ウェアハウスとして機能し、エンタープライズ データ ウェアハウスから期待される完全なトランザクション T-SQL 機能をサポートします。 詳細については、「Fabric Data Warehouse」を参照してください。
リアルタイム インテリジェンス
アクティベーター: Activator は、データに対するアラート、トリガー、アクションを作成できるコードなしのロー コード ツールです。 アクティベーターは、データ ストリームにアラートを作成するために使用されます。 詳細については、「アクティベータ」を参照してください。
Eventhouse: Eventhouses は、特にリアルタイムの分析と探索を必要とするシナリオで、大量のデータを処理および分析するためのソリューションを提供します。 これらは、リアルタイム データ ストリームを効率的に処理するように設計されています。これにより、組織は、ほぼリアルタイムでデータを取り込み、処理し、分析できます。 1 つのワークスペースで複数の Eventhouse を保持でき、1 つのイベントハウスで複数の KQL データベースを保持でき、各データベースは複数のテーブルを保持できます。 詳細については、「eventhouse の概要 を参照してください。
Eventstream: Microsoft Fabric eventstreams 機能は、コードなしのエクスペリエンスでリアルタイム イベントをキャプチャ、変換、宛先にルーティングするための Fabric プラットフォームの一元的な場所を提供します。 イベントストリームは、変換が必要な場合に、さまざまなストリーミング データ ソース、インジェスト先、およびイベント プロセッサで構成されます。 詳細については、「Microsoft Fabric eventstreams」を参照してください。
KQL データベース: KQL データベースは、KQL クエリを実行できる形式でデータを保持します。 KQL データベースは、Eventhouse の下の項目です。 詳細については、KQL データベース を参照してください。
KQL クエリセット: KQL クエリセットは、クエリの実行、結果の表示、データ エクスプローラー データベースからのデータに対するクエリ結果の操作に使用される項目です。 クエリセットには、データベースとテーブル、クエリ、および結果が含まれます。 KQL クエリセットを使用すると、将来使用するためにクエリを保存したり、クエリをエクスポートして他のユーザーと共有したりできます。 詳細については、「KQL Queryset の クエリ データ」を参照してください。
リアルタイム ハブ
- Real-Time ハブ: Real-Time ハブは、組織全体のすべてのデータインモーションの単一の場所です。 すべての Microsoft Fabric テナントは、ハブで自動的にプロビジョニングされます。 詳細については、ハブの概要 Real-Time 参照してください。
OneLake
- ショートカット: ショートカットは、他のファイル ストアの場所を指す OneLake 内の埋め込み参照です。 直接コピーしなくても、既存のデータに接続する方法が提供されます。 詳細については、「OneLake ショートカット を参照してください。
関連コンテンツ
- Microsoft Fabric ホーム ページからアイテムに移動
- Microsoft Fabric でのエンド ツー エンド チュートリアル