Microsoft Fabric での Fabric データエンジニアの新機能と計画

[アーティクル]
11/20/2024

重要

リリース計画で説明されている機能は、まだリリースされていない場合があります。提供タイムラインおよび予定されている機能は、変更される可能性、またはリリースされない可能性があります。詳細については、「Microsoft ポリシー」をご覧ください。

Fabric データエンジニアを使用すると、データエンジニアは Spark を使用して大規模にデータを変換し、Lakehouse アーキテクチャを構築できます。

すべての組織データのためのレイクハウス: レイクハウスは、データレイクとデータウェアハウスのベストを 1 つのエクスペリエンスで組み合わせたものになります。これにより、ユーザーは、レイク内のオープン形式で組織データを取り込み、準備し、共有することができます。後で Spark、T-SQL、Power BI などの複数のエンジンを介してアクセスできます。データフローやパイプライン、外部データソースへのショートカット、データ製品共有機能など、さまざまなデータ統合オプションが提供されます。

パフォーマンスの高い Spark エンジンとランタイム: Fabric データエンジニアリングは、Spark、Delta、Python の最新バージョンを使用して最適化された Spark ランタイムを提供します。すべてのエンジンの共通テーブル形式として Delta Lake を使用するため、データ移動なしで簡単にデータ共有とレポートを行うことができます。ランタイムには Spark の最適化が付属し、構成なしでクエリのパフォーマンスが向上します。また、Spark セッションを高速化して再利用するためのスタータープールと高コンカレンシーモードも提供されるため、時間とコストを節約できます。

Spark 管理者と構成: 適切なアクセス許可を持つワークスペース管理者は、Spark ワークロードのパフォーマンスとコストを最適化するためのカスタムプールを作成して構成できます。作成者は、ライブラリのインストール、ランタイムバージョンの選択、ノートブックと Spark ジョブの Spark プロパティの設定を行う環境を構成できます。

開発者エクスペリエンス: 開発者は、ノートブック、Spark ジョブ、または任意の IDE を使用して、Fabric で Spark コードを作成して実行できます。レイクハウスデータへのネイティブアクセス、他のユーザーとの共同作業、ライブラリのインストール、履歴の追跡、インライン監視の実行、Spark Advisor からの推奨事項の取得を行うことができます。また、Data Wrangler を使用して、低コード UI でデータを簡単に準備することもできます。

プラットフォーム統合: ノートブック、Spark ジョブ、環境、レイクハウスなど、すべての Fabric データエンジニアリング項目は、Fabric プラットフォーム (エンタープライズ情報管理機能、系列、秘密度ラベル、保証) に深く統合されています。

投資分野

機能	リリース予定のタイムライン
Python ノートブック	Q4 2024
ArcGIS GeoAnalytics for Microsoft Fabric Spark	Q4 2024
ADLS Gen2 ストレージアカウントからのライブラリのインストール	Q4 2024
ノートブックのライブバージョン管理	2025 年第 1 四半期
Fabric でのユーザーデータ関数の VSCode サテライト拡張機能	2025 年第 1 四半期
Fabric のユーザーデータ関数	2025 年第 1 四半期
パブリック監視 API	2025 年第 1 四半期
Git およびデプロイパイプラインの Lakehouse ショートカットメタデータ	2025 年第 1 四半期
Spark エクスペリエンスでの Delta Lake の機能強化	2025 年第 1 四半期
進行中のノートブックジョブのスナップショットのサポート	2025 年第 1 四半期
Spark と Lakehouse の RLS/CLS サポート	2025 年第 1 四半期
Spark Connector for Fabric Data Warehouse - 一般提供	2025 年第 1 四半期
レイクハウスでテーブルとフォルダーを並べ替え、フィルター処理する機能	出荷済み (2024 年第 4 四半期)
アプリ内のノートブック	出荷済み (2024 年第 4 四半期)
Fabric の VSCode コア拡張機能	出荷済み (2024 年第 3 四半期)
T-SQL ノートブック	出荷済み (2024 年第 3 四半期)
Web 用 VS Code - デバッグのサポート	出荷済み (2024 年第 3 四半期)
パイプラインの高コンカレンシー	出荷済み (2024 年第 3 四半期)
レイクハウスの名前空間でのスキーマのサポートとワークスペース	出荷済み (2024 年第 3 四半期)
Spark ネイティブ実行エンジン	出荷済み (2024 年第 2 四半期)
Fabric データウェアハウス用 Spark コネクタ	出荷済み (2024 年第 2 四半期)
GraphQL 用 Microsoft Fabric API	出荷済み (2024 年第 2 四半期)
環境の作成とアタッチ	出荷済み (2024 年第 2 四半期)
ノートブックジョブのキュー	出荷済み (2024 年第 2 四半期)
Fabric Spark の Optimistic Job Admission	出荷済み (2024 年第 2 四半期)
Spark Autotune	出荷済み (2024 年第 1 四半期)

Python ノートブック

リリース予定のタイムライン: 2024 年第 4 四半期

リリースの種類: パブリックプレビュー

Fabric ノートブックでは、純粋な Python エクスペリエンスがサポートされています。この新しいソリューションは、小さなデータセット (最大数 GB) で作業し、Pandas と Python をプライマリ言語として使用する BI 開発者とデータ科学者を対象としています。この新しいエクスペリエンスを通じて、ネイティブ Python 言語とそのネイティブ機能とライブラリをすぐに利用でき、Python バージョンから別のバージョンに切り替えることができます (最初は 2 つのバージョンがサポートされます)。最後に、より小さな 2VCore マシンを使用することで、リソース使用率が向上します。

ArcGIS GeoAnalytics for Microsoft Fabric Spark

リリース予定のタイムライン: 2024 年第 4 四半期

リリースの種類: パブリックプレビュー

Microsoft と Esri は、空間分析を Microsoft Fabric に導入するために提携しています。このコラボレーションにより、新しいライブラリ ArcGIS GeoAnalytics for Microsoft Fabric が導入され、Microsoft Fabric Spark ノートブックと Spark ジョブ定義内で (データエンジニアとデータサイエンスのエクスペリエンス/ワークロードの両方で) 広範な空間分析が可能になります。

この統合された製品エクスペリエンスにより、Spark 開発者またはデータサイエンティストは、ArcGIS GeoAnalytics 関数とツールを Fabric Spark 内でネイティブに実行して、さまざまなユースケースでデータの空間変換、エンリッチメント、パターン/傾向分析 (ビッグデータも含む) を実行できます。個別のインストールと構成は必要ありません。

ADLS Gen2 ストレージアカウントからのライブラリのインストール

リリース予定のタイムライン: 2024 年第 4 四半期

リリースの種類: パブリックプレビュー

ユーザーがライブラリをインストールするための新しいソースのサポート。ストレージアカウントでホストされているカスタム conda/PyPI チャネルを作成することで、ユーザーは自分のストレージアカウントから Fabric Environment にライブラリをインストールできます。