Delta Lake テーブルへの読み込み
Microsoft Fabric の Lakehouse には、分析用に最適化された Delta テーブルに一般的なファイルの種類を効率的に読み込む機能が用意されています。 テーブルへの読み込み機能を使用すると、ユーザーは 1 つのファイルまたはファイル フォルダーをテーブルに読み込むことができます。 この機能を使用すると、データ エンジニアが右クリック アクションをすばやく使用して、ファイルやフォルダーへのテーブルの読み込みを可能にできるため、生産性が向上します。 テーブルへの読み込みは、コードなしのエクスペリエンスでもあり、すべてのペルソナの参入の障害が少なくなります。
テーブルへの読み込み機能の概要
以下は、ユーザーの柔軟性を提供しながら生産性を向上させるために、統合ロードからテーブルへの経験で有効にした機能のリストです:
サポートされるファイルの種類: この機能では、PARQUET または CSV ファイルの種類の読み込みのみが現在サポートされています。 ファイル拡張子の大文字と小文字は関係ありません。
単一ファイルの読み込み: ユーザーは、ファイルのコンテキスト メニュー アクションで [Load to Delta Table] (Delta テーブルに読み込む) を選択することで、サポートされている形式のいずれかで任意の 1 つのファイルを読み込むことができます。
フォルダー レベルの読み込み: フォルダーをクリックした後に [Load to Delta Table] (Delta テーブルに読み込む) を選択することで、フォルダーとそのサブフォルダーのすべてのファイルを一度に読み込むことができます。 この機能は、すべてのファイルを自動的に走査し、Delta テーブルに読み込みます。 テーブルに同時に読み込むことができるのは、同じ種類のファイルのみであることに注意してください。
新規および既存のテーブルへの読み込み: ユーザーは、新しいテーブルまたは選択した既存のテーブルにファイルとフォルダーを読み込むことができます。 既存のテーブルに読み込む場合は、テーブル内のデータを追加または上書きすることができます。
CSV ソース ファイル オプション: CSV ファイルの場合、ユーザーは、列名として利用したいヘッダーがソース ファイルに含まれているかどうかを指定できます。 また、ユーザーは、任意の区切り記号を指定して、既定のコンマ区切り記号をオーバーライドすることもできます。
Delta テーブルとして読み込み: テーブルは、常に、V オーダー最適化が有効になった Delta Lake テーブル形式を使用して読み込まれます。
Note
現時点では、Lakehouse UI を使用してテーブル スキーマを指定することはできません。その目的でノートブックを使用することが必要です。
検証のガイドラインとルール
テーブルへの読み込みエクスペリエンスには次の標準が適用されます。
テーブル名に使用できるのは英数字とアンダースコアのみです。 また、最大長 256 文字で、英文字 (大文字または小文字)、アンダースコア (
_
) も使用できます。 ダッシュ (-
) および空白文字は使用できません。列ヘッダーのないテキスト ファイルでは、テーブルの列名として標準
col#
表記に置き換えられます。列名には、英語の文字、大文字または小文字、アンダースコア (
_
)、および UTF の中国語などの他の言語の文字を使用でき、最大 128 文字です。 列名は、読み込みアクション中に検証されます。 Delta への読み込みアルゴリズムでは、禁止されている値がアンダーバー (_
) に置き換えられます。 検証中に適切な列名が得られなかった場合、読み込みアクションは失敗します。CSV ファイルの場合、区切り記号を空にしたり、 8 文字を超えたり、
(
、)
、[
、]
、{
、}
、一重引用符 ('
)、二重引用符 ("
)、空白文字のいずれかを使用することはできません。