Pobieranie danych z usługi Azure Storage

Artykuł
01/28/2025

Z tego artykułu dowiesz się, jak pobrać dane z usługi Azure Storage (kontener usługi ADLS Gen2, kontener obiektów blob lub pojedynczych obiektów blob) do nowej lub istniejącej tabeli.

Warunki wstępne

Obszar roboczy z pojemnością obsługiwaną przez Microsoft Fabric
baza danych KQL z uprawnieniami do edycji
Konto przechowywania

Źródło

Na dolnej wstążce bazy danych KQL wybierz opcję Pobierz dane.

W oknie Pobierz dane wybrana jest karta Źródłowa.
Wybierz źródło danych z listy dostępnych. W tym przykładzie pobierane są dane z usługi Azure storage.

Konfiguruj

Wybierz tabelę docelową. Jeśli chcesz pozyskać dane do nowej tabeli, wybierz pozycję + Nowa tabela i wprowadź nazwę tabeli.

Uwaga

Nazwy tabel mogą zawierać maksymalnie 1024 znaki, w tym spacje, alfanumeryczne, łączniki i podkreślenia. Znaki specjalne nie są obsługiwane.

Aby dodać źródło danych, wklej parametry połączenia magazynu w polu identyfikatora URI, a następnie wybierz pozycję +. W poniższej tabeli wymieniono obsługiwane metody uwierzytelniania oraz uprawnienia wymagane do pozyskiwania danych z usługi Azure Storage.

Metoda uwierzytelniania	Pojedynczy blob	Kontener obiektów blob	Azure Data Lake Storage Gen2
Token dostępu współdzielonego (SAS)	Odczyt i zapis	Przeczytaj i wymień	Odczyt i lista
klucz dostępu do konta magazynu

Notatka

Można dodać maksymalnie 10 pojedynczych obiektów blob lub pozyskać maksymalnie 5000 obiektów blob z jednego kontenera. Nie można spożywać obu w tym samym czasie.
Każdy obiekt blob może mieć maksymalnie 1 GB w stanie nieskompresowanym.

Jeśli wklejono parametry połączenia dla kontenera obiektów blob lub usługi Azure Data Lake Storage Gen2, możesz dodać następujące opcjonalne filtry:

ustawienie	Opis pola
filtry plików (opcjonalnie)
Ścieżka folderu	Filtruje dane w celu pobierania plików z określoną ścieżką folderu.
Rozszerzenie pliku	Filtruje dane, aby wczytywać pliki tylko o określonym rozszerzeniu.

Wybierz Dalej

Inspekcjonować

Karta „Inspekcja” zostanie otwarta z podglądem danych.

Aby ukończyć proces pobierania danych, wybierz Zakończ.

Opcjonalnie:

Wybierz Podgląd poleceń, aby wyświetlić i skopiować polecenia automatyczne wygenerowane na podstawie danych wejściowych.
Użyj listy rozwijanej pliku definicji schematu , aby zmienić plik, z którego schemat jest wywnioskowany.
Zmień automatycznie wnioskowany format danych, wybierając żądany format z listy rozwijanej. Aby uzyskać więcej informacji, zobacz Formaty danych obsługiwane przez Real-Time Intelligence.
Edytuj kolumny.
Poznaj opcje zaawansowane oparte na typie danych.

Edytowanie kolumn

Notatka

W przypadku formatów tabelarycznych (CSV, TSV, PSV) nie można dwukrotnie mapować kolumny. Aby zamapować na istniejącą kolumnę, najpierw usuń nową kolumnę.
Nie można zmienić istniejącego typu kolumny. Jeśli spróbujesz mapować kolumnę na inny format, może się okazać, że kolumny będą puste.

Zmiany, które można wprowadzić w tabeli, zależą od następujących parametrów:

typ tabeli jest nowy lub istniejący
typ mapowania jest nowy lub istniejący

Typ tabeli	Typ mapowania	Dostępne korekty
Nowa tabela	Nowe mapowanie	Zmień nazwę kolumny, zmień typ danych, zmień źródło danych, transformacja mapowania, dodaj kolumnę, usuń kolumnę
Istniejąca tabela	Nowe mapowanie	Dodaj kolumnę (na której można następnie zmienić typ danych, zmienić nazwę i zaktualizować)
Istniejąca tabela	Istniejące mapowanie	żaden

Transformacje mapowania

Niektóre mapowania formatów danych (Parquet, JSON i Avro) obsługują proste przekształcenia czasu wprowadzania. Aby zastosować przekształcenia mapowania, utwórz lub zaktualizuj kolumnę w oknie Edytuj kolumny.

Przekształcenia mapowania można przeprowadzać na kolumnach typu string lub datetime, gdzie źródło ma typ danych int lub long. Obsługiwane przekształcenia mapowania to:

DateTimeFromUnixSeconds
DateTimeFromUnixMilliseconds
DateTimeFromUnixMicroseconds
DateTimeFromUnixNanoseconds

Opcje zaawansowane oparte na typie danych

tabelaryczne (CSV, TSV, PSV):

Jeśli importujesz formaty tabelaryczne do istniejącej tabeli, możesz wybrać Zaawansowane>Zachowaj schemat tabeli. Dane tabelaryczne nie muszą zawierać nazw kolumn używanych do mapowania danych źródłowych na istniejące kolumny. Po zaznaczeniu tej opcji mapowanie odbywa się według kolejności, a schemat tabeli pozostaje taki sam. Jeśli ta opcja nie jest zaznaczona, nowe kolumny są tworzone dla danych przychodzących, niezależnie od struktury danych.
Aby użyć pierwszego wiersza jako nazw kolumn, wybierz Zaawansowane>Pierwszy wiersz to nagłówek kolumny.

JSON:

Aby określić podział kolumn danych JSON, wybierz Zaawansowane>Poziomy zagnieżdżenia, z zakresu od 1 do 100.
Jeśli wybierzesz Zaawansowane>Pomiń wiersze JSON z błędami, dane są wczytywane w formacie JSON. Jeśli to pole wyboru nie zostanie zaznaczone, dane są pozyskiwane w formacie multijson.

Streszczenie

W oknie przygotowywania danych wszystkie etapy są zaznaczone zielonymi znacznikami po pomyślnym zakończeniu procesu pozyskiwania danych. Możesz wybrać kartę, aby wykonać zapytanie, usunąć pobrane dane lub wyświetlić pulpit nawigacyjny z podsumowaniem pozyskiwania danych.

Aby zarządzać bazą danych, zobacz Zarządzanie danymi
Aby tworzyć, przechowywać i eksportować zapytania, zobacz Query data in a KQL queryset

Udostępnij za pośrednictwem

Pobieranie danych z usługi Azure Storage

Warunki wstępne

Źródło

Konfiguruj

Inspekcjonować

Edytowanie kolumn

Transformacje mapowania

Opcje zaawansowane oparte na typie danych

Streszczenie

Opinia

Dodatkowe zasoby

Udostępnij za pośrednictwem

Pobieranie danych z usługi Azure Storage

Warunki wstępne

Źródło

Konfiguruj

Inspekcjonować

Edytowanie kolumn

Transformacje mapowania

Opcje zaawansowane oparte na typie danych

Streszczenie

Powiązana zawartość

Opinia

Dodatkowe zasoby