Udostępnij za pośrednictwem


Źródło XML

Dotyczy:SQL Server SSIS Integration Runtime w usłudze Azure Data Factory

Źródło XML odczytuje plik danych XML i wypełnia kolumny w danych wyjściowych źródła danymi.

Dane w plikach XML często zawierają relacje hierarchiczne. Na przykład plik danych XML może reprezentować wykazy i elementy w wykazach. Zanim dane będą mogły wejść do przepływu danych, należy określić relację elementów w pliku danych XML, a dane wyjściowe muszą zostać wygenerowane dla każdego elementu w pliku.

Schematów

Źródło XML używa schematu do interpretowania danych XML. Źródło XML obsługuje używanie pliku definicji schematu XML (XSD) lub schematów wbudowanych do tłumaczenia danych XML na format tabelaryczny. W przypadku skonfigurowania źródła XML przy użyciu okna dialogowego edytora kodu XML interfejs użytkownika może wygenerować plik XSD z określonego pliku danych XML.

Notatka

DTDs nie są wspierane.

Schematy mogą obsługiwać tylko jedną przestrzeń nazw; nie obsługują kolekcji schematów.

Notatka

Źródło XML nie weryfikuje danych w pliku XML względem XSD.

Edytor źródła XML

Dane w plikach XML często zawierają relacje hierarchiczne. Okno dialogowe edytora źródeł XML używa określonego schematu do generowania danych wyjściowych źródła XML. Możesz określić plik XSD, użyć wbudowanego schematu lub wygenerować XSD z określonego pliku danych XML. Schemat musi być dostępny w czasie projektowania.

Źródło XML generuje struktury tabelaryczne na podstawie danych XML, tworząc dane wyjściowe dla każdego elementu zawierającego inne elementy w plikach XML. Jeśli na przykład dane XML reprezentują wykazy i elementy w wykazach, źródło XML tworzy dane wyjściowe dla katalogów i dane wyjściowe dla każdego typu elementu, który zawiera wykazy. Dane wyjściowe każdego elementu będą zawierać kolumny wyjściowe dla atrybutów tego elementu.

Aby podać informacje o hierarchicznej relacji danych w danych wyjściowych, źródło XML dodaje kolumnę w danych wyjściowych, która identyfikuje element nadrzędny dla każdego elementu podrzędnego. Korzystając z przykładu wykazów z różnymi typami elementów, każdy element będzie miał wartość kolumny identyfikującą wykaz, do którego należy.

Źródło XML tworzy dane wyjściowe dla każdego elementu, ale nie jest wymagane, aby używać wszystkich danych wyjściowych. Możesz usunąć wszystkie dane wyjściowe, których nie chcesz użyć, lub po prostu nie połączyć go ze składnikiem podrzędnym.

Źródło XML generuje również nazwy wyjściowe, aby upewnić się, że nazwy są jednoznaczne. Te nazwy mogą być długie i mogą nie identyfikować danych wyjściowych w sposób, który jest dla Ciebie przydatny. Możesz zmienić nazwy danych wyjściowych, o ile ich nazwy pozostaną unikatowe. Można również zmodyfikować typ danych i długość kolumn wyjściowych.

Dla każdego wyjścia źródło XML dodaje wyjście błędu. Domyślnie kolumny w danych wyjściowych błędów mają typ danych ciągu Unicode (DT_WSTR) o długości 255, ale można skonfigurować kolumny w danych wyjściowych błędów, modyfikując ich typ danych i długość.

Jeśli plik danych XML zawiera elementy, które nie znajdują się w XSD, te elementy są ignorowane i nie są generowane żadne dane wyjściowe. Z drugiej strony, jeśli w pliku danych XML brakuje elementów reprezentowanych w XSD, dane wyjściowe będą zawierać kolumny z wartościami null.

Gdy dane są wyodrębniane z pliku danych XML, są konwertowane na typ danych usług Integration Services. Jednak źródło XML nie może przekonwertować danych XML na DT_TIME2 lub DT_DBTIMESTAMP2 typów danych, ponieważ źródło nie obsługuje tych typów danych. Aby uzyskać więcej informacji, zobacz Integration Services Data Types.

Schemat XSD lub wbudowany schemat może określać typ danych dla elementów, ale jeśli nie, to okno dialogowe Edytora źródła XML przypisze typ danych ciągu Unicode (DT_WSTR) do kolumny w danych wyjściowych, która zawiera element, i ustawi liczbę znaków w kolumnie na 255.

Jeśli schemat określa maksymalną długość elementu, długość kolumny wyjściowej jest ustawiona na tę wartość. Jeśli maksymalna długość jest większa niż długość obsługiwana przez typ danych usług Integration Services, do którego element jest konwertowany, dane są obcinane do maksymalnej długości typu danych. Jeśli na przykład ciąg ma długość 5000, jest obcinany do 4000 znaków, ponieważ maksymalna długość typu danych DT_WSTR wynosi 4000 znaków; podobnie dane bajtów są obcinane do 8000 znaków, maksymalną długość typu danych DT_BYTES. Jeśli schemat nie określa maksymalnej długości, domyślna długość kolumn z żadnym typem danych jest ustawiona na 255. Obcinanie danych w źródle XML jest obsługiwane tak samo, jak obcinanie w innych składnikach przepływu danych. Aby uzyskać więcej informacji, zobacz Obsługa błędów w danych.

Możesz zmodyfikować typ danych i długość kolumny. Aby uzyskać więcej informacji, zobacz Integration Services Data Types.

Konfiguracja źródła XML

Źródło XML obsługuje trzy różne tryby dostępu do danych. Możesz określić lokalizację pliku danych XML, zmienną zawierającą lokalizację pliku lub zmienną zawierającą dane XML.

Źródło XML zawiera XMLData i XMLSchemaDefinition właściwości niestandardowe, które można zaktualizować za pomocą wyrażeń właściwości podczas ładowania pakietu. Aby uzyskać więcej informacji, zobacz Wyrażenia usług integracyjnych (SSIS), Używanie wyrażeń właściwości w pakietachoraz Niestandardowe właściwości źródła XML.

Źródło XML obsługuje wiele zwykłych wyjść i wiele wyjść błędów.

Usługi SQL Server Integration Services obejmują okno dialogowe edytora XML, które służy do konfigurowania źródła XML. To okno dialogowe jest dostępne w projektancie usług SSIS.

Właściwości można ustawić za pomocą projektanta usług SSIS lub programowo.

Okno dialogowe edytora zaawansowanego odzwierciedla właściwości, które można ustawić programowo. Aby uzyskać więcej informacji o właściwościach, które można ustawić w oknie dialogowym edytora zaawansowanego lub programowo, kliknij jeden z następujących tematów:

Aby uzyskać więcej informacji na temat ustawiania właściwości, kliknij jeden z następujących tematów:

Edytor źródła XML (strona Menedżera połączeń)

Użyj strony Menedżera Połączeń edytora źródeł XML , aby określić plik XML i XSD, które przekształcają dane XML.

Opcje statyczne

tryb dostępu do danych
Określ metodę wybierania danych ze źródła.

Wartość Opis
Lokalizacja pliku XML Pobieranie danych z pliku XML.
Plik XML ze zmiennej Określ nazwę pliku XML w zmiennej.

Powiązane informacje: Używanie zmiennych w pakietach
Dane XML ze zmiennej Pobieranie danych XML ze zmiennej.

Użyj wbudowanego schematu
Określ, czy dane źródłowe XML zawierają schemat XSD, który definiuje i weryfikuje jego strukturę i dane.

lokalizacja XSD
Wpisz ścieżkę i nazwę pliku schematu XSD lub znajdź plik, klikając Przeglądaj.

Przeglądaj
Użyj okna dialogowego Otwórz, aby zlokalizować plik schematu XSD.

generowanie XSD
Użyj okna dialogowego Zapisz jako, aby wybrać lokalizację pliku schematu XSD wygenerowanego automatycznie. Edytor wywnioskuje schemat ze struktury danych XML.

Opcje dynamiczne trybu dostępu do danych

Tryb dostępu do danych = lokalizacja pliku XML

lokalizacja XML
Wpisz ścieżkę i nazwę pliku danych XML lub znajdź plik, klikając Przeglądaj.

Przeglądaj
Użyj okna dialogowego Otwórz , aby zlokalizować plik danych XML.

Tryb dostępu do danych = plik XML ze zmiennej

nazwa zmiennej
Wybierz zmienną zawierającą ścieżkę i nazwę pliku XML.

Tryb dostępu do danych = dane XML ze zmiennej

nazwa zmiennej
Wybierz zmienną zawierającą dane XML.

Edytor źródła XML (strona kolumn)

Użyj węzła Columns w oknie dialogowym XML Source Editor, aby przypisać kolumnę wyjściową do kolumny zewnętrznej (źródłowej).

Opcje

Dostępne Kolumny Zewnętrzne
Wyświetl listę dostępnych kolumn zewnętrznych w źródle danych. Nie można użyć tej tabeli do dodawania lub usuwania kolumn.

Kolumna Zewnętrzna
Wyświetl kolumny zewnętrzne (źródłowe) w kolejności, w której zadanie je odczytuje. Możesz zmienić tę kolejność, usuwając najpierw zaznaczenie wybranych kolumn w tabeli wyświetlanej w edytorze, a następnie wybierając kolumny zewnętrzne z listy w innej kolejności.

kolumna wyjściowa
Podaj unikatową nazwę dla każdej kolumny danych wyjściowych. Wartość domyślna to nazwa wybranej kolumny zewnętrznej (źródłowej). można jednak wybrać dowolną unikatową, opisową nazwę. Nazwa, którą podano, będzie wyświetlana w SSIS Designer.

Edytor źródła XML (strona wyników błędu)

Użyj strony danych wyjściowych błędów okna dialogowego edytora źródeł XML, aby wybrać opcje obsługi błędów i ustawić właściwości w kolumnach wyjściowych błędów.

Opcje

wejściowe/wyjściowe
Wyświetl nazwę źródła danych.

kolumna
Wyświetl kolumny zewnętrzne (źródłowe), które wybrałeś na stronie Menedżera połączeń na stronie okna dialogowego Edytora źródła XML.

błędów
Określ, co powinno się stać, gdy wystąpi błąd: zignoruj go, przekieruj wiersz lub spowoduj awarię składnika.

Tematy związane:Obsługa błędów w danych

przycinanie
Określ, co powinno się zdarzyć w przypadku obcięcia: zignoruj błąd, przekieruj wiersz czy zakończ działanie składnika błędem.

opis
Wyświetl opis błędu.

Ustaw tę wartość w zaznaczonych komórkach
Określ, co powinno się zdarzyć dla wszystkich zaznaczonych komórek, gdy wystąpi błąd lub ucięcie: zignoruj błąd, przekieruj wiersz lub niepowodzenie składnika.

Zastosuj
Zastosuj opcję obsługi błędów do zaznaczonych komórek.

Wyodrębnij dane przy użyciu źródła XML