Konfigurowanie usługi Azure Cosmos DB for NoSQL w działaniu kopiowania
W tym artykule opisano sposób używania działania kopiowania w potoku danych do kopiowania danych z i do usługi Azure Cosmos DB for NoSQL.
Obsługiwana konfiguracja
W przypadku konfiguracji każdej karty w działaniu kopiowania przejdź odpowiednio do poniższych sekcji.
Ogólne
Zapoznaj się ze wskazówkami dotyczącymi ustawień ogólnych, aby skonfigurować kartę Ustawienia ogólne.
Źródło
Następujące właściwości są obsługiwane w przypadku usługi Azure Cosmos DB for NoSQL na karcie Źródło działania kopiowania.
Wymagane są następujące trzy właściwości:
- Typ magazynu danych: wybierz pozycję Zewnętrzne.
- Połączenie ion: wybierz połączenie usługi Azure Cosmos DB for NoSQL z listy połączeń. Jeśli połączenie nie istnieje, utwórz nowe połączenie usługi Azure Cosmos DB for NoSQL, wybierając pozycję Nowy.
- Kontener: wybierz kontener, którego chcesz użyć. Wybierz pozycję Edytuj , aby ręcznie wprowadzić nazwę kontenera.
W obszarze Zaawansowane można określić następujące pola:
Użyj zapytania: możesz wybrać tabelę lub kwerendę jako zapytanie używane. Poniższa lista zawiera opis konfiguracji każdego ustawienia.
Tabela: odczytuje dane z tabeli określonej w tabeli.
Zapytanie: określa zapytanie usługi Azure Cosmos DB w celu odczytu danych.
Rozmiar strony: liczba dokumentów na stronę wyniku zapytania. Wartość domyślna to "-1", co oznacza użycie dynamicznego rozmiaru strony po stronie usługi do 1000.
Wykrywanie daty/godziny: czy wykrywać datę/godzinę z wartości ciągu w dokumentach. Dozwolone wartości to: true (wartość domyślna), false.
Preferowane regiony: preferowana lista regionów do nawiązania połączenia podczas pobierania danych z usługi Azure Cosmos DB. Wybierz jeden preferowany region z listy rozwijanej po wybraniu pozycji Nowy.
Dodatkowe kolumny: Dodaj dodatkowe kolumny danych, aby przechowywać ścieżkę względną plików źródłowych lub wartość statyczną. Wyrażenie jest obsługiwane w przypadku tych ostatnich. Aby uzyskać więcej informacji, zobacz Dodawanie dodatkowych kolumn podczas kopiowania.
Element docelowy
Następujące właściwości są obsługiwane w przypadku usługi Azure Cosmos DB for NoSQL na karcie Miejsce docelowe działania kopiowania.
Wymagane są następujące trzy właściwości:
- Typ magazynu danych: wybierz pozycję Zewnętrzne.
- Połączenie ion: wybierz połączenie usługi Azure Cosmos DB for NoSQL z listy połączeń.
- Kontener: wybierz pozycję Przeglądaj , aby wybrać plik, który chcesz skopiować, lub wypełnij ścieżkę ręcznie.
W obszarze Zaawansowane można określić następujące pola:
Zachowanie zapisu: definiuje zachowanie zapisu, gdy miejsce docelowe to pliki z magazynu danych opartego na plikach. Z listy rozwijanej możesz wybrać pozycję Dodaj zawartość dynamiczną, Wstaw lub Upsert .
Dodaj zawartość dynamiczną: otwórz okienko Dodawanie zawartości dynamicznej. Spowoduje to otwarcie konstruktora wyrażeń, w którym można tworzyć wyrażenia z obsługiwanych zmiennych systemowych, danych wyjściowych działań, funkcji i zmiennych lub parametrów określonych przez użytkownika. Aby uzyskać informacje na temat języka wyrażeń, przejdź do pozycji Wyrażenia i funkcje.
Wstaw: wybierz tę opcję, jeśli dane źródłowe mają wstawione.
Upsert: zachowanie operacji upsert polega na zastąpieniu dokumentu, jeśli dokument o tym samym identyfikatorze już istnieje; w przeciwnym razie wstaw dokument.
Limit czasu wsadowego zapisu: czas oczekiwania na ukończenie operacji wstawiania wsadowego przed przekroczeniem limitu czasu. Dozwolone wartości to
Timespan
. Przykładem jest 00:30:00 (30 minut).Rozmiar partii zapisu: określ liczbę wierszy do wstawienia do tabeli SQL na partię. Dozwolona wartość to liczba całkowita (liczba wierszy). Domyślnie usługa dynamicznie określa odpowiedni rozmiar partii na podstawie rozmiaru wiersza.
Maksymalna liczba połączeń współbieżnych: górny limit połączeń współbieżnych ustanowionych z magazynem danych podczas uruchamiania działania. Określ wartość tylko wtedy, gdy chcesz ograniczyć połączenia współbieżne.
Wyłącz analizę metryk wydajności: to ustawienie steruje kolekcją metryk, takich jak DTU, DWU, RU itd. na potrzeby optymalizacji wydajności i zaleceń dotyczących kopiowania. Jeśli interesuje Cię to zachowanie, wyłącz tę funkcję.
Mapowanie
W przypadku konfiguracji karty Mapowanie przejdź do tematu Konfigurowanie mapowań na karcie mapowania.
Ustawienia
W przypadku konfiguracji karty Ustawienia przejdź do sekcji Konfigurowanie innych ustawień na karcie ustawienia.
Podsumowanie tabeli
Poniższe tabele zawierają więcej informacji na temat działania kopiowania w usłudze Azure Cosmos DB for NoSQL.
Tabela źródłowa
Nazwa/nazwisko | Opis | Wartość | Wymagania | Właściwość skryptu JSON |
---|---|---|---|---|
Typ magazynu danych | Typ magazynu danych. | Zewnętrzne | Tak | / |
Połączenie | Połączenie ze źródłowym magazynem danych. | <połączenie> | Tak | połączenie |
Kontener | Kontener danych źródłowych. | <kontener źródła> | Tak | Kontenera fileName |
Korzystanie z zapytania | Możesz wybrać tabelę lub kwerendę jako zapytanie używane. | • Tabela • Kwerenda |
Nie. | type |
Rozmiar strony | Liczba dokumentów na stronę wyniku zapytania. Wartość domyślna to "-1", co oznacza użycie dynamicznego rozmiaru strony po stronie usługi do 1000. | <rozmiar strony> | Nie. | Pagesize |
Usuwanie daty/godziny | Pliki w źródłowym magazynie danych zostaną usunięte bezpośrednio po przeniesieniu do magazynu docelowego. Usunięcie pliku jest na plik, więc gdy działanie kopiowania zakończy się niepowodzeniem, zauważysz, że niektóre pliki zostały już skopiowane do miejsca docelowego i usunięte ze źródła, podczas gdy inne są nadal w magazynie źródłowym. | Zaznaczone lub usuń zaznaczenie | Nie. | detectDatetime |
Preferowane regiony | Preferowana lista regionów do nawiązania połączenia podczas pobierania danych z usługi Azure Cosmos DB. Wybierz jeden preferowany region z listy rozwijanej po wybraniu pozycji Nowy. | <preferowane regiony> | Nie. | preferredRegions |
Dodatkowe kolumny | Dodaj dodatkowe kolumny danych, aby przechowywać ścieżkę względną plików źródłowych lub wartość statyczną. Wyrażenie jest obsługiwane w przypadku tych ostatnich. Aby uzyskać więcej informacji, zobacz Dodawanie dodatkowych kolumn podczas kopiowania. | <maksymalna liczba połączeń współbieżnych> | Nie. | additionalColumns |
Tabela docelowa
Nazwa/nazwisko | Opis | Wartość | Wymagania | Właściwość skryptu JSON |
---|---|---|---|---|
Typ magazynu danych | Typ magazynu danych. | Zewnętrzne | Tak | / |
Połączenie | Połączenie z docelowym magazynem danych. | <połączenie> | Tak | połączenie |
Kontener | Kontener danych docelowych. | <kontener źródła> | Tak | Kontenera fileName |
Zachowanie zapisu | Opisuje sposób zapisywania danych w usłudze Azure Cosmos DB. Dozwolone wartości: wstawianie i upsert. Zachowanie operacji upsert polega na zastąpieniu dokumentu, jeśli dokument o tym samym identyfikatorze już istnieje; w przeciwnym razie wstaw dokument. | • Dodawanie zawartości dynamicznej • Wstaw • Upsert |
Nie. | writeBehavior |
Limit czasu zapisu wsadowego | Czas oczekiwania na ukończenie operacji wstawiania wsadowego przed przekroczeniem limitu czasu. Dozwolone wartości to Przedział czasu. Przykładem jest 00:30:00 (30 minut). | zakres czasu | Nie. | writeBatchTimeout |
Rozmiar partii zapisu | Liczba wierszy do wstawiania do tabeli SQL na partię. Dozwolona wartość to liczba całkowita (liczba wierszy). Domyślnie usługa dynamicznie określa odpowiedni rozmiar partii na podstawie rozmiaru wiersza. | <liczba wierszy > (liczba całkowita) |
Nie. | writeBatchSize |
Maksymalna liczba połączeń współbieżnych | Górny limit połączeń współbieżnych ustanowionych z magazynem danych podczas uruchamiania działania. Określ wartość tylko wtedy, gdy chcesz ograniczyć połączenia współbieżne. | <maksymalna liczba połączeń współbieżnych> | Nie. | maxConcurrent Połączenie ions |
Wyłączanie analizy metryk wydajności | To ustawienie steruje kolekcją metryk, takich jak DTU, DWU, RU itd. w celu optymalizacji wydajności kopiowania i zaleceń. Jeśli interesuje Cię to zachowanie, wyłącz tę funkcję. | Zaznaczone lub usuń zaznaczenie | Nie. | disableMetricsCollection |