Udostępnij za pośrednictwem


Kopiowanie danych z Vertica przy użyciu usługi Azure Data Factory lub Synapse Analytics

DOTYCZY: Azure Data Factory Azure Synapse Analytics

Napiwek

Wypróbuj usługę Data Factory w usłudze Microsoft Fabric — rozwiązanie analityczne typu all-in-one dla przedsiębiorstw. Usługa Microsoft Fabric obejmuje wszystko, od przenoszenia danych do nauki o danych, analizy w czasie rzeczywistym, analizy biznesowej i raportowania. Dowiedz się, jak bezpłatnie rozpocząć nową wersję próbną !

W tym artykule opisano sposób używania działania kopiowania w potoku usługi Azure Data Factory lub Synapse Analytics do kopiowania danych z Vertica. Jest on oparty na artykule omówienie działania kopiowania, który przedstawia ogólne omówienie działania kopiowania.

Obsługiwane możliwości

Ten łącznik Vertica jest obsługiwany w przypadku następujących możliwości:

Obsługiwane możliwości IR
działanie Kopiuj (źródło/-) (1) (tylko w wersji 1.0) (2)
Działanie Lookup (1) (tylko w wersji 1.0) (2)

(1) Środowisko Azure Integration Runtime (2) Self-hosted Integration Runtime

Aby uzyskać listę magazynów danych obsługiwanych jako źródła/ujścia przez działanie kopiowania, zobacz tabelę Obsługiwane magazyny danych.

Usługa udostępnia wbudowany sterownik umożliwiający łączność, dlatego nie trzeba ręcznie instalować żadnego sterownika przy użyciu tego łącznika.

W wersji 2.0 (wersja zapoznawcza) należy ręcznie zainstalować sterownik Vertica ODBC. W wersji 1.0 usługa udostępnia wbudowany sterownik umożliwiający łączność, dlatego nie trzeba ręcznie instalować żadnego sterownika.

Wymagania wstępne

Jeśli magazyn danych znajduje się wewnątrz sieci lokalnej, sieci wirtualnej platformy Azure lub chmury prywatnej Amazon Virtual, musisz skonfigurować własne środowisko Integration Runtime , aby się z nim połączyć. Jeśli używasz wersji 2.0 (wersja zapoznawcza), własne środowisko Integration Runtime powinno mieć wersję 5.44.8984.1 lub nowszą.

Aby uzyskać więcej informacji na temat mechanizmów zabezpieczeń sieci i opcji obsługiwanych przez usługę Data Factory, zobacz Strategie dostępu do danych.

Dla wersji 1.0

Jeśli magazyn danych jest zarządzaną usługą danych w chmurze, możesz użyć środowiska Azure Integration Runtime. Jeśli dostęp jest ograniczony do adresów IP zatwierdzonych w regułach zapory, możesz dodać adresy IP środowiska Azure Integration Runtime do listy dozwolonych.

Możesz również użyć funkcji środowiska Integration Runtime zarządzanej sieci wirtualnej w usłudze Azure Data Factory, aby uzyskać dostęp do sieci lokalnej bez instalowania i konfigurowania własnego środowiska Integration Runtime.

Zainstaluj sterownik Vertica ODBC dla wersji 2.0 (wersja zapoznawcza)

Aby użyć łącznika Vertica w wersji 2.0 (wersja zapoznawcza), zainstaluj sterownik Vertica ODBC na maszynie z uruchomionym własnym środowiskiem Integration Runtime, wykonując następujące kroki:

  1. Pobierz konfigurację klienta Vertica dla sterownika ODBC ze sterowników klienta | OpenText™ Vertica™. Weź pod uwagę konfigurację systemu Windows jako przykład:

    Zrzut ekranu przedstawiający przykład konfiguracji systemu Windows.

  2. Otwórz pobrany .exe, aby rozpocząć proces instalacji. 

    Zrzut ekranu przedstawiający proces instalacji.

  3. Wybierz pozycję Sterownik ODBC w obszarze Lista składników Vertica, a następnie wybierz przycisk Dalej , aby rozpocząć instalację.

    Zrzut ekranu przedstawiający wybieranie sterownika ODBC.

  4. Po pomyślnym zakończeniu procesu instalacji możesz przejść do pozycji Start —> administrator źródła danych ODBC, aby potwierdzić pomyślną instalację.

    Zrzut ekranu przedstawiający potwierdzenie pomyślnej instalacji.

Wprowadzenie

Potok można utworzyć z działaniem kopiowania przy użyciu zestawu .NET SDK, zestawu PYTHON SDK, programu Azure PowerShell, interfejsu API REST lub szablonu usługi Azure Resource Manager. Zobacz samouczek działanie Kopiuj, aby uzyskać instrukcje krok po kroku dotyczące tworzenia potoku z działaniem kopiowania.

Tworzenie połączonej usługi z vertica przy użyciu interfejsu użytkownika

Wykonaj poniższe kroki, aby utworzyć połączoną usługę z Vertica w interfejsie użytkownika witryny Azure Portal.

  1. Przejdź do karty Zarządzanie w obszarze roboczym usługi Azure Data Factory lub Synapse i wybierz pozycję Połączone usługi, a następnie kliknij pozycję Nowy:

  2. Wyszukaj pozycję Vertica i wybierz łącznik Vertica.

    Zrzut ekranu przedstawiający łącznik Vertica.

  3. Skonfiguruj szczegóły usługi, przetestuj połączenie i utwórz nową połączoną usługę.

    Zrzut ekranu przedstawiający połączoną konfigurację usługi dla Vertica.

Szczegóły konfiguracji łącznika

Poniższe sekcje zawierają szczegółowe informacje o właściwościach używanych do definiowania jednostek usługi Data Factory specyficznych dla łącznika Vertica.

Właściwości połączonej usługi

Jeśli używasz wersji 2.0 (wersja zapoznawcza), następujące właściwości są obsługiwane dla połączonej usługi Vertica:

Właściwości Opis Wymagania
type Właściwość type musi być ustawiona na: Vertica Tak
serwer Nazwa lub adres IP serwera, z którym chcesz nawiązać połączenie. Tak
port Numer portu odbiornika serwera. Nie, wartość domyślna to 5433
database Nazwa bazy danych Vertica. Tak
Identyfikator UID Identyfikator użytkownika używany do nawiązywania połączenia z bazą danych. Tak
Pwd Hasło używane przez aplikację do nawiązywania połączenia z bazą danych. Tak
version Wersja po wybraniu wersji 2.0 (wersja zapoznawcza). Wartość to 2.0. Tak
connectVia Środowisko Integration Runtime do nawiązania połączenia z magazynem danych. Dowiedz się więcej w sekcji Wymagania wstępne . Możesz używać tylko własnego środowiska Integration Runtime, a jego wersja powinna mieć wartość 5.44.8984.1 lub nowszą. Nie.

Przykład:

{
    "name": "VerticaLinkedService",
    "properties": {
        "type": "Vertica",
        "version": "2.0",
        "typeProperties": {
            "server": "<server>",
            "port": 5433,
            "uid": "<username>",
            "database": "<database>",
            "pwd": {
                "type": "SecureString",
                "value": "<password>"
             }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Przykład: przechowywanie hasła w usłudze Azure Key Vault

{
    "name": "VerticaLinkedService",
    "properties": {
        "type": "Vertica",
        "version": "2.0",
        "typeProperties": {
            "server": "<server>",
            "port": 5433,
            "uid": "<username>",
            "database": "<database>",
            "pwd": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Jeśli używasz wersji 1.0, obsługiwane są następujące właściwości:

Właściwości Opis Wymagania
type Właściwość type musi być ustawiona na: Vertica Tak
Parametry połączenia Parametry połączenia ODBC, aby nawiązać połączenie z Vertica.
Możesz również umieścić hasło w usłudze Azure Key Vault i ściągnąć konfigurację pwd z parametry połączenia. Zapoznaj się z poniższymi przykładami i artykułem Store credentials in Azure Key Vault (Przechowywanie poświadczeń w usłudze Azure Key Vault ), aby uzyskać więcej szczegółów.
Tak
connectVia Środowisko Integration Runtime do nawiązania połączenia z magazynem danych. Dowiedz się więcej w sekcji Wymagania wstępne . Jeśli nie zostanie określony, używa domyślnego środowiska Azure Integration Runtime. Nie.

Przykład:

{
    "name": "VerticaLinkedService",
    "properties": {
        "type": "Vertica",
        "typeProperties": {
            "connectionString": "Server=<server>;Port=<port>;Database=<database>;UID=<user name>;PWD=<password>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Właściwości zestawu danych

Pełna lista sekcji i właściwości dostępnych do definiowania zestawów danych znajduje się w artykule dotyczącym zestawów danych. Ta sekcja zawiera listę właściwości obsługiwanych przez zestaw danych Vertica.

Aby skopiować dane z Vertica, ustaw właściwość type zestawu danych na VerticaTable. Obsługiwane są następujące właściwości:

Właściwości Opis Wymagania
type Właściwość type zestawu danych musi być ustawiona na: VerticaTable Tak
schema Nazwa schematu. Nie (jeśli określono "zapytanie" w źródle działania)
table Nazwa tabeli. Nie (jeśli określono "zapytanie" w źródle działania)

Przykład

{
    "name": "VerticaDataset",
    "properties": {
        "type": "VerticaTable",
        "typeProperties": {},
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Vertica linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

Właściwości działania kopiowania

Aby uzyskać pełną listę sekcji i właściwości dostępnych do definiowania działań, zobacz artykuł Pipelines (Potoki ). Ta sekcja zawiera listę właściwości obsługiwanych przez źródło Vertica.

Vertica jako źródło

Aby skopiować dane z Vertica, ustaw typ źródła w działaniu kopiowania na VerticaSource. Następujące właściwości są obsługiwane w sekcji źródło działania kopiowania:

Właściwości Opis Wymagania
type Właściwość type źródła działania kopiowania musi być ustawiona na: VerticaSource Tak
zapytanie Użyj niestandardowego zapytania SQL, aby odczytać dane. Na przykład: "SELECT * FROM MyTable". Nie (jeśli określono wartość "schema+table" w zestawie danych)

Przykład:

"activities":[
    {
        "name": "CopyFromVertica",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Vertica input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "VerticaSource",
                "query": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Właściwości działania wyszukiwania

Aby dowiedzieć się więcej o właściwościach, sprawdź działanie Wyszukiwania.

Uaktualnianie wersji Vertica

Poniżej przedstawiono kroki ułatwiające uaktualnienie wersji Vertica:

  1. Zainstaluj sterownik Vertica ODBC, wykonując kroki opisane w temacie Wymagania wstępne.
  2. Na stronie Edytowanie połączonej usługi wybierz pozycję 2.0 (wersja zapoznawcza) w obszarze Wersja i skonfiguruj połączoną usługę, odwołując się do właściwości połączonej usługi.
  3. Zastosuj własne środowisko Integration Runtime w wersji 5.44.8984.1 lub nowszej. Środowisko Azure Integration Runtime nie jest obsługiwane przez wersję 2.0 (wersja zapoznawcza).

Aby uzyskać listę magazynów danych obsługiwanych jako źródła i ujścia działania kopiowania, zobacz obsługiwane magazyny danych.