Udostępnij za pośrednictwem


Kopiowanie z platformy Microsoft 365 (Office 365) na platformę Azure przy użyciu usługi Azure Data Factory lub Synapse Analytics

DOTYCZY: Azure Data Factory Azure Synapse Analytics

Napiwek

Wypróbuj usługę Data Factory w usłudze Microsoft Fabric — rozwiązanie analityczne typu all-in-one dla przedsiębiorstw. Usługa Microsoft Fabric obejmuje wszystko, od przenoszenia danych do nauki o danych, analizy w czasie rzeczywistym, analizy biznesowej i raportowania. Dowiedz się, jak bezpłatnie rozpocząć nową wersję próbną !

Potoki usługi Azure Data Factory i Synapse Analytics integrują się z połączeniem danych programu Microsoft Graph, co pozwala na korzystanie z zaawansowanych danych organizacji w dzierżawie usługi Microsoft 365 (Office 365) na platformie Azure w skalowalny sposób i tworzenie aplikacji analitycznych oraz wyodrębnianie szczegółowych informacji na podstawie tych cennych zasobów danych. Integracja z usługą Privileged Access Management zapewnia bezpieczną kontrolę dostępu dla cennych wyselekcjonowanych danych na platformie Microsoft 365 (Office 365). Zapoznaj się z tym linkiem, aby zapoznać się z omówieniem połączenia danych programu Microsoft Graph.

W tym artykule opisano sposób używania działania kopiowania do kopiowania danych i Przepływ danych do przekształcania danych z platformy Microsoft 365 (Office 365). Aby zapoznać się z wprowadzeniem do kopiowania danych, przeczytaj omówienie działania kopiowania. Aby zapoznać się z wprowadzeniem do przekształcania danych, przeczytaj omówienie przepływu mapowania danych.

Uwaga

Łącznik Przepływ danych platformy Microsoft 365 jest obecnie dostępny w wersji zapoznawczej. Aby wziąć udział, użyj tego formularza rejestracji: M365 + Analytics (wersja zapoznawcza).

Obsługiwane możliwości

Ten łącznik usługi Microsoft 365 (Office 365) jest obsługiwany dla następujących funkcji:

Obsługiwane możliwości IR
działanie Kopiuj (źródło/-) (1)
Przepływ danych mapowania (źródło/-) (1)

(1) Środowisko Azure Integration Runtime (2) Self-hosted Integration Runtime

Łącznik usługi Microsoft 365 (Office 365) usługi ADF i program Microsoft Graph Data Connect umożliwia pozyskiwanie różnych typów zestawów danych z skrzynek pocztowych z włączoną obsługą poczty e-mail programu Exchange, w tym kontaktów z książką adresową, zdarzeniami kalendarza, wiadomościami e-mail, informacjami o użytkownikach, ustawieniami skrzynki pocztowej itd. Zapoznaj się z pełną listą dostępnych zestawów danych.

Na razie w ramach jednego działania kopiowania i przepływu danych można pozyskiwać tylko dane z platformy Microsoft 365 (Office 365) do usługi Azure Blob Storage, Azure Data Lake Storage Gen1 i Azure Data Lake Storage Gen2 w formacie JSON (typ setOfObjects). Podczas kopiowania do usługi Azure Blob Storage dane wyjściowe są obiektem blob zawierającym tekst JSON. Jeśli chcesz załadować usługę Microsoft 365 (Office 365) do innych typów magazynów danych lub w innych formatach, możesz połączyć pierwsze działanie kopiowania lub przepływ danych z kolejnym działaniem, aby dodatkowo załadować dane do dowolnego z obsługiwanych magazynów docelowych usługi ADF (zobacz kolumnę "obsługiwane jako ujście" w tabeli "Obsługiwane magazyny danych i formaty").

Ważne

  • Subskrypcja platformy Azure zawierająca obszar roboczy fabryki danych lub usługi Synapse i magazyn danych ujścia musi znajdować się w tej samej dzierżawie firmy Microsoft Entra co dzierżawa usługi Microsoft 365 (Office 365).
  • Upewnij się, że region środowiska Azure Integration Runtime używany do działania kopiowania, a także miejsce docelowe znajduje się w tym samym regionie, w którym znajduje się skrzynka pocztowa użytkowników dzierżawy usługi Microsoft 365 (Office 365). Zapoznaj się z tym artykułem, aby dowiedzieć się, jak określana jest lokalizacja środowiska Azure IR. Zapoznaj się z tabelą tutaj, aby uzyskać listę obsługiwanych regionów pakietu Office i odpowiednich regionów świadczenia usługi Azure.
  • Uwierzytelnianie jednostki usługi to jedyny mechanizm uwierzytelniania obsługiwany dla usług Azure Blob Storage, Azure Data Lake Storage Gen1 i Azure Data Lake Storage Gen2 jako magazynów docelowych.

Uwaga

Użyj środowiska Azure Integration Runtime zarówno w usługach źródłowych, jak i połączonych ujścia. Własne środowisko Integration Runtime i zarządzane środowisko Integration Runtime sieci wirtualnej nie są obsługiwane.

Wymagania wstępne

Aby skopiować i przekształcić dane z platformy Microsoft 365 (Office 365) na platformę Azure, należy wykonać następujące czynności wstępne:

  • Administrator dzierżawy usługi Microsoft 365 (Office 365) musi wykonać akcje dołączania zgodnie z opisem tutaj.
  • Utwórz i skonfiguruj aplikację internetową Firmy Microsoft Entra w identyfikatorze Entra firmy Microsoft. Aby uzyskać instrukcje, zobacz Tworzenie aplikacji firmy Microsoft Entra.
  • Zanotuj następujące wartości, których używasz do definiowania połączonej usługi platformy Microsoft 365 (Office 365):
  • Dodaj tożsamość użytkownika, która wysyła żądanie dostępu do danych jako właściciel aplikacji internetowej Microsoft Entra (z witryny Microsoft Entra Web > Application Settings > Owner > Add owner).
    • Tożsamość użytkownika musi znajdować się w organizacji usługi Microsoft 365 (Office 365), z której uzyskujesz dane i nie może być użytkownikiem-gościem.

Zatwierdzanie nowych żądań dostępu do danych

Jeśli po raz pierwszy żądasz danych dla tego kontekstu (kombinacja, do której tabeli danych jest dostęp, do którego konta docelowego są ładowane dane i do którego tożsamości użytkownika jest żądanie dostępu do danych), zobaczysz stan działania kopiowania jako "W toku", a dopiero po kliknięciu linku "Szczegóły" w obszarze Akcje zobaczysz stan "RequestingConsent". Przed kontynuowaniem wyodrębniania danych członek grupy osoby zatwierdzającej dostęp do danych musi zatwierdzić żądanie w usłudze Privileged Access Management.

Zapoznaj się z tym , jak osoba zatwierdzająca może zatwierdzić żądanie dostępu do danych.

Wprowadzenie

Napiwek

Aby zapoznać się z przewodnikiem dotyczącym korzystania z łącznika usługi Microsoft 365 (Office 365), zobacz Artykuł Load data from Microsoft 365 (Office 365) (Ładowanie danych z usługi Microsoft 365 (Office 365).

Potok można utworzyć za pomocą działania kopiowania i przepływu danych przy użyciu jednego z następujących narzędzi lub zestawów SDK. Wybierz link, aby przejść do samouczka z instrukcjami krok po kroku dotyczącymi tworzenia potoku z działaniem kopiowania.

Tworzenie połączonej usługi z usługą Microsoft 365 (Office 365) przy użyciu interfejsu użytkownika

Wykonaj poniższe kroki, aby utworzyć połączoną usługę platformy Microsoft 365 (Office 365) w interfejsie użytkownika witryny Azure Portal.

  1. Przejdź do karty Zarządzanie w obszarze roboczym usługi Azure Data Factory lub Synapse i wybierz pozycję Połączone usługi, a następnie kliknij pozycję Nowy:

  2. Wyszukaj usługę Microsoft 365 (Office 365) i wybierz łącznik usługi Microsoft 365 (Office 365).

    Zrzut ekranu przedstawiający łącznik usługi Microsoft 365 (Office 365).

  3. Skonfiguruj szczegóły usługi, przetestuj połączenie i utwórz nową połączoną usługę.

    Zrzut ekranu przedstawiający połączoną konfigurację usługi dla platformy Microsoft 365 (Office 365).

Szczegóły konfiguracji łącznika

Poniższe sekcje zawierają szczegółowe informacje o właściwościach używanych do definiowania jednostek usługi Data Factory specyficznych dla łącznika usługi Microsoft 365 (Office 365).

Właściwości połączonej usługi

Następujące właściwości są obsługiwane w przypadku połączonej usługi Microsoft 365 (Office 365):

Właściwości Opis Wymagania
type Właściwość type musi być ustawiona na: Office365 Tak
office365TenantId Identyfikator dzierżawy platformy Azure, do którego należy konto platformy Microsoft 365 (Office 365). Tak
servicePrincipalTenantId Określ informacje o dzierżawie, w których znajduje się aplikacja internetowa Firmy Microsoft Entra. Tak
servicePrincipalId Określ identyfikator klienta aplikacji. Tak
servicePrincipalKey Określ klucz aplikacji. Oznacz to pole jako element SecureString, aby przechowywać je bezpiecznie. Tak
connectVia Środowisko Integration Runtime do nawiązania połączenia z magazynem danych. Jeśli nie zostanie określony, używa domyślnego środowiska Azure Integration Runtime. Nie.

Uwaga

Różnica między office365TenantId i servicePrincipalTenantId i odpowiadającą wartością, która ma dostarczyć:

  • Jeśli jesteś deweloperem przedsiębiorstwa tworzącym aplikację na podstawie danych usługi Microsoft 365 (Office 365) dla użycia własnej organizacji, należy podać ten sam identyfikator dzierżawy dla obu właściwości, czyli identyfikator dzierżawy firmy Microsoft Entra organizacji.
  • Jeśli jesteś deweloperem niezależnego dostawcy oprogramowania tworzącym aplikację dla swoich klientów, identyfikator dzierżawy microsoft Entra firmy Microsoft będzie identyfikatorem dzierżawy firmy Microsoft (instalatorem aplikacji) i identyfikatorem dzierżawy servicePrincipalTenantId firmy będzie identyfikator dzierżawy firmy Microsoft Entra.

Przykład:

{
    "name": "Office365LinkedService",
    "properties": {
        "type": "Office365",
        "typeProperties": {
            "office365TenantId": "<Microsoft 365 (Office 365) tenant id>",
            "servicePrincipalTenantId": "<AAD app service principal tenant id>",
            "servicePrincipalId": "<AAD app service principal id>",
            "servicePrincipalKey": {
                "type": "SecureString",
                "value": "<AAD app service principal key>"
            }
        }
    }
}

Właściwości zestawu danych

Pełna lista sekcji i właściwości dostępnych do definiowania zestawów danych znajduje się w artykule dotyczącym zestawów danych. Ta sekcja zawiera listę właściwości obsługiwanych przez zestaw danych usługi Microsoft 365 (Office 365).

Aby skopiować dane z usługi Microsoft 365 (Office 365), obsługiwane są następujące właściwości:

Właściwości Opis Wymagania
type Właściwość type zestawu danych musi być ustawiona na: Office365Table Tak
tableName Nazwa zestawu danych do wyodrębnienia z platformy Microsoft 365 (Office 365). Zapoznaj się z listą zestawów danych platformy Microsoft 365 (Office 365) dostępnych do wyodrębniania. Tak

Jeśli ustawiono ustawienie dateFilterColumn, , endTimestartTimei userScopeFilterUri w zestawie danych, nadal jest ono obsługiwane w miarę działania, podczas gdy sugerowane jest użycie nowego modelu w źródle działań.

Przykład

{
    "name": "DS_May2019_O365_Message",
    "properties": {
        "type": "Office365Table",
        "linkedServiceName": {
            "referenceName": "<Microsoft 365 (Office 365) linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [],
        "typeProperties": {
            "tableName": "BasicDataSet_v0.Event_v1"
        }
    }
}

Właściwości działania kopiowania

Aby uzyskać pełną listę sekcji i właściwości dostępnych do definiowania działań, zobacz artykuł Pipelines (Potoki ). Ta sekcja zawiera listę właściwości obsługiwanych przez źródło usługi Microsoft 365 (Office 365).

Platforma Microsoft 365 (Office 365) jako źródło

Aby skopiować dane z usługi Microsoft 365 (Office 365), w sekcji źródła działania kopiowania są obsługiwane następujące właściwości:

Właściwości Opis Wymagania
type Właściwość type źródła działania kopiowania musi być ustawiona na: Office365Source Tak
allowedGroups Predykat zaznaczenia grupy. Użyj tej właściwości, aby wybrać maksymalnie 10 grup użytkowników, dla których zostaną pobrane dane. Jeśli nie określono żadnych grup, dane zostaną zwrócone dla całej organizacji. Nie.
userScopeFilterUri Jeśli allowedGroups właściwość nie zostanie określona, można użyć wyrażenia predykatu stosowanego w całej dzierżawie do filtrowania określonych wierszy w celu wyodrębnienia z platformy Microsoft 365 (Office 365). Format predykatu powinien być zgodny z formatem zapytania interfejsów API programu Microsoft Graph, np. https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance'. Nie.
dateFilterColumn Nazwa kolumny filtru DateTime. Użyj tej właściwości, aby ograniczyć zakres czasu, dla którego wyodrębnione są dane usługi Microsoft 365 (Office 365). Tak, jeśli zestaw danych ma co najmniej jedną kolumnę DateTime. Zapoznaj się z listą zestawów danych, które wymagają tego filtru DateTime.
startTime Rozpocznij wartość daty/godziny do filtrowania. Tak, jeśli dateFilterColumn określono
endTime Wartość daty/godziny zakończenia do filtrowania. Tak, jeśli dateFilterColumn określono
outputColumns Tablica kolumn do skopiowania do ujścia. Nie.

Przykład:

"activities": [
    {
        "name": "CopyFromO365ToBlob",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Microsoft 365 (Office 365) input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "Office365Source",
                "dateFilterColumn": "CreatedDateTime",
                "startTime": "2019-04-28T16:00:00.000Z",
                "endTime": "2019-05-05T16:00:00.000Z",
                "userScopeFilterUri": "https://graph.microsoft.com/v1.0/users?$filter=Department eq 'Finance'",
                "outputColumns": [
                    {
                        "name": "Id"
                    },
                    {
                        "name": "CreatedDateTime"
                    },
                    {
                        "name": "LastModifiedDateTime"
                    },
                    {
                        "name": "ChangeKey"
                    },
                    {
                        "name": "Categories"
                    },
                    {
                        "name": "OriginalStartTimeZone"
                    },
                    {
                        "name": "OriginalEndTimeZone"
                    },
                    {
                        "name": "ResponseStatus"
                    },
                    {
                        "name": "iCalUId"
                    },
                    {
                        "name": "ReminderMinutesBeforeStart"
                    },
                    {
                        "name": "IsReminderOn"
                    },
                    {
                        "name": "HasAttachments"
                    },
                    {
                        "name": "Subject"
                    },
                    {
                        "name": "Body"
                    },
                    {
                        "name": "Importance"
                    },
                    {
                        "name": "Sensitivity"
                    },
                    {
                        "name": "Start"
                    },
                    {
                        "name": "End"
                    },
                    {
                        "name": "Location"
                    },
                    {
                        "name": "IsAllDay"
                    },
                    {
                        "name": "IsCancelled"
                    },
                    {
                        "name": "IsOrganizer"
                    },
                    {
                        "name": "Recurrence"
                    },
                    {
                        "name": "ResponseRequested"
                    },
                    {
                        "name": "ShowAs"
                    },
                    {
                        "name": "Type"
                    },
                    {
                        "name": "Attendees"
                    },
                    {
                        "name": "Organizer"
                    },
                    {
                        "name": "WebLink"
                    },
                    {
                        "name": "Attachments"
                    },
                    {
                        "name": "BodyPreview"
                    },
                    {
                        "name": "Locations"
                    },
                    {
                        "name": "OnlineMeetingUrl"
                    },
                    {
                        "name": "OriginalStart"
                    },
                    {
                        "name": "SeriesMasterId"
                    }
                ]
            },
            "sink": {
                "type": "BlobSink"
            }
        }
    }
]

Aby uzyskać listę magazynów danych obsługiwanych jako źródła i ujścia działania kopiowania, zobacz obsługiwane magazyny danych.