Delen via


Smart Store Analytics uitbreiden

Gevorderde gebruikers van Smart Store Analytics hebben toegang tot relevante gegevens en analyses vanuit hun eigen data lake-opslag. De toegang kan via andere services of toepassingen zijn die Microsoft Azure Data Lake Storage en Common Data Model-definitie ondersteunen, bijvoorbeeld Microsoft Azure Synapse Analytics, Microsoft Azure Data Factory of Microsoft Power BI.

Belangrijk

U moet Microsoft Azure Data Lake Storage Gen2 gebruiken, aangezien Microsoft Azure Data Lake Storage Gen1 niet compatibel is.

Het Smart Store Analytics-gegevensmodel voldoet aan Azure Synapse-databasesjablonen voor de detailhandel, is verbeterd met Smart Store Analytics-specificaties en vereenvoudigt de verbinding van andere toepassingen met de lake-gegevens.

Smart Store Analytics data lake-structuur

Smart Store Analytics data lake volgt de Common Data Model-definitie (Common Data Model-metagegevens).

De afbeelding toont de data lake-structuur voor Smart Store Analytics.

De hoofdmap heet smartstores/. Onder de hoofdmap bevinden zich twee momentopnamen van gegevens:

Gegevens getransformeerd van de smart store-provider (onbewerkte smart store-gegevens)

Het Common Data Model-hoofdmanifest voor de onbewerkte gegevens is root.manifest.cdm.json. Het manifestbestand verwijst naar de schemabestanden en daadwerkelijke gegevensbestanden in de submappen (genoemd naar de tabellen), bijvoorbeeld smartstores/Order/.

De submap van elke tabel bevat:

  • schemabestand, dat de metagegevens, kolommen en typen van de tabel definieert, in table-name.cdm.json indeling, bijvoorbeeld Order.cdm.json

  • gegevensbestanden, ook wel gegevenspartities of tabelrecords genoemd, in parquet-indeling, bijvoorbeeld Order-cec9368060a849b8aab7583b62b506eb-00001.parquet

Gegevens gegenereerd door de Retail Analytical- en AI-modules op basis van de onbewerkte smart store-gegevens

Alle gegenereerde gegevens bevinden zich in een GUID-map, bijvoorbeeld smartstores/14a7334b-7176-ed11-9985-00224804e0d0/. Het Common Data Model-hoofdmanifest voor deze gegevens is kpi.manifest.cdm.json. Het manifestbestand verwijst naar de schemabestanden en daadwerkelijke gegevensbestanden die zich in de GUID-map bevinden.

De GUID-map bevat:

  • Schemabestand voor elke tabel, dat tabelmetagegevens, kolommen en typen definieert, in table-name.cdm.json indeling, bijvoorbeeld OrderMetrics.cdm.json

  • Gegevensbestanden, ook wel gegevenspartities of tabelrecords genoemd, in parquet-indeling, bijvoorbeeld part-00000-1e110bf0-6474-400b-b40a-086fce9f8e2a-c000.snappy.parquet

Belangrijk

Volgens het Common Data Model-metagegevenscontract hebben gebruikers alleen gegevens nodig van de manifest.cdm.json bestanden. Ze hoeven de mappenstructuur of andere interne bestanden in de data lake niet te interpreteren.

Smart Store Analytics data lake-gebruik

Hier volgen enkele voorbeelden van gegevens die zijn gesynchroniseerd in analytische/AI Insights die zijn gegenereerd door Microsoft Cloud for Retail.

Gegevenspijplijn met Microsoft Azure Data Factory

Een gegevenspijplijn maken:

  1. Maak een Azure Data Factory-instantie en koppel deze aan de Smart Store Analytics data lake-opslag. U moet een gekoppelde service hebben met een succesvolle verbindingstest.

De afbeelding laat zien hoe u een gekoppelde Azure Data Factory-service maakt.

Notitie

De eenvoudigste manier om een Azure Data Factory-instantie te verbinden met Azure Data Lake Storage is een rol inzender toe te wijzen aan een door Azure Data Factory beheerde identiteit in het Azure Data Lake Storage-account. Zie Azure Data Factory-documentatie voor details.

  1. Selecteer Alles publiceren om de nieuwe koppeling te publiceren.

De afbeelding laat zien hoe u een gekoppelde Azure Data Factory-service publiceert.

Gegevenspijplijn maken met Microsoft Azure Data Factory

Om een kopieerpijplijn te maken voor de smartstores/-map als bron, voert u de volgende stappen uit:

  1. Selecteer in het gedeelte Auteur Nieuwe gegevensstroom om een nieuwe gegevensstroom te maken.

Afbeelding laat zien hoe u een nieuwe gegevensstroom maakt.

  1. Begin met foutopsporing voor een snellere controle van de pijplijnconfiguratie.

Afbeelding laat zien hoe u een gegevensstroom voor foutopsporing maakt.

  1. Configureer de broninstellingen als volgt:
  • Selecteer voor het brontype Inline

Afbeelding toont dat inline brontype is geselecteerd.

  • Selecteer voor Inline gegevenssettype de optie Common Data Model

Afbeelding toont common data model als inline bron.

  • Gebruik de Azure Data Lake Storage-koppeling die is gemaakt voor de data lake voor Smart Store Analytics.

Afbeelding toont gebruik van gekoppelde service voor data lake.

  1. Stel in de sectie Bronopties de Common Data Model-schemabron als volgt in:
  • Selecteer Manifest als metagegevensindeling.

Afbeelding toont het selecteren van manifest als metagegevensindeling.

  • Blader en selecteer op de hoofdlocatie de smartstores map.

  • Blader in de sectie Manifestbestand om het vereiste rootmanifest te selecteren. Selecteer het hoofdbestand voor de analytische en AI Insights-gegevens, kpi.manifest.cdm.json.

    Afbeelding toont het selecteren van het hoofdmanifestbestand

  • Selecteer in het gedeelte Entiteit de entiteit (tabel) die u wilt kopiĆ«ren/transformeren, bijvoorbeeld FBTproductAssociationsUI uit het pakket Veel samen gekocht.

Afbeelding toont het selecteren van het pakket Veel samen gekocht.

  1. Selecteer op het tabblad Projectie Schemadrift toestaan. Deze selectie zorgt ervoor dat het schema niet bij de bron wordt gevalideerd, maar naar andere transformatie-/sink-stappen gaat.

Afbeelding laat zien dat schemadrift is toegestaan.

  1. Selecteer op het tabblad Gegevensvoorbeeld Opnieuw laden om de setup van de gegevensbron te valideren.

Afbeelding toont het valideren van de gegevensbron.

  1. Voeg een sink-stap toe: stel de parameters en gegevenstoewijzing naar behoefte in voor uw scenario.

  2. Selecteer Publiceren om de wijzigingen te publiceren.