Partager via


Obtenir des données de OneLake

Dans cet article, vous apprendrez comment obtenir des données de OneLake dans un tableau nouveau ou existant.

Prérequis

Copier le chemin du fichier à partir de Lakehouse

  1. Dans le sélecteur d'expérience, choisissez Ingénieurs de données.

  2. Sélectionnez l'environnement Lakehouse contenant la source de données que vous souhaitez utiliser.

  3. Placez votre curseur sur le fichier souhaité et sélectionnez le menu Plus, puis sélectionnez Propriétés.

    Important

    • Les chemins d’accès au dossier ne sont pas pris en charge.
    • Les caractères génériques (*) ne sont pas pris en charge.

    Capture d'écran du menu déroulant d'un fichier Lakehouse. L'option intitulée Propriétés est mise en surbrillance.

  4. Sous URL, sélectionnez l'icône Copier dans le presse-papiers et enregistrez-la quelque part pour la récupérer ultérieurement.

    Capture d'écran du volet Propriétés d'un fichier Lakehouse. L'icône de copie à droite de l'URL du fichier est mise en surbrillance.

  5. Retournez dans votre espace de travail et sélectionnez une base de données KQL.

Source

  1. Dans le ruban inférieur de votre base de données KQL, sélectionnez Obtenir des données.

    Dans la fenêtre Obtenir des données, l’onglet Source est sélectionné.

  2. Sélectionnez la source de données dans la liste disponible. Dans cet exemple, vous ingérez des données à partir de OneLake.

    Capture d’écran de la fenêtre Obtenir des données avec l’onglet source sélectionné.

Configurer

  1. Sélectionner la table cible. Si vous souhaitez ingérer des données dans une nouvelle table, sélectionnez +Nouvelle table et entrez un nom de table.

    Remarque

    Les noms de tables peuvent comporter jusqu’à 1024 caractères, y compris des espaces, des caractères alphanumériques, des traits d’union et des traits de soulignement. Les caractères spéciaux ne sont pas pris en charge.

  2. Dans le fichier OneLake, collez le chemin du fichier du Lakehouse copié dans Copier le chemin du fichier depuis Lakehouse.

    Remarque

    Vous pouvez ajouter jusqu'à 10 éléments dont la taille non compressée ne dépasse pas 1 Go.

    Capture d’écran de la configuration de l’onglet avec la nouvelle table entrée et un chemin d’accès de fichier OneLake ajouté.

  3. Cliquez sur Suivant.

Inspecter

L’onglet Inspecter s’ouvre avec un aperçu des données.

Pour terminer le processus d’ingestion, sélectionnez Terminer.

Capture d’écran de l’onglet Inspecter.

Si vous le souhaitez :

Modifier les colonnes

Remarque

  • Pour les formats tabulaires (CSV, TSV, PSV), vous ne pouvez pas mapper deux fois une même colonne. Pour effectuer un mappage à une colonne existante, commencez par supprimer la nouvelle colonne.
  • Vous ne pouvez pas changer un type de colonne existant. Si vous essayez de mapper à une colonne avec un format différent, vous risquez de vous retrouver avec des colonnes vides.

Les modifications que vous pouvez apporter dans une table dépendent des paramètres suivants :

  • Si le type de la table est nouveau ou existant
  • Si le type du mappage est nouveau ou existant
Type de la table Type de mappage Ajustements disponibles
Nouvelle table Nouveau mappage Renommer une colonne, modifier le type de données, modifier la source de données, transformation de mappage, ajouter une colonne, supprimer une colonne
Table existante Nouveau mappage Ajoutez une colonne (vous pourrez ensuite modifier le type de données, la renommer ou la mettre à jour)
Table existante Mappage existant Aucune

Capture d’écran des colonnes ouvertes pour modification.

Mappage des transformations

Certains mappages de format de données (Parquet, JSON et Avro) prennent en charge des transformations simples au moment de l’ingestion. Pour appliquer des transformations de mappage, créez ou mettez à jour une colonne dans la fenêtre Modifier les colonnes.

Les transformations de mappage peuvent être effectuées sur une colonne de type string ou datetime, avec la source dont le type de données est int ou long. Les transformations de mappage prises en charge sont :

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

Options avancées basées sur le type de données

Tabulaire (CSV, TSV, PSV) :

  • Si vous ingérez des formats tabulaires dans une table existante, vous pouvez sélectionner Avancé>Conserver le schéma de table. Les données tabulaires n’incluent pas nécessairement les noms de colonnes utilisés pour mapper les données sources aux colonnes existantes. Quand cette option est activée, le mappage est effectué dans l’ordre et le schéma de la table reste le même. Si cette option est désactivée, des colonnes sont créées pour les données entrantes, quelle que soit la structure de données.

  • Pour utiliser la première ligne comme noms de colonnes, sélectionnez Avancé>La première ligne est l’en-tête de colonne.

    Capture d’écran des options CSV avancées.

JSON :

  • Pour déterminer la division de colonnes des données JSON, sélectionnez Avancé>Niveaux imbriqués, de 1 à 100.

  • Si vous sélectionnez Avancé>Ignorer les lignes contenant des erreurs, les données sont ingérées au format JSON. Si vous laissez cette case à cocher désactivée, les données sont ingérées au format multijson.

    Capture d’écran des options JSON avancées.

Résumé

Dans la fenêtre Préparation des données, les trois étapes sont signalées par des coches vertes quand l’ingestion des données s’est terminée avec succès. Vous pouvez sélectionner une carte à interroger, supprimer les données ingérées ou afficher un tableau de bord de votre résumé d’ingestion.

Capture d’écran de la page de résumé avec l’ingestion des données terminée avec succès.