Comprendre la prise en charge linguistique dans Azure Data Factory

Effectué

Alors que la plupart des utilisateurs d’Azure Data Factory développent à l’aide de l’interface utilisateur, Azure Data Factory est disponible dans une variété de kits de développement logiciel (SDK) pour tous ceux qui souhaitent développer de manière programmatique. Lorsque vous utilisez un kit de développement logiciel (SDK), un utilisateur travaille directement sur le service Azure Data Factory et toutes les mises à jour sont immédiatement appliquées à la fabrique.

Il existe des bibliothèques Azure Data Factory pour Python qui vous permettent de bien gérer le service.

Vous pouvez installer le package suivant

pip install azure-mgmt-datafactory 

À partir de là, vous pouvez effectuer une série d'activités, comme la création d'Azure Data Factory dans votre abonnement sur la région USA Est, comme le montre le code suivant.

from azure.common.credentials import ServicePrincipalCredentials
from azure.mgmt.resource import ResourceManagementClient
from azure.mgmt.datafactory import DataFactoryManagementClient
from azure.mgmt.datafactory.models import *
import time

#Create a data factory
subscription_id = '<Specify your Azure Subscription ID>'
credentials = ServicePrincipalCredentials(client_id='<Active Directory application/client ID>', secret='<client secret>', tenant='<Active Directory tenant ID>')
adf_client = DataFactoryManagementClient(credentials, subscription_id)

rg_params = {'location':'eastus'}
df_params = {'location':'eastus'}  

df_resource = Factory(location='eastus')
df = adf_client.factories.create_or_update(rg_name, df_name, df_resource)
print_item(df)
while df.provisioning_state != 'Succeeded':
    df = adf_client.factories.get(rg_name, df_name)
    time.sleep(1)

En plus de Python, vous pouvez également interagir par programmation avec Azure Data Factory avec les autres langages et kits de développement logiciel (SDK) comme indiqué ci-dessous :

  • .NET
  • API REST
  • PowerShell
  • Modèles Azure Resource Manager
  • Scripts de flux de données

Le script de flux de données (DFS) est constitué des métadonnées sous-jacentes, similaires à un langage de codage, qui sont utilisées pour exécuter les transformations incluses dans un flux de données de mappage. Chaque transformation est représentée par une série de propriétés qui fournissent les informations nécessaires à l’exécution correcte du travail. Le script est visible et modifiable à partir de ADF en cliquant sur le bouton « script » sur le ruban supérieur de l’interface utilisateur du navigateur.