Soumettre un workflow à l’aide d’une entrée de fichier BAM
Cet article montre comment soumettre un workflow dans le service Microsoft Genomics si votre fichier d’entrée est un fichier BAM unique. Cette rubrique suppose que vous avez déjà installé et exécuté le client msgen
, et que vous savez comment utiliser Stockage Azure. Si vous avez correctement soumis un workflow à l’aide de l’exemple de données fourni, vous êtes prêt à appliquer la procédure décrite dans cet article.
Configurer : Télécharger votre fichier BAM vers Stockage Azure
Supposons que vous disposiez d’un fichier BAM unique, reads.bam, et que vous l’ayez chargé dans votre compte de stockage myaccount dans Azure, sous https://myaccount.blob.core.windows.net/inputs/reads.bam. Vous disposez de l’URL d’API et de votre clé d’accès. Vos sorties doivent être hébergées sous https://myaccount.blob.core.windows.net/outputs.
Envoyer votre tâche au client msgen
Voici le jeu minimal d’arguments qu’il vous faudra fournir au client msgen
; des sauts de ligne ont été ajoutés pour plus de clarté :
Pour Windows :
msgen submit ^
--api-url-base <Genomics API URL> ^
--access-key <Genomics access key> ^
--process-args R=b37m1 ^
--input-storage-account-name myaccount ^
--input-storage-account-key <storage access key to "myaccount"> ^
--input-storage-account-container inputs ^
--input-blob-name-1 reads.bam ^
--output-storage-account-name myaccount ^
--output-storage-account-key <storage access key to "myaccount"> ^
--output-storage-account-container outputs
Pour Unix :
msgen submit \
--api-url-base <Genomics API URL> \
--access-key <Genomics access key> \
--process-args R=b37m1 \
--input-storage-account-name myaccount \
--input-storage-account-key <storage access key to "myaccount"> \
--input-storage-account-container inputs \
--input-blob-name-1 reads.bam \
--output-storage-account-name myaccount \
--output-storage-account-key <storage access key to "myaccount"> \
--output-storage-account-container outputs
Si vous préférez utiliser un fichier de configuration, voici à quoi il doit ressembler :
api_url_base: <Genomics API URL>
access_key: <Genomics access key>
process_args: R=b37m1
input_storage_account_name: myaccount
input_storage_account_key: <storage access key to "myaccount">
input_storage_account_container: inputs
input_blob_name_1: reads.bam
output_storage_account_name: myaccount
output_storage_account_key: <storage access key to "myaccount">
output_storage_account_container: outputs
Envoyez le fichier config.txt
avec cet appel : msgen submit -f config.txt
Étapes suivantes
Dans cet article, vous avez chargé un fichier BAM dans Stockage Azure et envoyé un workflow au service Microsoft Genomics via le client Python msgen
. Pour plus d’informations sur la soumission du workflow et les autres commandes pouvant être utilisées avec le service Microsoft Genomics, consultez notre FAQ.