你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
使用 Microsoft 基因组学中的 FASTQ 文件输入提交工作流
本文演示了在输入文件为一对 FASTQ 文件的情况下,如何将工作流提交到 Microsoft 基因组学服务。 本主题假设你已安装并运行 msgen
客户端,且熟悉如何使用 Azure 存储。 如果你已成功使用所提供的示例数据提交工作流,即可开始学习本教程。
设置:将 FASTQ 文件上传到 Azure 存储
假设你有两个文件:reads_1.fq.gz 和 reads_2.fq.gz 并已将其上传到 Azure 中的存储帐户 myaccount,其形式为 https://myaccount.blob.core.windows.net/inputs/reads_1.fq.gz 和 https://myaccount.blob.core.windows.net/inputs/reads_2.fq.gz。 你有 API URL 和访问密钥。 你希望将输出置于 https://myaccount.blob.core.windows.net/outputs 中。
将作业提交到 msgen
客户端
下面是需提供给 msgen
客户端的最小参数集;为清楚起见,添加了换行符:
对于 Windows:
msgen submit ^
--api-url-base <Genomics API URL> ^
--access-key <Genomics access key> ^
--process-args R=b37m1 ^
--input-storage-account-name myaccount ^
--input-storage-account-key <storage access key to "myaccount"> ^
--input-storage-account-container inputs ^
--input-blob-name-1 reads_1.fq.gz ^
--input-blob-name-2 reads_2.fq.gz ^
--output-storage-account-name myaccount ^
--output-storage-account-key <storage access key to "myaccount"> ^
--output-storage-account-container outputs
对于 Unix:
msgen submit \
--api-url-base <Genomics API URL> \
--access-key <Genomics access key> \
--process-args R=b37m1 \
--input-storage-account-name myaccount \
--input-storage-account-key <storage access key to "myaccount"> \
--input-storage-account-container inputs \
--input-blob-name-1 reads_1.fq.gz \
--input-blob-name-2 reads_2.fq.gz \
--output-storage-account-name myaccount \
--output-storage-account-key <storage access key to "myaccount"> \
--output-storage-account-container outputs
如果愿意使用配置文件,可以参考以下示例,其中包含:
api_url_base: <Genomics API URL>
access_key: <Genomics access key>
process_args: R=b37m1
input_storage_account_name: myaccount
input_storage_account_key: <storage access key to "myaccount">
input_storage_account_container: inputs
input_blob_name_1: reads_1.fq.gz
input_blob_name_2: reads_2.fq.gz
output_storage_account_name: myaccount
output_storage_account_key: <storage access key to "myaccount">
output_storage_account_container: outputs
提交 config.txt
文件时可以使用此调用:msgen submit -f config.txt
后续步骤
本文介绍了如何将一对 FASTQ 文件上传到 Azure 存储中,以及如何通过 msgen
Python 客户端将工作流提交到 Microsoft 基因组学服务。 若要详细了解工作流提交以及其他可以与 Microsoft 基因组学服务配合使用的命令,请参阅常见问题解答。