Microsoft Genomics で FASTQ ファイルの入力を使用してワークフローを送信する
この記事では、入力ファイルが一組の FASTQ ファイルである場合に、Microsoft Genomics サービスにワークフローを送信する方法を示します。 このトピックでは、msgen
クライアントを既にインストールして実行していること、また、Azure Storage の使用方法をよく理解していることを前提とします。 提供されたサンプル データを使用してワークフローを正常に送信したら、この記事を読み進める準備は完了です。
設定: Azure Storage に FASTQ ファイルをアップロードする
reads_1.fq.gz および reads_2.fq.gz という 2 つのファイルを保持しており、それらを Azure にあるお使いのストレージ アカウント myaccount に https://myaccount.blob.core.windows.net/inputs/reads_1.fq.gz および https://myaccount.blob.core.windows.net/inputs/reads_2.fq.gz としてアップロード済みであることを前提としましょう。 API URL とアクセス キーは用意されています。 また、https://myaccount.blob.core.windows.net/outputs に出力を配置したいと考えています。
ジョブを msgen
クライアントに送信する
msgen
クライアントに提供する必要がある最低限の引数セットを以下に示します (改行は、わかりやすくするために追加されています)。
Windows の場合:
msgen submit ^
--api-url-base <Genomics API URL> ^
--access-key <Genomics access key> ^
--process-args R=b37m1 ^
--input-storage-account-name myaccount ^
--input-storage-account-key <storage access key to "myaccount"> ^
--input-storage-account-container inputs ^
--input-blob-name-1 reads_1.fq.gz ^
--input-blob-name-2 reads_2.fq.gz ^
--output-storage-account-name myaccount ^
--output-storage-account-key <storage access key to "myaccount"> ^
--output-storage-account-container outputs
Unix の場合:
msgen submit \
--api-url-base <Genomics API URL> \
--access-key <Genomics access key> \
--process-args R=b37m1 \
--input-storage-account-name myaccount \
--input-storage-account-key <storage access key to "myaccount"> \
--input-storage-account-container inputs \
--input-blob-name-1 reads_1.fq.gz \
--input-blob-name-2 reads_2.fq.gz \
--output-storage-account-name myaccount \
--output-storage-account-key <storage access key to "myaccount"> \
--output-storage-account-container outputs
構成ファイルの使用を好む場合、構成ファイルには以下の項目が含まれます。
api_url_base: <Genomics API URL>
access_key: <Genomics access key>
process_args: R=b37m1
input_storage_account_name: myaccount
input_storage_account_key: <storage access key to "myaccount">
input_storage_account_container: inputs
input_blob_name_1: reads_1.fq.gz
input_blob_name_2: reads_2.fq.gz
output_storage_account_name: myaccount
output_storage_account_key: <storage access key to "myaccount">
output_storage_account_container: outputs
msgen submit -f config.txt
という呼び出しを使って、config.txt
ファイルを送信します。
次のステップ
この記事では、一組の FASTQ ファイルを Azure Storage にアップロードして、msgen
Python クライアント経由で Microsoft Genomics サービスにワークフローを送信しました。 ワークフローの送信と Microsoft Genomics サービスで使用できるその他のコマンド関連の詳細については、FAQ に関するページを参照してください。