次の方法で共有


BAM ファイルの入力を使用したワークフローの送信

この記事では、入力ファイルが単一の BAM ファイルである場合に、Microsoft Genomics サービスにワークフローを送信する方法を示します。 このトピックでは、msgen クライアントを既にインストールして実行していること、また、Azure Storage の使用方法をよく理解していることを前提とします。 提供されたサンプル データを使用してワークフローを正常に送信したら、この記事を読み進める準備は完了です。

設定: Azure Storage に BAM ファイルをアップロードする

単一の BAM ファイル reads.bam を保持しており、これを Azure にあるお使いのストレージ アカウント myaccounthttps://myaccount.blob.core.windows.net/inputs/reads.bamとしてアップロード済みであることを前提としましょう。 API URL とアクセス キーは用意されています。 また、https://myaccount.blob.core.windows.net/outputs に出力を配置したいと考えています。

ジョブを msgen クライアントに送信する

msgen クライアントに提供する必要がある最低限の引数セットを以下に示します (改行は、わかりやすくするために追加されています)。

Windows の場合:

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads.bam ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

Unix の場合:

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads.bam \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

構成ファイルの使用を好む場合、構成ファイルには以下の項目が含まれます。

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads.bam
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

msgen submit -f config.txt という呼び出しを使って、config.txt ファイルを送信します。

次のステップ

この記事では、BAM ファイルを Azure Storage にアップロードして、msgen Python クライアント経由で Microsoft Genomics サービスにワークフローを送信しました。 ワークフローの送信と Microsoft Genomics サービスで使用できるその他のコマンド関連の詳細情報については、FAQ に関するページをご覧ください。