다음을 통해 공유


Microsoft Genomics에서 FASTQ 파일 입력을 사용하여 워크플로 제출

이 문서에서는 입력 파일이 하나의 쌍으로 연결된 FASTQ 파일인 경우 Microsoft Genomics 서비스에 워크플로를 제출하는 방법을 보여 줍니다. 이 항목에서는 사용자가 이미 msgen 클라이언트를 설치하여 실행하고 있으며 Azure Storage 사용 방법에 익숙하다고 가정합니다. 제공된 샘플 데이터를 사용하여 워크플로를 성공적으로 제출한 경우 이 문서를 진행할 준비가 된 것입니다.

설정: FASTQ 파일을 Azure Storage에 업로드합니다.

두 개의 파일(reads_1.fq.gzreads_2.fq.gz)이 있고, Azure의 개인 스토리지 계정인 myaccount(https://myaccount.blob.core.windows.net/inputs/reads_1.fq.gzhttps://myaccount.blob.core.windows.net/inputs/reads_2.fq.gz)에 파일을 업로드했다고 가정해보겠습니다. API URL과 액세스 키를 보유하고 있습니다. https://myaccount.blob.core.windows.net/outputs에 출력하려 합니다.

msgen 클라이언트에게 작업을 제출합니다.

다음은 msgen 클라이언트에게 제공해야 하는 최소한의 인수 집합입니다. 쉽게 알 수 있도록 줄 바꿈이 추가되었습니다.

Windows의 경우:

msgen submit ^
  --api-url-base <Genomics API URL> ^
  --access-key <Genomics access key> ^
  --process-args R=b37m1 ^
  --input-storage-account-name myaccount ^
  --input-storage-account-key <storage access key to "myaccount"> ^
  --input-storage-account-container inputs ^
  --input-blob-name-1 reads_1.fq.gz ^
  --input-blob-name-2 reads_2.fq.gz ^
  --output-storage-account-name myaccount ^
  --output-storage-account-key <storage access key to "myaccount"> ^
  --output-storage-account-container outputs

Unix의 경우:

msgen submit \
  --api-url-base <Genomics API URL> \
  --access-key <Genomics access key> \
  --process-args R=b37m1 \
  --input-storage-account-name myaccount \
  --input-storage-account-key <storage access key to "myaccount"> \
  --input-storage-account-container inputs \
  --input-blob-name-1 reads_1.fq.gz \
  --input-blob-name-2 reads_2.fq.gz \
  --output-storage-account-name myaccount \
  --output-storage-account-key <storage access key to "myaccount"> \
  --output-storage-account-container outputs

구성 파일 사용을 선호하는 경우 다음 내용이 포함됩니다.

api_url_base:                     <Genomics API URL>
access_key:                       <Genomics access key>
process_args:                     R=b37m1
input_storage_account_name:       myaccount
input_storage_account_key:        <storage access key to "myaccount">
input_storage_account_container:  inputs
input_blob_name_1:                reads_1.fq.gz
input_blob_name_2:                reads_2.fq.gz
output_storage_account_name:      myaccount
output_storage_account_key:       <storage access key to "myaccount">
output_storage_account_container: outputs

이 호출로 config.txt 파일 제출: msgen submit -f config.txt

다음 단계

이 문서에서는 Azure Storage에 한 쌍의 FASTQ 파일을 업로드했고 msgen Python 클라이언트를 통해 워크플로를 Microsoft Genomics 서비스에 제출했습니다. Microsoft Genomics 서비스에서 사용할 수 있는 워크플로 제출 및 기타 명령에 대한 자세한 내용은 FAQ를 참조하세요.