Partilhar via


Guia de resolução de problemas

Aqui estão algumas dicas de solução de problemas para alguns dos problemas comuns que você pode enfrentar ao usar o serviço Microsoft Genomics, MSGEN.

Para perguntas frequentes, não relacionadas à solução de problemas, consulte Perguntas comuns.

Etapa 1: Localizar códigos de erro associados ao fluxo de trabalho

Você pode localizar as mensagens de erro associadas ao fluxo de trabalho:

  1. Usando a linha de comando e digitando msgen status
  2. Examinando o conteúdo de standardoutput.txt.

1. Usando a linha de comando msgen status

msgen status -u URL -k KEY -w ID

Há três argumentos necessários:

  • URL - o URI base para a API

  • KEY - a chave de acesso para a sua conta Genomics

    • Para encontrar o URL e a CHAVE, aceda ao portal do Azure e abra a página da sua conta Microsoft Genomics. No título Gerenciamento, escolha Teclas de acesso. Lá, você encontra o URL da API e suas chaves de acesso.
  • ID - o ID do fluxo de trabalho

    • Para localizar o ID do fluxo de trabalho, digite o msgen list comando. Supondo que seu arquivo de configuração contenha a URL e suas chaves de acesso e esteja localizado no mesmo local que seu exe msgen, o comando terá esta aparência:

      msgen list -f "config.txt"
      

      A saída deste comando terá esta aparência:

          Microsoft Genomics command-line client v0.7.4
              Copyright (c) 2018 Microsoft. All rights reserved.
      
              Workflow List
              -------------
              Total Count  : 1
      
              Workflow ID     : 10001
              Status          : Completed successfully
              Message         :
              Process         : snapgatk-20180730_1
              Description     :
              Created Date    : Mon, 27 Aug 2018 20:27:24 GMT
              End Date        : Mon, 27 Aug 2018 20:55:12 GMT
              Wall Clock Time : 0h 27m 48s
              Bases Processed : 1,348,613,600 (1 GBase)
      

    Nota

    Como alternativa, você pode incluir o caminho para o arquivo de configuração em vez de inserir diretamente a URL e a CHAVE. Se você incluir esses argumentos na linha de comando, bem como no arquivo de configuração, os argumentos de linha de comando terão precedência.

Para o ID de fluxo de trabalho 1001 e config.txt arquivo colocado no mesmo caminho do executável msgen, o comando terá esta aparência:

msgen status -w 1001 -f "config.txt"

2. Examine o conteúdo do standardoutput.txt

Localize o contêiner de saída para o fluxo de trabalho em questão. O MSGEN cria uma [workflowfilename].logs.zip pasta após cada execução do fluxo de trabalho. Descompacte a pasta para visualizar seu conteúdo:

  • outputFileList.txt - uma lista dos arquivos de saída produzidos durante o fluxo de trabalho
  • standarderror.txt - este ficheiro está em branco.
  • standardoutput.txt - registra todas as mensagens de status de nível superior, incluindo erros, que ocorreram durante a execução do fluxo de trabalho.
  • Arquivos de log GATK - todos os outros arquivos na logs pasta

Para solucionar problemas, examine o conteúdo do standardoutput.txt e anote todas as mensagens de erro que aparecem.

Esta seção destaca brevemente os erros comuns gerados pelo serviço Microsoft Genomics (msgen) e as estratégias que você pode usar para resolvê-los.

O serviço Microsoft Genomics (msgen) pode lançar os seguintes dois tipos de erros:

  1. Erros internos do serviço: erros internos ao serviço, que podem não ser resolvidos com a fixação de parâmetros ou arquivos de entrada. Às vezes, reenviar o fluxo de trabalho pode corrigir esses erros.
  2. Erros de entrada: erros que podem ser resolvidos usando os argumentos corretos ou corrigindo formatos de arquivo.

1. Erros internos do serviço

Um erro de serviço interno não é acionável pelo usuário. Você pode reenviar o fluxo de trabalho, mas se isso não funcionar, entre em contato com o suporte da Microsoft Genomics

Mensagem de Erro Passos de resolução de problemas recomendados
Ocorreu um erro interno. Tente reenviar o fluxo de trabalho. Se vir este erro novamente, contacte o suporte da Microsoft Genomics para obter assistência Envie o fluxo de trabalho novamente. Entre em contato com o suporte da Microsoft Genomics para obter assistência se o problema persistir criando um tíquete de suporte.

2. Erros de introdução

Esses erros são acionáveis pelo usuário. Com base no tipo de arquivo e no código de erro, o serviço Microsoft Genomics gera códigos de erro distintos. Siga as etapas de solução de problemas recomendadas listadas abaixo.

Tipo de ficheiro Código de erro Mensagem de Erro Passos de resolução de problemas recomendados
Qualquer 701 Read [readId] tem bases [numberOfBases], mas o limite é [maxReadLength] A razão mais comum para esse erro é a corrupção de arquivos que leva à concatenação de duas leituras. Verifique seus arquivos de entrada.
BAM 200 Não é possível ler o ficheiro '[yourFileName]'. Verifique o formato do ficheiro BAM. Envie o fluxo de trabalho novamente com um arquivo formatado corretamente.
BAM 201 Não é possível ler o arquivo BAM [File_name]. Verifique o formato do ficheiro BAM. Envie o fluxo de trabalho com um arquivo formatado corretamente.
BAM 202 Não é possível ler o arquivo BAM [File_name]. Arquivo muito pequeno e cabeçalho ausente. Verifique o formato do ficheiro BAM. Envie o fluxo de trabalho com um arquivo formatado corretamente.
BAM 203 Não é possível ler o arquivo BAM [File_name]. O cabeçalho do arquivo estava corrompido. Verifique o formato do ficheiro BAM. Envie o fluxo de trabalho com um arquivo formatado corretamente.
BAM 204 Não é possível ler o arquivo BAM [File_name]. O cabeçalho do arquivo estava corrompido. Verifique o formato do ficheiro BAM. Envie o fluxo de trabalho com um arquivo formatado corretamente.
BAM 205 Não é possível ler o arquivo BAM [File_name]. O cabeçalho do arquivo estava corrompido. Verifique o formato do ficheiro BAM. Envie o fluxo de trabalho com um arquivo formatado corretamente.
BAM 206 Não é possível ler o arquivo BAM [File_name]. O cabeçalho do arquivo estava corrompido. Verifique o formato do ficheiro BAM. Envie o fluxo de trabalho com um arquivo formatado corretamente.
BAM 207 Não é possível ler o arquivo BAM [File_name]. Arquivo truncado perto de deslocamento [offset]. Verifique o formato do ficheiro BAM. Envie o fluxo de trabalho com um arquivo formatado corretamente.
BAM 208 Arquivo BAM inválido. O ReadID [Read_Id] não tem sequência no arquivo [File_name]. Verifique o formato do ficheiro BAM. Envie o fluxo de trabalho com um arquivo formatado corretamente.
FASTQ 300 Não é possível ler o arquivo FASTQ. [File_name] não termina com uma nova linha. Corrija o formato do arquivo FASTQ e envie o fluxo de trabalho novamente.
FASTQ 301 Não é possível ler o arquivo FASTQ [File_name]. O registro FASTQ é maior do que o tamanho do buffer no deslocamento: [_offset] Corrija o formato do arquivo FASTQ e envie o fluxo de trabalho novamente.
FASTQ 302 Erro de sintaxe FASTQ. O ficheiro [File_name] tem uma linha em branco. Corrija o formato do arquivo FASTQ e envie o fluxo de trabalho novamente.
FASTQ 303 Erro de sintaxe FASTQ. Arquivo[File_name] tem um caractere inicial inválido no deslocamento: [_offset], tipo de linha: [line_type], caractere: [_char] Corrija o formato do arquivo FASTQ e envie o fluxo de trabalho novamente.
FASTQ 304 Erro de sintaxe FASTQ em readID [_ReadID]. A primeira leitura do lote não tem readID terminando em /1 no arquivo [File_name] Corrija o formato do arquivo FASTQ e envie o fluxo de trabalho novamente.
FASTQ 305 Erro de sintaxe FASTQ em readID [_readID]. A segunda leitura do lote não tem readID terminando em /2 no arquivo [File_name] Corrija o formato do arquivo FASTQ e envie o fluxo de trabalho novamente.
FASTQ 306 Erro de sintaxe FASTQ em readID [_ReadID]. A primeira leitura do par não tem um ID que termine em /1 no arquivo [File_name] Corrija o formato do arquivo FASTQ e envie o fluxo de trabalho novamente.
FASTQ 307 Erro de sintaxe FASTQ em readID [_ReadID]. O ReadID não termina com /1 ou/2. O arquivo [File_name] não pode ser usado como um arquivo FASTQ emparelhado. Corrija o formato do arquivo FASTQ e envie o fluxo de trabalho novamente.
FASTQ 308 Erro de leitura FASTQ. As leituras de ambas as extremidades responderam de forma diferente. Você escolheu os arquivos FASTQ corretos? Corrija o formato do arquivo FASTQ e envie o fluxo de trabalho novamente.

Etapa 3: Entre em contato com o suporte do Microsoft Genomics

Se continuar a ter falhas de trabalho ou se tiver outras dúvidas, contacte o suporte da Microsoft Genomics a partir do portal do Azure. Informações adicionais sobre como enviar uma solicitação de suporte podem ser encontradas aqui.

Próximos passos

Neste artigo, você aprendeu como solucionar e resolver problemas comuns com o serviço Microsoft Genomics. Para obter mais informações e perguntas frequentes mais gerais, consulte Perguntas comuns.