你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
故障排除指南
下面提供了当你使用 Microsoft 基因组学服务 (MSGEN) 时可能会遇到的一些常见问题的故障排除提示。
如需与故障排除无关的常见问题解答,请参阅常见问题。
步骤 1:查找与工作流关联的错误代码
可通过以下方式查找与工作流关联的错误消息:
- 使用命令行并键入
msgen status
- 检查 standardoutput.txt 的内容。
1. 使用命令行 msgen status
msgen status -u URL -k KEY -w ID
有三个必需参数:
URL - API 的基本 URI
密钥 - 基因组学帐户的访问密钥
- 若要查找 URL 和密钥,请转到 Azure 门户并打开 Microsoft 基因组学帐户页。 在“管理”标题下方,选择“访问密钥”。 可在此处找到 API URL 和访问密钥。
ID - 工作流 ID
若要查找工作流 ID,请键入
msgen list
命令。 假设配置文件包含 URL 和访问密钥,并且与 msgen 可执行文件位于同一位置,则命令如下所示:msgen list -f "config.txt"
此命令的输出如下所示:
Microsoft Genomics command-line client v0.7.4 Copyright (c) 2018 Microsoft. All rights reserved. Workflow List ------------- Total Count : 1 Workflow ID : 10001 Status : Completed successfully Message : Process : snapgatk-20180730_1 Description : Created Date : Mon, 27 Aug 2018 20:27:24 GMT End Date : Mon, 27 Aug 2018 20:55:12 GMT Wall Clock Time : 0h 27m 48s Bases Processed : 1,348,613,600 (1 GBase)
注意
或者,可在配置文件中包含路径,而不是直接输入 URL 和密钥。 如果在命令行和配置文件中包含这些参数,命令行参数将具有优先权。
如果工作流 ID 为 1001,并且 config.txt 文件与 msgen 可执行文件位于同一路径,则命令如下所示:
msgen status -w 1001 -f "config.txt"
2. 检查 standardoutput.txt 的内容
查找有问题的工作流的输出容器。 每次执行工作流后,MSGEN 会创建一个 [workflowfilename].logs.zip
文件夹。 请解压缩该文件夹以查看其内容:
- outputFileList.txt - 工作流运行期间生成的输出文件列表
- standarderror.txt - 此文件为空。
- standardoutput.txt - 记录运行工作流时发生的所有顶级状态消息,包括错误。
- GATK 日志文件 -
logs
文件夹中的所有其他文件
若要进行故障排除,请检查 standardoutput.txt 的内容,并记下出现的任何错误消息。
步骤 2:尝试执行解决常见错误的建议步骤
本部分简要描述 Microsoft 基因组学服务 (msgen) 输出的常见错误,以及可用于解决这些错误的策略。
Microsoft 基因组学服务 (msgen) 可能引发以下两种类型的错误:
- 内部服务错误:服务内部的错误,无法通过修复参数或输入文件来解决。 有时,重新提交工作流可能会解决这些错误。
- 输入错误:使用正确的参数或修复文件格式可以解决的错误。
1. 内部服务错误
内部服务错误不可由用户处理。 可以重新提交工作流,但如果这样做也解决不了问题,请联系 Microsoft 基因组学支持人员
错误消息 | 建议的故障排除步骤 |
---|---|
发生内部错误。 请尝试重新提交工作流。 如果再次看到此错误,请联系 Microsoft 基因组学支持人员以获得帮助 | 重新提交工作流。 如果问题持续出现,请通过创建支持票证来联系 Microsoft 基因组学支持人员,以获得帮助。 |
2. 输入错误
这些错误可由用户处理。 根据文件类型和错误代码,Microsoft 基因组学服务会输出不同的错误代码。 请遵循下面列出的建议故障排除步骤。
文件类型 | 错误代码 | 错误消息 | 建议的故障排除步骤 |
---|---|---|---|
任意 | 701 | 读取操作 [readId] 具有 [numberOfBases] 个基,但限制为 [maxReadLength] | 出现此错误的最常见原因是文件损坏,导致串联了两个读取操作。 请检查输入文件。 |
BAM | 200 | 无法读取文件“[yourFileName]”。 | 请检查 BAM 文件的格式。 使用格式正确的文件重新提交工作流。 |
BAM | 201 | 无法读取 BAM 文件 [File_name]。 | 请检查 BAM 文件的格式。 使用格式正确的文件提交工作流。 |
BAM | 202 | 无法读取 BAM 文件 [File_name]。 文件太小,且缺少标头。 | 请检查 BAM 文件的格式。 使用格式正确的文件提交工作流。 |
BAM | 203 | 无法读取 BAM 文件 [File_name]。 文件标头已损坏。 | 请检查 BAM 文件的格式。 使用格式正确的文件提交工作流。 |
BAM | 204 | 无法读取 BAM 文件 [File_name]。 文件标头已损坏。 | 请检查 BAM 文件的格式。 使用格式正确的文件提交工作流。 |
BAM | 205 | 无法读取 BAM 文件 [File_name]。 文件标头已损坏。 | 请检查 BAM 文件的格式。 使用格式正确的文件提交工作流。 |
BAM | 206 | 无法读取 BAM 文件 [File_name]。 文件标头已损坏。 | 请检查 BAM 文件的格式。 使用格式正确的文件提交工作流。 |
BAM | 207 | 无法读取 BAM 文件 [File_name]。 在偏移量 [offset] 附近截断了文件。 | 请检查 BAM 文件的格式。 使用格式正确的文件提交工作流。 |
BAM | 208 | BAM 文件无效。 ReadID [Read_Id] 在文件 [File_name] 中没有序列。 | 请检查 BAM 文件的格式。 使用格式正确的文件提交工作流。 |
FASTQ | 300 | 无法读取 FASTQ 文件。 [File_name] 不是以换行符结尾。 | 请更正 FASTQ 文件的格式,然后重新提交工作流。 |
FASTQ | 301 | 无法读取 FASTQ 文件 [File_name]。 FASTQ 记录大于偏移量 [_offset] 处的缓冲区大小 | 请更正 FASTQ 文件的格式,然后重新提交工作流。 |
FASTQ | 302 | FASTQ 语法错误。 文件 [File_name] 包含空白行。 | 请更正 FASTQ 文件的格式,然后重新提交工作流。 |
FASTQ | 303 | FASTQ 语法错误。 文件 [File_name] 在偏移量 [_offset] 处包含无效的起始字符,行类型: [line_type],字符: [_char] | 请更正 FASTQ 文件的格式,然后重新提交工作流。 |
FASTQ | 304 | readID [_ReadID] 处存在 FASTQ 语法错误。 在文件 [File_name] 中,第一个批读取不包含以 /1 结尾的 readID | 请更正 FASTQ 文件的格式,然后重新提交工作流。 |
FASTQ | 305 | readID [_readID] 处存在 FASTQ 语法错误。 在文件 [File_name] 中,第二个批读取不包含以 /2 结尾的 readID | 请更正 FASTQ 文件的格式,然后重新提交工作流。 |
FASTQ | 306 | readID [_ReadID] 处存在 FASTQ 语法错误。 在文件 [File_name] 中,第一个对读取不包含以 /1 结尾的 ID | 请更正 FASTQ 文件的格式,然后重新提交工作流。 |
FASTQ | 307 | readID [_ReadID] 处存在 FASTQ 语法错误。 ReadID 不是以 /1 或 /2 结尾。 文件 [File_name] 不可用作配对的 FASTQ 文件。 | 请更正 FASTQ 文件的格式,然后重新提交工作流。 |
FASTQ | 308 | FASTQ 读取错误。 两端的读取以不同的方式做出了响应。 是否选择了正确的 FASTQ 文件? | 请更正 FASTQ 文件的格式,然后重新提交工作流。 |
步骤 3:联系 Microsoft 基因组学支持人员
如果作业继续失败或有任何其他疑问,请通过 Azure 门户与 Microsoft 基因组学支持人员联系。 可从此处找到有关如何提交支持请求的更多信息。
后续步骤
本文介绍了如何排除和解决 Microsoft 基因组学服务的常见问题。 有关详细信息和更多常规常见问题解答,请参阅常见问题。