다음을 통해 공유


호스트 노드 업그레이드 후 3.10 기반 커널의 Azure Linux VM 패닉

적용 대상: ✔️ Linux VM

원래 KB 번호: 3212236

참고 항목

이 문서에서 참조하는 CentOS는 Linux 배포이며 EOL(수명 종료)에 도달합니다. 사용 및 계획을 적절하게 고려하세요. 자세한 내용은 CentOS 수명 종료 지침을 참조 하세요.

이 문서에서는 Azure에서 호스트 노드 업그레이드 후 3.10 기반 커널을 실행하는 Azure Linux VM이 충돌할 때 발생하는 문제를 설명합니다.

증상

다음 시나리오를 살펴 보십시오.

  • 다음을 포함하여 버전 3.10.0-327.10.1 이전 버전의 Linux 커널 버전을 사용하여 RHEL/CentOS 기반 배포를 실행하는 Microsoft Azure Linux VM(가상 머신)이 있습니다.

    • Red Hat Enterprise Linux 7.1 및 7.0
    • CentOS 7.1 및 7.0
    • Red Hat 호환 커널을 사용한 Oracle Linux 7.1 및 7.0
  • 메모리 유지 업데이트 작업은 Azure 호스트 노드에서 발생합니다.

이 시나리오에서는 VM이 응답하지 않고 다음과 유사한 VM 패닉이 Linux 직렬 로그에 기록됩니다.

[11480839.438577] Call Trace:
[11480839.439615] [<ffffffff816045b6>] dump_stack+0x19/0x1b
[11480839.441556] [<ffffffff8106e29b>] warn_slowpath_common+0x6b/0xb0
[11480839.443818] [<ffffffff8106e33c>] warn_slowpath_fmt+0x5c/0x80
[11480839.445983] [<ffffffff8123e585>] sysfs_add_one+0xa5/0xd0
[11480839.447983] [<ffffffff8123e77c>] create_dir+0x7c/0xe0
[11480839.449876] [<ffffffff8123eb29>] sysfs_create_dir+0xa9/0x130
[11480839.451971] [<ffffffff812d74ab>] kobject_add_internal+0xbb/0x2f0
[11480839.454310] [<ffffffff812d79e5>] kobject_add+0x75/0xd0
[11480839.456236] [<ffffffff813cfa85>] device_add+0x125/0x7a0
[11480839.458167] [<ffffffff813df9fc>] ? __pm_runtime_resume+0x5c/0x80
[11480839.460469] [<ffffffff813fe9cc>] scsi_sysfs_add_sdev+0xac/0x280
[11480839.462628] [<ffffffff813fcfbb>] do_scan_async+0x7b/0x150
[11480839.464632] [<ffffffff8109e849>] async_run_entry_fn+0x39/0x120
[11480839.467170] [<ffffffff8108f0cb>] process_one_work+0x17b/0x470
[11480839.469354] [<ffffffff8108fe9b>] worker_thread+0x11b/0x400
[11480839.472310] [<ffffffff8108fd80>] ? rescuer_thread+0x400/0x400
[11480839.475265] [<ffffffff8109727f>] kthread+0xcf/0xe0
[11480839.477904] [<ffffffff810971b0>] ? kthread_create_on_node+0x140/0x140
[11480839.481074] [<ffffffff81614358>] ret_from_fork+0x58/0x90
[11480839.483873] [<ffffffff810971b0>] ? kthread_create_on_node+0x140/0x140
[11480839.487072] ---[ end trace 1f7736c59e96a8a0 ]---
[11480839.489584] ------------[ cut here ]------------
......
[11480864.118093] Call Trace:
[11480864.118093] [<ffffffff815f2535>] klist_put+0x25/0xa0
[11480864.118093] [<ffffffff815f25be>] klist_del+0xe/0x10
[11480864.118093] [<ffffffff813ce908>] device_del+0x58/0x1f0
[11480864.118093] [<ffffffff813ceabe>] device_unregister+0x1e/0x60
[11480864.118093] [<ffffffff812c36ee>] bsg_unregister_queue+0x5e/0xa0
[11480864.118093] [<ffffffff813fec49>] __scsi_remove_device+0xa9/0xd0
[11480864.118093] [<ffffffff813fcfc7>] do_scan_async+0x87/0x150
[11480864.118093] [<ffffffff8109e849>] async_run_entry_fn+0x39/0x120
[11480864.118093] [<ffffffff8108f0cb>] process_one_work+0x17b/0x470
[11480864.118093] [<ffffffff8108fe9b>] worker_thread+0x11b/0x400
[11480864.118093] [<ffffffff8108fd80>] ? rescuer_thread+0x400/0x400
[11480864.118093] [<ffffffff8109727f>] kthread+0xcf/0xe0
[11480864.118093] [<ffffffff810971b0>] ? kthread_create_on_node+0x140/0x140
[11480864.118093] [<ffffffff81614358>] ret_from_fork+0x58/0x90
[11480864.118093] [<ffffffff810971b0>] ? kthread_create_on_node+0x140/0x140

원인

이 문제는 SCSI 디스크가 Microsoft Hyper-V 호스트의 실행 중인 RHEL/CentOS 기반 VM 게스트에서 제거될 때 노출되는 SCSI 하위 시스템의 잘못된 잠금 논리로 인해 발생할 수 있습니다.

해결

이 문제를 해결하고 기능을 복원하려면 VM을 수동으로 다시 시작합니다.

나중에 이 문제를 방지하려면 다음을 포함하여 커널 버전 3.10.0-327.10.1 이상으로 업데이트합니다.

  • Red Hat Enterprise Linux 7.2
  • CentOS 7.2
  • Red Hat 호환 커널이 있는 Oracle Linux 7.2

추가 정보

Azure의 보증 Linux 배포 및 오픈 소스 기술에 대한 자세한 내용은 Azure의 Linux 및 오픈 소스 기술 지원을 참조하세요.

도움을 요청하십시오.

질문이 있거나 도움이 필요한 경우 지원 요청을 생성하거나Azure 커뮤니티 지원에 문의하세요. Azure 피드백 커뮤니티에 제품 피드백을 제출할 수도 있습니다.

타사 정보 고지 사항

이 문서에 나와 있는 다른 공급업체 제품은 Microsoft와 무관한 회사에서 제조한 것입니다. Microsoft는 이들 제품의 성능이나 안정성에 관하여 명시적이든 묵시적이든 어떠한 보증도 하지 않습니다.