Een Azure Linux-VM op een 3.10-kernel crasht na een upgrade van een hostknooppunt
Van toepassing op: ✔️ Virtuele Linux-machines
Oorspronkelijk KB-nummer: 3212236
Notitie
CentOS waarnaar in dit artikel wordt verwezen, is een Linux-distributie en bereikt het einde van de levensduur (EOL). Houd rekening met uw gebruik en plan dienovereenkomstig. Zie De richtlijnen voor het einde van de levensduur van CentOS voor meer informatie.
In dit artikel wordt een probleem besproken dat zich voordoet wanneer een Azure Linux-VM waarop de kernel op basis van 3.10 wordt uitgevoerd, vastloopt na een upgrade van een hostknooppunt in Azure.
Symptomen
Bekijk het volgende scenario:
U hebt een virtuele Microsoft Azure Linux-machine (VM) waarop een RHEL-/CentOS-distributie wordt uitgevoerd met een Linux-kernelversie die ouder is dan versie 3.10.0-327.10.1, inclusief de distributies die zijn opgenomen in:
- Red Hat Enterprise Linux 7.1 en 7.0
- CentOS 7.1 en 7.0
- Oracle Linux 7.1 en 7.0 met Red Hat-compatibele kernel
Een updatebewerking met geheugenbehoud vindt plaats op een Azure-hostknooppunt.
In dit scenario reageert de VIRTUELE machine niet meer en raakt de VM in paniek die lijkt op het volgende, wordt vastgelegd in het seriële Linux-logboek:
[11480839.438577] Call Trace:
[11480839.439615] [<ffffffff816045b6>] dump_stack+0x19/0x1b
[11480839.441556] [<ffffffff8106e29b>] warn_slowpath_common+0x6b/0xb0
[11480839.443818] [<ffffffff8106e33c>] warn_slowpath_fmt+0x5c/0x80
[11480839.445983] [<ffffffff8123e585>] sysfs_add_one+0xa5/0xd0
[11480839.447983] [<ffffffff8123e77c>] create_dir+0x7c/0xe0
[11480839.449876] [<ffffffff8123eb29>] sysfs_create_dir+0xa9/0x130
[11480839.451971] [<ffffffff812d74ab>] kobject_add_internal+0xbb/0x2f0
[11480839.454310] [<ffffffff812d79e5>] kobject_add+0x75/0xd0
[11480839.456236] [<ffffffff813cfa85>] device_add+0x125/0x7a0
[11480839.458167] [<ffffffff813df9fc>] ? __pm_runtime_resume+0x5c/0x80
[11480839.460469] [<ffffffff813fe9cc>] scsi_sysfs_add_sdev+0xac/0x280
[11480839.462628] [<ffffffff813fcfbb>] do_scan_async+0x7b/0x150
[11480839.464632] [<ffffffff8109e849>] async_run_entry_fn+0x39/0x120
[11480839.467170] [<ffffffff8108f0cb>] process_one_work+0x17b/0x470
[11480839.469354] [<ffffffff8108fe9b>] worker_thread+0x11b/0x400
[11480839.472310] [<ffffffff8108fd80>] ? rescuer_thread+0x400/0x400
[11480839.475265] [<ffffffff8109727f>] kthread+0xcf/0xe0
[11480839.477904] [<ffffffff810971b0>] ? kthread_create_on_node+0x140/0x140
[11480839.481074] [<ffffffff81614358>] ret_from_fork+0x58/0x90
[11480839.483873] [<ffffffff810971b0>] ? kthread_create_on_node+0x140/0x140
[11480839.487072] ---[ end trace 1f7736c59e96a8a0 ]---
[11480839.489584] ------------[ cut here ]------------
......
[11480864.118093] Call Trace:
[11480864.118093] [<ffffffff815f2535>] klist_put+0x25/0xa0
[11480864.118093] [<ffffffff815f25be>] klist_del+0xe/0x10
[11480864.118093] [<ffffffff813ce908>] device_del+0x58/0x1f0
[11480864.118093] [<ffffffff813ceabe>] device_unregister+0x1e/0x60
[11480864.118093] [<ffffffff812c36ee>] bsg_unregister_queue+0x5e/0xa0
[11480864.118093] [<ffffffff813fec49>] __scsi_remove_device+0xa9/0xd0
[11480864.118093] [<ffffffff813fcfc7>] do_scan_async+0x87/0x150
[11480864.118093] [<ffffffff8109e849>] async_run_entry_fn+0x39/0x120
[11480864.118093] [<ffffffff8108f0cb>] process_one_work+0x17b/0x470
[11480864.118093] [<ffffffff8108fe9b>] worker_thread+0x11b/0x400
[11480864.118093] [<ffffffff8108fd80>] ? rescuer_thread+0x400/0x400
[11480864.118093] [<ffffffff8109727f>] kthread+0xcf/0xe0
[11480864.118093] [<ffffffff810971b0>] ? kthread_create_on_node+0x140/0x140
[11480864.118093] [<ffffffff81614358>] ret_from_fork+0x58/0x90
[11480864.118093] [<ffffffff810971b0>] ? kthread_create_on_node+0x140/0x140
Oorzaak
Dit probleem kan worden veroorzaakt door foutieve vergrendelingslogica in het SCSI-subsysteem dat wordt weergegeven wanneer een SCSI-schijf wordt verwijderd uit een actieve RHEL-/CentOS-VM-gast op een Microsoft Hyper-V-host.
Oplossing
U kunt dit probleem oplossen en de functionaliteit herstellen door de VIRTUELE machine handmatig opnieuw op te starten.
Als u dit probleem in de toekomst wilt voorkomen, werkt u bij naar kernelversie 3.10.0-327.10.1 of een nieuwere versie, waaronder de versies in:
- Red Hat Enterprise Linux 7.2
- CentOS 7.2
- Oracle Linux 7.2 met red hat-compatibele kernel
Meer informatie
Zie Ondersteuning voor Linux en opensource-technologie in Azure voor meer informatie over goedgekeurde Linux-distributies en opensource-technologieën in Azure.
Contacteer ons voor hulp
Als u vragen hebt of hulp nodig hebt, maak een ondersteuningsaanvraag of vraag de Azure-communityondersteuning. U kunt ook productfeedback verzenden naar de Azure-feedbackcommunity.
Disclaimerinformatie van derden
De producten van derden die in dit artikel worden vermeld, worden vervaardigd door bedrijven die onafhankelijk zijn van Microsoft. Microsoft verleent dan ook geen enkele garantie, impliciet noch anderszins, omtrent de prestaties of de betrouwbaarheid van deze producten.