Отладка оптимизированного для производительности кода
Корпорация Майкрософт имеет определенные методы, используемые для повторного упорядочивания скомпилированного и связанного кода, чтобы он выполнялся с большей эффективностью. Эти методы оптимизируют компонент для иерархий памяти и основаны на сценариях обучения.
Результирующая оптимизация уменьшает разбиение на страницы (и ошибки страниц) и увеличивает пространственное расположение между кодом и данными. Он обращается к ключевым узким местам производительности, которое будет введено при плохом расположении исходного кода. Компонент, прошедший эту оптимизацию, может иметь свой код или блок данных в функции, перемещаемой в разные расположения двоичного файла.
В модулях, оптимизированных этими методами, расположения блоков кода и данных часто находятся в адресах памяти, отличных от расположений, где они будут находиться после обычной компиляции и связывания. Кроме того, функции, возможно, были разделены на множество несвязанных блоков, чтобы наиболее часто используемые пути кода могли находиться рядом друг с другом на одной странице.
Таким образом, функция (или любой символ) плюс смещение не обязательно будет иметь то же значение, что и в неоптимизованном коде.
Отладка оптимизированного для производительности кода
При отладке можно увидеть, оптимизирован ли модуль для производительности с помощью команды расширения !lmi в любом модуле, для которого загружены символы:
0:000> !lmi ntdll
Loaded Module Info: [ntdll]
Module: ntdll
Base Address: 77f80000
Image Name: ntdll.dll
Machine Type: 332 (I386)
Time Stamp: 394193d2 Fri Jun 09 18:03:14 2000
CheckSum: 861b1
Characteristics: 230e stripped perf
Debug Data Dirs: Type Size VA Pointer
MISC 110, 0, 76c00 [Data not mapped]
Image Type: DBG - Image read successfully from symbol server.
c:\symbols\dll\ntdll.dbg
Symbol Type: DIA PDB - Symbols loaded successfully from symbol server.
c:\symbols\dll\ntdll.pdb
В этом выходных данных обратите внимание на термин perf в строке "Характеристики". Это означает, что эта оптимизация производительности была применена к ntdll.dll.
Отладчик может понять функцию или другой символ без смещения; это позволяет задавать точки останова для функций или других меток без каких-либо проблем. Однако выходные данные операции дизассембли могут быть запутанными, так как этот дизассембли будет отражать изменения, внесенные оптимизатором.
Так как отладчик попытается оставаться близко к исходному коду, вы можете увидеть некоторые забавные результаты. Правило большого пальца при работе с оптимизированными для производительности кодами — это просто то, что вы не можете выполнять арифметическую арифметику надежных адресов в оптимизированном коде.
Рассмотрим пример:
kd> bl
0 e f8640ca6 0001 (0001) tcpip!IPTransmit
1 e f8672660 0001 (0001) tcpip!IPFragment
kd> u f864b4cb
tcpip!IPTransmit+e48:
f864b4cb f3a4 rep movsb
f864b4cd 8b75cc mov esi,[ebp-0x34]
f864b4d0 8b4d10 mov ecx,[ebp+0x10]
f864b4d3 8b7da4 mov edi,[ebp-0x5c]
f864b4d6 8bc6 mov eax,esi
f864b4d8 6a10 push 0x10
f864b4da 034114 add eax,[ecx+0x14]
f864b4dd 57 push edi
В списке точек останова видно, что адрес IPTransmit 0xF8640CA6.
При отмене анализа раздела кода в этой функции в 0xF864B4CB выходные данные указывают на то, что это 0xE48 байтах после начала функции. Однако если вычитать базу функции из этого адреса, фактическое смещение будет 0xA825.
Это происходит: отладчик действительно показывает дизассемблию двоичных инструкций, начиная с 0xF864B4CB. Но вместо вычисления смещения путем простого вычитания отладчик отображает , как лучше всего это может - смещение к записи функции, как она существовала в исходном коде перед выполнением оптимизации. Это значение 0xE48.
С другой стороны, если вы попытаетесь посмотреть НА IPTransmit+0xE48, вы увидите следующее:
kd> u tcpip!iptransmit+e48
tcpip!ARPTransmit+d8:
f8641aee 0856ff or [esi-0x1],dl
f8641af1 75fc jnz tcpip!ARPTransmit+0xd9 (f8641aef)
f8641af3 57 push edi
f8641af4 e828eeffff call tcpip!ARPSendData (f8640921)
f8641af9 5f pop edi
f8641afa 5e pop esi
f8641afb 5b pop ebx
f8641afc c9 leave
То, что происходит здесь, отладчик распознает символ IPTransmit как эквивалентный адресу 0xF8640CA6, а средство синтаксического анализа команд выполняет простое дополнение, чтобы найти, что 0xF8640CA6 + 0xE48 = 0xF8641AEE. Затем этот адрес используется в качестве аргумента для команды u (Unassemble). Но после анализа этого расположения отладчик обнаруживает, что это не IPTransmit плюс смещение 0xE48. Действительно, это не является частью этой функции вообще. Скорее, он соответствует функции ARPTransmit плюс смещение 0xD8.
Причина в том, что оптимизация производительности не является обратимой с помощью арифметики адресов. Хотя отладчик может принимать адрес и выводить исходный символ и смещение, у него недостаточно сведений, чтобы взять символ и смещение и перевести его в правильный адрес. Следовательно, дизассембли не является полезным в этих случаях.