Я хотел бы просмотреть поведение кэша модуля ядра с помощью SystemTap (ссылки #cache, пропуски # кэша и т. Д.). Существует пример сценария онлайн, который показывает, как SystemTap можно использовать для чтения PErF событий и счетчики, в том числе относящиеся к кэшу из них: https://sourceware.org/systemtap/examples/profiling/perf.stpСкрипт SystemTap для анализа поведения кеша функций
Этот сценарий работает по умолчанию для процесса:
probe perf.hw.cache_references.process("/usr/bin/find").counter("find_insns") {}
Я заменил process
ключевое слово с module
и путь к исполняемому файлу с именем моего модуля ядра:
probe perf.hw.cache_references.module(MODULE_NAME).counter("find_insns") {}
Я уверен, что мой модуль имеет отладки info, но с помощью сценария я получаю:
semantic error: while resolving probe point: identifier 'perf' at perf.stp:14:7 source: probe perf.hw.instructions.module(MODULE_NAME).counter("find_insns") {}
Любые идеи, что может быть неправильным?
Edit:
Хорошо, я понял, что счетчики Perf могут быть связаны с процессами только не модулей (описано здесь: https://sourceware.org/systemtap/man/stapprobes.3stap.html). Поэтому я изменил его обратно:
probe perf.hw.cache_references.process(PATH_TO_BINARY).counter("find_insns") {}
Теперь, как подсказывает пример сценария, у меня есть:
probe module(MODULE_NAME).function(FUNC_NAME) {
#save counter values on entrance
...
}
Но теперь работает, я получаю:
semantic error: perf counter 'find_insns' not defined semantic error: while resolving probe point: identifier 'module' at perf.stp:26:7 source: probe module(MODULE_NAME).function(FUNC_NAME)
Edit2:
Итак, вот мой полный сценарий:
#! /usr/bin/env stap
# Usage: stap perf.stp <path-to-binary> <module-name> <function-name>
global cycles_per_insn
global branch_per_insn
global cacheref_per_insn
global insns
global cycles
global branches
global cacherefs
global insn
global cachemisses
global miss_per_insn
probe perf.hw.instructions.process(@1).counter("find_insns") {}
probe perf.hw.cpu_cycles.process(@1).counter("find_cycles") {}
probe perf.hw.branch_instructions.process(@1).counter("find_branches") {}
probe perf.hw.cache_references.process(@1).counter("find_cache_refs") {}
probe perf.hw.cache_misses.process(@1).counter("find_cache_misses") {}
probe module(@2).function(@3)
{
insn["find_insns"] = @perf("find_insns")
insns <<< (insn["find_insns"])
insn["find_cycles"] = @perf("find_cycles")
cycles <<< insn["find_cycles"]
insn["find_branches"] = @perf("find_branches")
branches <<< insn["find_branches"]
insn["find_cache_refs"] = @perf("find_cache_refs")
cacherefs <<< insn["find_cache_refs"]
insn["find_cache_misses"] = @perf("find_cache_misses")
cachemisses <<< insn["find_cache_misses"]
}
probe module(@2).function(@3).return
{
dividend = (@perf("find_cycles") - insn["find_cycles"])
divisor = (@perf("find_insns") - insn["find_insns"])
q = dividend/divisor
if (q > 0)
cycles_per_insn <<< q
dividend = (@perf("find_branches") - insn["find_branches"])
q = dividend/divisor
if (q > 0)
branch_per_insn <<< q
dividend = (@perf("find_cycles") - insn["find_cycles"])
q = dividend/divisor
if (q > 0)
cacheref_per_insn <<< q
dividend = (@perf("find_cache_misses") - insn["find_cache_misses"])
q = dividend/divisor
if (q > 0)
miss_per_insn <<< q
}
probe end
{
if (@count(cycles_per_insn)) {
printf ("Cycles per Insn\n\n")
print (@hist_log(cycles_per_insn))
}
if (@count(branch_per_insn)) {
printf ("\nBranches per Insn\n\n")
print (@hist_log(branch_per_insn))
}
if (@count(cacheref_per_insn)) {
printf ("Cache Refs per Insn\n\n")
print (@hist_log(cacheref_per_insn))
}
if (@count(miss_per_insn)) {
printf ("Cache Misses per Insn\n\n")
print (@hist_log(miss_per_insn))
}
}
Я добавил свой полный сценарий. Спасибо за вашу помощь! – soofyaan
ОК, с полным сценарием я вижу то же самое. В самом деле, systemtap не может разрешить конструкцию @perf() для считывания значений первичного счетчика в модульных зондах по причинам, указанным выше. – fche