概述

我想测量某些应用程序使用’perf’执行的浮点数和算术运算,这是对 linux性能计数器子系统的新命令行接口命令. (出于测试目的,我使用了一个我创建的简单虚拟应用程序,见下文). 因为我找不到为测量FP和整数运算定义的任何’perf’事件,所以我开始挖掘原始硬件事件代码(与-rNNN一起使用,其中NNN是事件代码的十六进制值).所以我真正的问题是,我找到的退役指令代码(INST_RETIRED)

我想测量某些应用程序使用’perf’执行的浮点数和算术运算,这是对 linux 性能计数器子系统的新命令行接口命令. (出于测试目的,我使用了一个我创建的简单虚拟应用程序,见下文).

因为我找不到为测量FP和整数运算定义的任何’perf’事件,所以我开始挖掘原始硬件事件代码(与-rNNN一起使用,其中NNN是事件代码的十六进制值).所以我真正的问题是,我找到的退役指令代码(INST_RETIRED)没有区分FP和其他指令(X87和MMX / SSE).当我尝试使用适当的umasks到特定的代码时,我发现某种’perf’不理解或支持umask包含.我尝试过：

% perf stat -e rC0 ./a.out

这给了我退休的指示,但是

% perf stat -e rC002 ./a.out

应该给我执行的X87指令说我提供了错误的参数.也许是这样,但是使用’perf’原始硬件事件的umasks的正确方法是什么？一般来说,使用perf工具执行程序执行的浮点和整数运算的确切数量是什么？

非常感谢,
康斯坦丁博亚诺夫

这是我的测试应用程序：

int main(void){
  float  numbers[1000];
  float res1;
  double doubles[1000];
  double res2;

  int i,j=3,k=42;

  for(i=0;i<1000;i++){
    numbers[i] = (i+k)*j;
    doubles[i] = (i+j)*k;
    res1 = numbers[i]/(float)k;
    res2 = doubles[i]/(float)j;
  }
}

解决方法

要使用的事件取决于处理器.您可以使用libpfm4(http://perfmon2.git.sourceforge.net/git/gitweb-index.cgi)来确定哪些是可用事件(使用showevinfo程序),然后检查来自同一发行版的check_events以找出原始事件事件的代码.我的Sandy Bridge cpu 支持FP_COMP_OPS_EXE事件,我根据经验发现该事件与FLOP计数密切相关.

大佬总结

以上是大佬教程为你收集整理的使用linux perf工具测量应用程序的FLOP全部内容，希望文章能够帮你解决使用linux perf工具测量应用程序的FLOP所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错，欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ：384754419，请注明来意。

标签：

上一篇: 编译许多Linux发行版下一篇:检测Linux中的网络连接类型

猜你在找的Linux相关文章

初试eCryptfs文件加密系统 2022-04-01
linux mail操作 2019-10-31
linux 下 ifcfg-ethx配置和解析 2019-10-31
couldn't resolve host api.weixin.qq.com 2019-10-31
查看linux 服务器还剩多少空间 2019-10-31
vim编辑器的设置 2019-10-31
什么是守护进程？ 2019-10-31
crontab命令行和日志查看 2019-10-31
crontab清理日志 2019-10-31
linux防火墙相关 iptables 2019-10-31

其他相关热搜词更多

JavaScript之正则表达式学习笔记