大佬教程收集整理的这篇文章主要介绍了c – vector :: operator []开销,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
(我已经看到关于SO的另一个相关问题,但是关于[] vs at() – 但显然甚至[]对我来说太慢了!
谢谢,
安东尼
(编辑:只是为了信息:在Ubuntu上使用g -O3版本4.5.2)
for (int i=0,n=v.size(); i<n; i++) { @R_917_10586@l += v[i] + foo(); }
如果foo的代码不是预先知道的,那么编译器每次都被迫重新加载向量开始的地址,因为向量可能是由于foo()中的代码而被重新分配的.
如果您确定该矢量不会被内存移动或重新分配,那么您可以使用类似于
double *vptr = &v[0]; // Address of first element for (int i=0,n=v.size(); i<n; i++) { @R_917_10586@l += vptr[i] + foo(); }
使用这种方法,可以保存一个存储器查找操作(vptr可能最终在整个循环的寄存器中).
低效率的另一个原因可能是缓存垃圾.为了看看这是否是一个问题,一个简单的伎俩是通过一些不均匀的元素来过度分配你的矢量.
原因是因为缓存如何工作,如果你有很多向量,例如4096个元素都将在地址中具有相同的低阶位,并且由于缓存行无效,您可能会最终失去很多速度.
例如我的电脑上的这个循环
std::vector<double> v1(n),v2(n),v3(n),v4(n),v5(n); for (int i=0; i<1000000; i++) for (int j=0; j<1000; j++) { v1[j] = v2[j] + v3[j]; v2[j] = v3[j] + v4[j]; v3[j] = v4[j] + v5[j]; v4[j] = v5[j] + v1[j]; v5[j] = v1[j] + v2[j]; }
如果n == 8191执行约8.1秒,如果n == 10000则在3.2秒内执行.注意,内循环始终为0到999,与n的值无关;只是内存地址有什么不同?
根据处理器/架构的不同,由于缓存丢失,我甚至观察到10倍的速度下降.
以上是大佬教程为你收集整理的c – vector :: operator []开销全部内容,希望文章能够帮你解决c – vector :: operator []开销所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。