分类导航

C&C++ 发布时间：2022-04-03 发布网站：大佬教程 code.js-code.com

大佬教程收集整理的这篇文章主要介绍了c – vector :: operator []开销，大佬教程大佬觉得挺不错的，现在分享给大家，也给大家做个参考。

显然,在剖析我的(科学计算)C代码之后,25％(！)的时间花在与vector :: operator []的调用上.诚然,我的代码花费了所有的时间读取和写入矢量< float> s(和一些向量< int> s),但是我仍然想知道是否应该有一些显着的操作开销[ ]与C风格的阵列相比？

(我已经看到关于SO的另一个相关问题,但是关于[] vs at() – 但显然甚至[]对我来说太慢了！

谢谢,
安东尼

(编辑：只是为了信息：在Ubuntu上使用g -O3版本4.5.2)

解决方法

std :: vector :: operator []应该是相当有效的,但是编译器必须是偏执的,对于对函数的每个调用,它必须假定向量可能已经被移动到内存中的其他位置.

例如在这段代码中

for (int i=0,n=v.size(); i<n; i++)
{
    @R_917_10586@l += v[i] + foo();
}

如果foo的代码不是预先知道的,那么编译器每次都被迫重新加载向量开始的地址,因为向量可能是由于foo()中的代码而被重新分配的.

如果您确定该矢量不会被内存移动或重新分配,那么您可以使用类似于

double *vptr = &v[0]; // Address of first element
for (int i=0,n=v.size(); i<n; i++)
{
    @R_917_10586@l += vptr[i] + foo();
}

使用这种方法,可以保存一个存储器查找操作(vptr可能最终在整个循环的寄存器中).

低效率的另一个原因可能是缓存垃圾.为了看看这是否是一个问题,一个简单的伎俩是通过一些不均匀的元素来过度分配你的矢量.

原因是因为缓存如何工作,如果你有很多向量,例如4096个元素都将在地址中具有相同的低阶位,并且由于缓存行无效,您可能会最终失去很多速度.
例如我的电脑上的这个循环

std::vector<double> v1(n),v2(n),v3(n),v4(n),v5(n);
for (int i=0; i<1000000; i++)
    for (int j=0; j<1000; j++)
    {
        v1[j] = v2[j] + v3[j];
        v2[j] = v3[j] + v4[j];
        v3[j] = v4[j] + v5[j];
        v4[j] = v5[j] + v1[j];
        v5[j] = v1[j] + v2[j];
    }

如果n == 8191执行约8.1秒,如果n == 10000则在3.2秒内执行.注意,内循环始终为0到999,与n的值无关;只是内存地址有什么不同？

根据处理器/架构的不同,由于缓存丢失,我甚至观察到10倍的速度下降.

大佬总结

以上是大佬教程为你收集整理的c – vector :: operator []开销全部内容，希望文章能够帮你解决c – vector :: operator []开销所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错，欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ：384754419，请注明来意。

标签：c operator vector 开销

上一篇: 从函数返回数组/指针下一篇:objective-c – 在保留自动布局约...

猜你在找的C&C++相关文章

两个稀疏矩阵的乘法算法的实现——十字链表矩阵相乘 2022-04-13
c – program_options代码中的链接错误与ubuntu上的boost库 2019-10-05
如何将警告视为Makefile中的错误？ 2019-10-05
如何检查数组是否有任何重复？ 2019-10-05
c – 你应该在虚拟继承中写“公共虚拟”还是“虚拟公共”？ 2019-10-05
C URLencode库(支持Unicode)？ 2019-10-05
objective-c – 启用ARC的设备上的iOS崩溃 2019-10-05
c – 除零除法：检查除数的表达式不会导致零与检查除数不为零？ 2019-10-05
c – 重复排列：避免溢出 2019-10-05
C“删除”很慢.我应该先看哪儿？ 2019-10-05