iOS   发布时间:2022-03-30  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了ios – 我怎样才能将这个for循环向量化?大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我有这个循环

void f1(unsigned char *data,unsigned int sizE) {
    unsigned int a[256] = {0u};      
    for (register unsigned int i = 0u; i < size; i++) {
        ++A[data[i]];
    }
   ...

有没有办法手动矢量化?

解决方法

由于data [i]中的多个条目可能包含相同的值,因此我不知道如何将其简化为矢量化,因为可能存在竞争条件.矢量化的要点是每个元素独立于其他元素,因此可以并行计算.但是你的算法不允许这样做. “Vectorize”与“让自己走得更快”不是一回事.

在这里构建的是一个直方图,iOS内置了优化的支持.您可以创建单通道单行图像,并使用vImageHistogramCalculation_Planar8,如下所示:

void f1(unsigned char *data,unsigned int sizE) {
    unsigned long A[256] = {0u};

    vImage_Buffer src = { data,1,size,size };
    vImage_Error err = vImageHistogramCalculation_Planar8(&src,A,kvImageDoNotTilE);
    if (err != kvImageNoError) {
        // error
    }
    ...
}

但是要小心,假设这总是一场胜利.这取决于您的数据大小.进行函数调用非常昂贵,因此可能需要数百万字节的数据才能使其值得.如果你在较小的集合上计算它,那么一个简单的,编译器优化的循环通常是最好的方法.您需要在真实设备上对此进行分析,以确定哪个更快.

只需确保允许编译器通过启用-Ofast(Fastest,AggressivE)来应用所有矢量化优化.在这种情况下,这无关紧要,因为你的循环不能简单地进行矢量化.但通常,-Ofast允许编译器在可能略微增加代码大小的情况下应用矢量化优化(在认的-Os下不允许). -Ofast还允许在执行浮点数学时有点邋so,所以不应该在需要严格的IEEE浮点一致性的情况下使用(但对于iOS应用来说几乎不是这种情况,所以-Ofast几乎总是正确的设置).

大佬总结

以上是大佬教程为你收集整理的ios – 我怎样才能将这个for循环向量化?全部内容,希望文章能够帮你解决ios – 我怎样才能将这个for循环向量化?所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。