分类导航

C&C++ 发布时间：2022-04-03 发布网站：大佬教程 code.js-code.com

大佬教程收集整理的这篇文章主要介绍了c – 在CUDA线程中填充计数’桶’，大佬教程大佬觉得挺不错的，现在分享给大家，也给大家做个参考。

在我的程序中,我通过体素网格跟踪大量粒子.粒子与体素的比率是任意的.在某个时刻,我需要知道哪些粒子在哪些体素中,以及有多少粒子在哪些粒子中.具体而言,体素必须确切地知道其中包含哪些粒子.因为我不能在CUDA中使用像std :: vector这样的东西,所以我使用以下算法(在高级别)：

>分配体素数量大小的整数数组
>为所有粒子启动线程,确定每个粒子所在的体素,并在我的“桶”阵列中增加适当的计数器
>分配粒子数量大小的指针数组
>计算每个体素在此新阵列中的偏移量(将前面体素中的粒子数相加)
>以有序的方式将粒子放置在阵列中(我使用此数据来加速以后的操作.速度增加非常值得增加内存使用量).

这打破了第二步.我没有在CUDA中编程很长时间,并且发现线程之间同时写入全局内存中相同位置会产生不确定的结果.这反映在这样一个事实,即我大多数在桶中得到1,偶尔会得到2.这是我在这一步中使用的代码的草图：

__global__ void GPU_AssignParticles(Particle* particles,Voxel* voxels,int* buckets) {
    int tid = threadIdx.x + blockIdx.x*blockDim.x;

    if(tid < num_particles) { // <-- you can assume I actually passed this to the function :)
        // Some math to determine the index of the voxel which this particle
        // resides in.
        buckets[index] += 1;
    }
}

我的问题是,在CUDA中生成这些计数的正确方法是什么？

另外,有没有办法存储体素内的粒子参考？我看到的问题是体素内的粒子数量不断变化,因此几乎每一帧都必须重新分配新阵列并重新分配.

解决方法

虽然可能有更有效的计算铲斗数量的解决方案,但第一个工作解决方案是使用您当前的方法,但使用原子增量.这样,一次只有一个线程以原子方式递增桶数(在整个网格上同步)：

if(tid < num_particles) {
    // ...
    atomicAdd(&buckets[index],1);
}

@H_801_34@

大佬总结

以上是大佬教程为你收集整理的c – 在CUDA线程中填充计数’桶’全部内容，希望文章能够帮你解决c – 在CUDA线程中填充计数’桶’所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错，欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ：384754419，请注明来意。

标签：c cuda 中填充桶线程计数

上一篇: FFMPEG未定义参考C中的’avcodoe... 下一篇:将C结构包装到Ruby

猜你在找的C&C++相关文章

两个稀疏矩阵的乘法算法的实现——十字链表矩阵相乘 2022-04-13
c – program_options代码中的链接错误与ubuntu上的boost库 2019-10-05
如何将警告视为Makefile中的错误？ 2019-10-05
如何检查数组是否有任何重复？ 2019-10-05
c – 你应该在虚拟继承中写“公共虚拟”还是“虚拟公共”？ 2019-10-05
C URLencode库(支持Unicode)？ 2019-10-05
objective-c – 启用ARC的设备上的iOS崩溃 2019-10-05
c – 除零除法：检查除数的表达式不会导致零与检查除数不为零？ 2019-10-05
c – 重复排列：避免溢出 2019-10-05
C“删除”很慢.我应该先看哪儿？ 2019-10-05