当前位置: 首页 > news >正文

专业网站建设哪家效果好wordpress head 优化

专业网站建设哪家效果好,wordpress head 优化,站酷海洛,货代一般都去哪个网站找客户为了确保能够真正地了解线程块的分配#xff0c;接下来我们写一个简短的内核程序来输出线程块、线程、线程束和线程全局标号到屏幕上。现在#xff0c;除非你使用的是 3.2 版本以上的 SDK否则内核中是不支持 printf的。因此#xff0c;我们可以将数据传送回 CPU 端然后输出到…        为了确保能够真正地了解线程块的分配接下来我们写一个简短的内核程序来输出线程块、线程、线程束和线程全局标号到屏幕上。现在除非你使用的是 3.2 版本以上的 SDK否则内核中是不支持 printf的。因此我们可以将数据传送回 CPU 端然后输出到控制台窗口内核的代码如下: #include cuda_runtime.h #include device_launch_parameters.h#include stdio.h #include stdlib.h #include conio.h__global__ void what_is_my_id(unsigned int* const block,unsigned int* const thread,unsigned int* const warp,unsigned int* const calc_thread) {/* Thread id is block index * block size thread offset into the block */const unsigned int thread_idx (blockIdx.x * blockDim.x) threadIdx.x;block[thread_idx] blockIdx.x; thread[thread_idx] threadIdx.x;/* Calculate warp using buit in variable warpSize */warp[thread_idx] threadIdx.x / warpSize;calc_thread[thread_idx] thread_idx; }#define ARRAY_SIZE 128 #define ARRAY_SIZE_IN_BYTES (sizeof(unsigned int)* (ARRAY_SIZE))/* Declare statically four arrays of ARRAY_SIZE each */ unsigned int cpu_block[ARRAY_SIZE]; unsigned int cpu_thread[ARRAY_SIZE]; unsigned int cpu_warp[ARRAY_SIZE]; unsigned int cpu_calc_thread[ARRAY_SIZE];int main(void) {/* Total thread count 2*64128 */const unsigned int num_blocks 2;const unsigned int num_threads 64;char ch;/* Declare pointers for GPU based params */unsigned int* gpu_block;unsigned int* gpu_thread;unsigned int* gpu_warp;unsigned int* gpu_calc_thread;/* Declare loop counter for use later */unsigned int i;/* Allocate four arrays on the GPU */cudaMalloc((void**)gpu_block, ARRAY_SIZE_IN_BYTES);cudaMalloc((void**)gpu_thread, ARRAY_SIZE_IN_BYTES);cudaMalloc((void**)gpu_warp, ARRAY_SIZE_IN_BYTES);cudaMalloc((void**)gpu_calc_thread, ARRAY_SIZE_IN_BYTES);/* Execute our kerne] */what_is_my_id num_blocks, num_threads(gpu_block, gpu_thread, gpu_warp, gpu_calc_thread);/* Copy back the gpu results to the CPU */cudaMemcpy(cpu_block, gpu_block, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);cudaMemcpy(cpu_thread, gpu_thread, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);cudaMemcpy(cpu_warp, gpu_warp, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);cudaMemcpy(cpu_calc_thread, gpu_calc_thread, ARRAY_SIZE_IN_BYTES, cudaMemcpyDeviceToHost);/* Free the arrays on the GPU as now were done with them */cudaFree(gpu_block);cudaFree(gpu_thread);cudaFree(gpu_warp);cudaFree(gpu_calc_thread);/* Iterate through the arrays and print */for (i 0; i ARRAY_SIZE; i) {printf(Calculated Thread: %3u - Block:%2u - Warp %2u - Thread %3u\n, cpu_calc_thread[i], cpu_block[i], cpu_warp[i], cpu_thread[i]);}ch getch(); } 在这个例子中我们可以看到线程块按照线程块的编号紧密相连。由于处理的是一维数组所以我们对线程块采用相同的布局便可简单解决问题。以下是此程序的输出结果: 正如我们计算的那样线程索引是0~ 127。一共有两个线块每个线程块包含 64个线程每个线程块内部线程的索引为0~63。一个线程块包含两个线束。
http://www.w-s-a.com/news/649466/

相关文章:

  • 网站建设方案论文1500竞价托管哪家便宜
  • 使用cdn的网站宣武网站建设
  • 营销型网站怎么建设企业网站Wap在线生成
  • 网站建设服务费应该做到什么科目广州网页制作服务商
  • 网站显示500错误怎么解决方法店面设计模板
  • 网站备案icp文化传媒有限公司
  • 北京企业建站模板微信公众号商城怎么制作
  • 制作网站 公司简介大型做网站的公司
  • 北京网站开发建设南昌网站小程序开发
  • 网站如何做ip签名图片宁波互联网
  • 中山小榄网站建设长沙网络营销品牌排名
  • 推广优化厂商联系方式网站推广教程优化整站
  • 为外国企业做中文网站建设网站建设单位哪家好
  • 生物制药公司网站模板有没有专业做steam创客的网站
  • 福田做棋牌网站建设找哪家效益快弄一个微信小程序多少钱
  • 成都哪家做网站建设比较好做推广赚钱的网站
  • 常州专门做网站的公司有哪些网页模板下载网站10
  • linx服务器怎么做网站做长页网站
  • 汕头网站建设sagevis服装设计公司有什么职位
  • 网站流量分析报告医院网站制作公司
  • 仿58网站怎么做邯郸网站设计多少钱
  • 广州网站制作开发wordpress中文固定连接
  • 成都网站建设公司盈利吗专门做二手手机的网站有哪些
  • 手机网站设计需要学什么wordpress读法
  • WordPress pajx天津短视频seo
  • 检察院门户网站建设情况总结深圳网站制作长沙
  • 单页导航网站模板搜索量查询
  • 如何在一个地方建设网站营销型定制网站
  • 保定网站建设方案维护动易网站中添加邮箱
  • 简易网站的html代码wordpress音乐html