Jump to ratings and reviews
Rate this book

CUDA C编程权威指南

Rate this book
本书主要介绍了如何使用GPU和利用CUDAC语言对其进行编程的。首先从基本的CUDA概念及结构讲起,一步一步地引导读者进入CUDA的内部世界,由浅入深地介绍了其编程要求及其内部架构,使读者对其有了整体印象后,逐步深入了解其内部机能,后介绍了GPU的一些专用函数和注意事项。译者序推荐序自序作者简介技术审校者简介前言致谢第1章基于CUDA的异构并行计算11.1并行计算11.1.1串行编程和并行编程21.1.2并行性31.1.3计算机架构41.2异构计算61.2.1异构架构71.2.2异构计算范例91.2.3CUDA:一种异构计算平台101.3用GPU输出HelloWorld121.4使用CUDAC编程难吗151.5总结161.6习题16第2章CUDA编程模型182.1CUDA编程模型概述182.1.1CUDA编程结构192.1.2内存管理202.1.3线程管理242.1.4启动一个CUDA核函数292.1.5编写核函数302.1.6验证核函数312.1.7处理错误322.1.8编译和执行322.2给核函数计时352.2.1用CPU计时器计时352.2.2用nvprof工具计时392.3组织并行线程402.3.1使用块和线程建立矩阵索引402.3.2使用二维网格和二维块对矩阵求和442.3.3使用一维网格和一维块对矩阵求和472.3.4使用二维网格和一维块对矩阵求和482.4设备管理502.4.1使用运行时API查询GPU信息502.4.2确定最优GPU532.4.3使用nvidia-smi查询GPU信息532.4.4在运行时设置设备542.5总结542.6习题55第3章CUDA执行模型563.1CUDA执行模型概述563.1.1GPU架构概述573.1.2Fermi架构593.1.3Kepler架构613.1.4配置文件驱动优化653.2理解线程束执行的本质673.2.1线程束和线程块673.2.2线程束分化693.2.3资源分配743.2.4延迟隐藏763.2.5占用率783.2.6同步813.2.7可扩展性823.3并行性的表现833.3.1用nvprof检测活跃的线程束843.3.2用nvprof检测内存操作853.3.3增大并行性863.4避免分支分化883.4.1并行归约问题883.4.2并行归约中的分化893.4.3改善并行归约的分化933.4.4交错配对的归约953.5展开循环973.5.1展开的归约973.5.2展开线程的归约993.5.3完全展开的归约1013.5.4模板函数的归约1023.6动态并行1043.6.1嵌套执行1053.6.2在GPU上嵌套HelloWorld1063.6.3嵌套归约1093.7总结1133.8习题113第4章全局内存1154.1CUDA内存模型概述1154.1.1内存层次结构的优点1164.1.2CUDA内存模型1174.2内存管理1244.2.1内存分配和释放1244.2.2内存传输1254.2.3固定内存1274.2.4零拷贝内存1284.2.5统一虚拟寻址1334.2.6统一内存寻址1344.3内存访问模式1354.3.1对齐与合并访问1354.3.2全局内存读取1

200 pages, Paperback

First published January 1, 2014

25 people are currently reading
47 people want to read

About the author

新华书店北美网

47.5k books2 followers

Ratings & Reviews

What do you think?
Rate this book

Friends & Following

Create a free account to discover what your friends think of this book!

Community Reviews

5 stars
9 (40%)
4 stars
11 (50%)
3 stars
2 (9%)
2 stars
0 (0%)
1 star
0 (0%)
Displaying 1 of 1 review
Displaying 1 of 1 review

Can't find what you're looking for?

Get help and learn more about the design.