alignedTypes 演示了数据类型对齐对性能的影响
asyncAPI 演示了如何使用异步API
bandwidthTest 测试主存与显存之间,以及显存内部进行数据传输时的带宽,通过命令行可以进行更加全面的测试。
bicubicTexture 通过texture实现双立方插值
binomialOptions binomialOption金融分析例子程序
bitonic Bitonic排序
BlackScholes BlackScholes金融分析例子程序
boxFilter 盒型滤波器,图像处理可以参考
clock 测时函数的使用方法
convolutionFFT2D 使用二维FFT实现卷积
convolutionSeparable 二维卷积的一种实现
convolutionTexture 使用纹理实现的二维卷积
cppIntegration 如何封装CUDA函数,并在C++程序中调用
cudaOpenMP CUDA与openMP同时使用的例子
dct8x8 离散余弦变换,图像、编解码、压缩等可参考
deviceQuery 查询设备参数,运行时eAPI版本
deviceQueryDrv DeviceQueryDrv,驱动API版本
dwtHaar1D 一维哈尔变换
dxtc DirectX纹理压缩
eigenvalues 特征值分解
fastWalshTransform. 快速瓦尔希变换
fluidsD3D9 流体计算示例,D3D9实现
fluidsGL 流体计算示例,openGL实现
histogram64 直方图,64个结果
histogram256 直方图,256个结果
imageDenoising 图像降噪
lineOfSight 视线计算
Mandelbrot 分形数学计算
marchingCubes 使用marchingCubes算法细分表面
matrixMul 稠密矩阵乘法,运行时API版本
matrixMulDrv 稠密矩阵乘法,驱动API版本
MersenneTwister MersenneTwister随机数发生器
MonteCarlo 蒙特卡罗模拟
MonteCarloMultiGPU 蒙特卡罗模拟,多GPU并行版本
nbody N-body模拟星系间作用力
oceanFFT 使用FFT算法模拟海面
particles 粒子系统计算
postProcessGL OpenGL渲染后计算(模糊)
quasirandomGenerator Quasi随机数发生器
recursiveGaussian 使用递归算法实现高斯模糊
reduction 常用的并行缩减例子,演示了如何对并行缩减进行优化
scalarProd 向量缩放
scan Scan算法
scanLargeArray 对大型数组的scan
simpleAtomicIntrinsics 原子加示例
simpleCUBLAS CUBLAS使用方法
simpleCUFFT CUFFT使用方法
simpleD3D9 与D3D9互操作
simpleD3D9Texture 与D3D9纹理互操作
simpleD3D10 与D3D10互操作
simpleD3D10Texture 与D3D10纹理互操作
simpleGL 与openGL互操作
simpleMultiGPU 多GPU并行计算
simpleStreams Stream演示
simpleTemplates 模版使用演示
simpleTexture 纹理使用演示,运行时API版本
simpleTexture3D 三维纹理演示
simpleTextureDrv 纹理使用演示,驱动API版本
simpleVoteIntrinsics Vote功能演示
simpleZeroCopy ZeroCopy/Mapped Memory演示
smokeParticles 烟雾粒子系统
SobelFilter Sobel边缘检测
SobolQRNG Sobel-Quasi随机数发生器
template 用于建立新程序的模版
threadFenceReduction Fence使用演示
threadMigration 通过驱动API改变当前上下文,实现线程迁移
transpose 转置
transposeNew 改进版转置,避免了分区冲突
volumeRender 体渲染例子
分享到:
相关推荐
cuda2.3在vs2005中的配置指导
CUDA SDK是CUDA加速常常使用的优化方法的例子,包括已经实现的一些好的并行算法,这里对CUDA SDK程序进行了详细解析。
在win32XP系统中,对CUDA SDK&ToolKit2.3的配置说明
一个简单的CUDA程序,使用CUDA进行图像二值化操作,编译环境为VS2005,用到了cuda_vs_wizard进行环境设置,使用OpenCV读入和处理图像并与CUDA的处理结果做比较,这只是一个简单的示例,供入门者学习,程序本身没有做...
cuda sdk 开发的中文入门指导,东西是很不错的哟!
安装Nvidia的CUDA时会建议安装SDK,其实SDK就是一些经典的GPU并行源代码和一些函数库,这个压缩包就是将这些东西打包,供大学学习。
该资源主要由Introduction、Utilities、Concepts_and_Techniques、CUDA_Features、CUDA_Libraries等6个模块组成, 用于进行CUDA的使用示例演示。 开发者需提前安装CUDA和Cudnn(需结合电脑显卡情况), 然后使用...
NVIDIA的GPU加速CUDA的示例程序,NVIDIA的GPU加速CUDA的示例程序,NVIDIA的GPU加速CUDA的示例程序
NVIDIA早期版本的CUDA Raycasting示例程序
Nvidia CUDA-Fortran SDK
英伟达官方提供的cuda示例程序,显示cuda设备信息,供cuda入门使用,简单了解cuda原理。
几个cuda源代码示例 1.cuda矩阵例子.cu 2.实现矩阵的乘法.cu 3.... /*****************************************************************************************/ /核心代码部分,实现了矩阵的乘法运算/核心代码...
cuda程序示例代码,包括CUDA入门代码,CUDA进阶代码和CUDA实用代码,为《并行计算教程(第1版)》的配套代码
cuda检测工具 devicequery.zip(不含源代码,源代码在cuda sdk 8.0里) deviceQuery.exe Starting... CUDA Device Query (Runtime API) version (CUDART static linking) Detected 1 CUDA Capable device(s) ...
该代码集是GPU高性能编程CUDA实战一书的完全代码,如有问题请联系博主。
1.1 cudadriver_2.3_winvista_64_190.38_general 1.2 cudatoolkit_2.3_win_64 1.3 cudasdk_2.3_win_64 1.4 VS2008
在VS中配置CUDA时,本身是不识别CUDA关键字的,关键字不能高亮。早期的CUDA版本在SDK中提供了usertype.dat,其中包含CUDA的关键字,但后来的CUDA没有这个文件,网上找了好久,现在贴出来亲测可用~
CUDA并行程序设计:GPU编程指南共分为12章。 第1章 超级计算简史 第2章 使用GPU理解并行计算 第3章 CUDA硬件概述 第4章 CUDA环境搭建 第5章 线程网格、线程块以及线程 第6章 CUDA内存处理 第7章 CUDA实践之道 ...
TorchScript自定义C /CUDA运算符的示例