培训目标:
?让学员学习理解GPU编程。
?揭秘GPU的内部架构和执行逻辑,理解其强大并行能力的硬件基础。
?软件方面,学习编程模型(CUDA、OpenCL、OpenVX、DirectX和OpenGL)、驱动模型(DRM和WDDM)和工具三个层面。
培训对象:GPU进行通用计算和图形加速的软件工程师(开发和测试)、技术经理和科研人员
学员基础:具有C++编程经验
序言:三轮演进 | 要点:VGA,TVGA,硬件加速,2D加速和3D加速,Voodo,从可配置到可编程 ,G80,GPGPU,John Nickolls,Brook和CUDA,GPU的四大功能模块 |
第几部分:在CUDA-GDB中理解CUDA | 要点:CUDA简要历史,CUDA的C扩展,kernel函数,WARP,CUDA的线程组织,准备调试环境,单GPU调试和多GPU调试,远程调试,nvcc,-G和-g选项,附加到已经运行的进程,启用kernel初始断点(break on launch),观察源代码和汇编指令,设置断点,单步跟踪,条件断点,观察CUDA的内建变量,PTX指令集,理解WARP、grid、block和thread,Grid-Stride Loops,观察GPU线程,观察GPU的调用栈,观察GPU的寄存器,观察错误信息,从GPU上打印信息 |
第二部分:使用NSight调试CUDA程序 | 要点:NSight简介,安装和设置环境信息,CUDA 9.0.props,窗口布局,在VS中编译CUDA程序,产生调试信息(-G),本地调试模型,NSight Monitor,设置断点,观察变量,在Cuda Info窗口中观察计算状态,WarpWatch,调用栈,源代码跟踪,PTX/SASS汇编调试,数据断点,API Trace,OpenCL kernel追踪,产生GPU转储(core dump),调优功能 |
时间灵活 地点灵活(北上广深、成都、武汉都有上课点),人数灵活,师资丰富
采取小班上课的特点,随时可以开班,侧重点方面可根据学员定制。还可定制培训,企业上门内训,1对1.定制培训或咨询