导语
内容提要
《高性能并行珠玑(多核和众核编程方法)》由Intel的技术专家詹姆斯·赖因德斯、吉姆·杰弗斯等撰写,全面系统地讲解在Intel Xeon处理器和Intel Xeon Phi协处理器上进行并行处理和编程的方法和技术,展示了利用Intel处理器或其他多核处理器系统计算潜力的有效方法。全书包括大量来自多个行业和不同领域的并行编程例子。每章既详细讲述所采用的编程技术,同时展示了其在Intel Xeon Phi协处理器和多核处理器上的高性能结果。大量案例显示的“成功经验”不但展现了这些强大系统的主要特征,而且展示出如何在这些异构系统上保持并行化。
目录
出版者的话
译者序
推荐序
前言
作者简介
第1章 引言
第2章 从正确到正确&高效:Godunov格式的Hydro2D案例学习
第3章 HBM上的SIMD与并发优化
第4章 流体动力学方程优化
第5章 分阶段准同步栅栏
第6章 故障树表达式并行求解
第7章 深度学习的数值优化
第8章 优化聚集/分散模式
第9章 N体问题直接法的众核实现
第10章 N体方法
第11章 使用OpenMP 4.0实现动态负载均衡
第12章 并发内核卸载
第13章 MPI和异构计算
第14章 Intel Xeon Phi协处理器功耗分析
第15章 集成Intel Xeon Phi协处理器至集群环境
第16章 在Intel Xeon Phi协处理器上支持集群文件系统
第17章 NWChem:大规模量子化学仿真
第18章 大规模多系统上的高效嵌套并行
第19章 Black-Scholes定价的性能优化
第20章 使用Intel COI库传输数据
第21章 高性能光线追踪
第22章 OpenCL程序的可移植性能
第23章 应用到Stencil计算中的特性提取和优化方法
第24章 剖析指导优化
第25章 基于ITAC的异构MPI应用优化
第26章 集群上可扩展OOC解法器
第27章 稀疏矩阵向量乘:并行化和向量化
第28章 基于Morton排序的性能优化