图书介绍
可扩展并行计算 技术、结构与编程【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

- (美)黄铠,徐志伟著;陆鑫达等译 著
- 出版社: 北京:机械工业出版社
- ISBN:7111075803
- 出版时间:2000
- 标注页数:531页
- 文件大小:30MB
- 文件页数:547页
- 主题词:
PDF下载
下载说明
可扩展并行计算 技术、结构与编程PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一篇 可扩展性和机群化2
第1章 可扩展计算机平台和模型2
1.1 计算机体系结构演变3
1.1.1 计算机代3
1.1.2 可扩展计算机体系结构3
1.1.3 计算机系统体系结构发展的趋势5
1.2 可扩展性范围6
1.2.1 资源可扩展性6
1.2.3 技术可扩展性7
1.2.2 应用可扩展性7
1.3 并行计算机模型8
1.3.1 语义属性9
1.3.2 性能属性11
1.3.3 抽象机模型12
1.3.4 物理机模型16
1.4 机群化的基本概念19
1.4.1 机群特征19
1.4.2 体系结构的比较20
1.4.3 机群的优越性和难点21
1.5 可扩展设计原理23
1.5.1 独立原理24
1.5.2 平衡设计原理25
1.5.3 可扩展性设计28
1.6 参考文献注释和习题30
第2章 并行编程基础33
2.1 并行编程综述33
2.1.1 并行编程缘何艰难33
2.1.2 并行编程环境35
2.1.3 并行编程方法36
2.2.1 抽象进程的定义38
2.2 进程、任务和线程38
2.2.2 执行方式40
2.2.3 地址空间40
2.2.4 进程现场42
2.2.5 进程描述符42
2.2.6 进程控制43
2.2.7 进程的变异45
2.3 并行性问题46
2.3.1 进程中的同构性46
2.3.2 静态和动态并行性48
2.3.3 进程编组48
2.3.4 分配问题49
2.4.1 交互操作50
2.4 交互/通信问题50
2.4.2 交互方式52
2.4.3 交互模式53
2.4.4 合作和竞争交互54
2.5 并行程序中的语义问题55
2.5.1 程序的终止55
2.5.2 程序的确定性55
2.6 参考文献注释和习题56
3.1 系统和应用的基准程序59
第3章 性能指标和基准程序59
3.1.1 微基准程序60
3.1.2 并行计算的基准程序62
3.1.3 商业和TPC基准程序64
3.1.4 SPEC基准程序系列65
3.2 性能与成本66
3.2.1 执行时间和吞吐率67
3.2.2 利用率和成本有效性68
3.3 基本性能指标70
3.3.1 工作负载和速度指标70
3.3.2 防止对顺序性能误解的说明72
3.4 并行计算机性能73
3.4.1 计算特征73
3.4.2 并行性和交互开销75
3.4.3 开销定量化76
3.5 并行程序性能82
3.5.1 性能指标82
3.5.2 基准程序中的可用并行性85
3.6 可扩展性和加速比分析86
3.6.1 Amdahl定律:固定问题规模87
3.6.2 Gustafson定律:固定时间88
3.6.3 Sun和Ni定律:存储器受限90
3.6.4 等性能模型93
3.7 参考文献注释和习题95
第二篇 使能技术100
第4章 微处理器构件100
4.1 系统发展趋向100
4.1.1 硬体进展100
4.1.2 软件进展102
4.1.3 应用进展103
4.2.1 指令流水线基理105
4.2 处理器设计原理105
4.2.2 从CISC到RISC及进一步延伸108
4.2.3 体系结构性能的增强方法111
4.3 微处理器体系结构系列112
4.3.1 主要的体系结构系列112
4.3.2 超标量和超流水处理器113
4.3.3 嵌入式微处理器116
4.4 微处理器的实例研究117
4.4.1 Digital的Alpha 21164微处理器117
4.4.2 Intel高能奔腾处理器120
4.5.1 后RISC处理器特征124
4.5 后RISC,多媒体和VLIW124
4.5.2 多媒体扩展126
4.5.3 VLIW体系结构129
4.6 微处理器的未来130
4.6.1 硬件发展趋向和物理极限130
4.6.2 未来的工作负载和挑战131
4.6.3 未来微处理器的体系结构132
4.7 参考文献注释和习题134
5.1 层次存储器技术137
5.1.1 存储部件特性137
第5章 分布式存储器和时延容忍137
5.1.2 存储器层次性质139
5.1.3 存储器容量的规划141
5.2 高速缓存一致性协议142
5.2.1 高速缓存一致性问题143
5.2.2 监听一致性协议144
5.2.3 MESI监听协议145
5.3 共享存储器一致性148
5.3.1 存储器事件排序148
5.3.2 存储器一致性模型150
5.3.3 非严格的存储器模型151
5.4 分布式高速缓存/主存体系结构153
5.4.1 NORMA、NUMA、COMA和DSM模型153
5.4.2 基于目录的一致性协议158
5.4.3 斯坦福Dash多处理机159
5.4.4 Dash中基于目录的协议161
5.5 时延容忍技术163
5.5.1 时延的避免、减小和隐藏163
5.5.2 分布式一致性高速缓存164
5.5.3 数据预取策略165
5.6.1 多线程处理帆模型167
5.5.4 非严格的存储器一致性的效果167
5.6 多线程时延隐藏167
5.6.2 现场切换策略169
5.6.3 组合时延隐藏机制172
5.7 参考文献注释和习题173
第6章 系统互连和千兆位网络178
6.1 互连网络基础178
6.1.1 互连环境178
6.1.2 网络部件180
6.1.3 网络特征181
6.1.4 网络性能指标182
6.2 网络拓朴结构和性质183
6.2.1 拓扑结构和功能性质183
6.2.2 路由方案和功能184
6.2.3 网络拓扑结构187
6.3 总线、纵横交叉开关和多级开关191
6.3.1 多处理机总线191
6.3.2 纵横交叉开关193
6.3.3 多级互连网络195
6.3.4 开关互连比较197
6.4.1 光纤通道和FDDI环199
6.4 千兆位网络技术199
6.4.2 快速以太网和千兆位以太网201
6.4.3 构造SAN/LAN的Myrinet网203
6.4.4 HiPPI和超级HiPPI204
6.5 ATM交换器和网络207
6.5.1 ATM技术207
6.5.2 ATM网络接口208
6.5.3 ATM四层体系结构209
6.5.4 ATM互连网连接性能211
6.6 可扩展的一致性接口212
6.6.1 SCI互连213
6.6.2 实现问题214
6.6.3 SCI一致性协议216
6.7 网络技术比较217
6.7.1 标准网络及其发展前景217
6.7.2 网络性能和应用218
6.8 参考文献注释和习题219
第7章 线程化、同步和通信223
7.1 软件多线程化223
7.1.1 线程概念224
7.1.2 线程管理225
7.1.3 线程同步226
7.2 同步机制227
7.2.1 原子性和互斥227
7.2.2 高级同步结构230
7.2.3 低级同步原语234
7.2.4 快速锁机制237
7.3.1 TCP/IP协议组的特性239
7.3 TCP/IP通信协议组239
7.3.2 UDP、TCP和IP241
7.3.3 Sockets接口244
7.4 快速和有效通信245
7.4.1 通信中的关键问题246
7.4.2 LogP通信模型250
7.4.3 低级通信支持251
7.4.4 通信算法257
7.5 参考文献注释和习题259
8.1.1 多处理机体系结构264
8.1 SMP和CC-NUMA技术264
第8章 对称多处理机和CC-NUMA多处理机264
第三篇 系统体系结构264
8.1.2 商品化SMP服务器268
8.1.3 英特尔SHV服务器电路板269
8.2 SUN Ultra Enterprise 10000系统270
8.2.1 Ultra-E10000系统271
8.2.2 系统电路板的结构272
8.2.3 可扩展性和可用性支持273
8.2.4 动态域和性能274
8.3.1 Exemplar X系统的体系结构275
8.3 HP/Convex Exemplar X-Class275
8.3.2 Exemplar软件环境277
8.4 Sequent NUMA-Q 2000278
8.4.1 NUMA-Q 2000的体系结构278
8.4.2 NUMA-Q的软件环境281
8.4.3 NUMA-Q的性能282
8.5 SGI/Cray Origin 2000超级服务器284
8.5.1 Origin 2000系列的设计目标284
8.5.2 Origin 2000的体系结构285
8.5.3 Cellular IRIX环境290
8.5.4 Origin 2000的性能293
8.6 CC-NUMA体系结构的比较294
8.7 参考文献注释和习题296
第9章 机群化和可用性支持298
9.1 构造机群的挑战性298
9.1.1 机群的分类298
9.1.2 机群的体系结构299
9.1.3 机群设计要考虑的问题300
9.2 对机群可用性的支持302
9.2.1 可用性概念302
9.2.2 可用性技术304
9.2.3 检查点和故障恢复308
9.3 对单一系统映像的支持311
9.3.1 单一系统映像层311
9.3.2 单一入口和单一文件层次312
9.3.3 单一I/O、网络化和存储空间316
9.4 Solaris MC中的单一系统映像317
9.4.1 全局文件系统318
9.4.2 全局进程管理318
9.4.3 单一I/O系统映像319
9.5 机群的作业管理320
9.5.1 作业管理系统320
9.5.2 作业管理系统综述324
9.5.3 负载共享工具(LSF)326
9.6 参考文献注释和习题331
第10章 服务器和工作站机群334
10.1 机群产品和研究项目334
10.1.1 支持机群产品的潮流334
10.1.2 SMP服务器机群336
10.1.3 机群研究项目336
10.2 面向NT机群的微软Wolfpack338
10.2.1 微软Wolfpack配置338
10.2.3 主动可用性机群339
10.2.2 热备份多服务器机群339
10.2.4 容错多服务器机群341
10.3 IBM SP系统341
10.3.1 设计目标和策略341
10.3.2 SP2系统的体系结构343
10.3.3 I/O和网络互连345
10.3.4 SP系统软件347
10.3.5 SP2及其前景349
10.4 Digital TruCluster350
10.4.1 TruCluster体系结构350
10.4.2 存储器通道互连352
10.4.3 TruCluster编程354
10.4.4 TruCluster系统软件356
10.5 Berkeley NOW研究项目356
10.5.1 适合快速通信的主动消息357
10.5.2 适合于全局资源管理的GLUnix360
10.5.3 xFS无服务器网络文件系统361
10.6 TreadMarks:用软件实现的DSM机群366
10.6.1 边界条件366
10.6.2 DSM中的用户接口367
10.6.3 实现问题368
10.7 参考文献注释和习题369
第11章 MPP的体系结构和性能371
11.1 MPP技术概论371
11.1.1 MPP特性和要点371
11.1.2 MPP系统概述373
11.2 Cray T3E系统374
11.2.1 T3E的体系结构374
11.2.2 T3E的系统软件376
11.3 新一代ASCI/MPP系统376
11.3.1 ASCI可扩展设计策略377
11.3.2 硬件和软件需求378
11.3.3 定约的ASCI/MPP平台379
11.4 Intel/Sandia ASCI Option Red380
11.4.1 Option Red的体系结构380
11.4.2 Option Red的系统软件382
11.5 并行NAS基准程序测试结果384
11.5.1 NAS并行基准测试程序384
11.5.2 超步结构和颗粒度385
11.5.3 主存、I/O和通信386
11.6 MPI和STAP基准程序测试结果387
11.6.1 MPI性能测试388
11.6.2 MPI时延和总计(聚集)带宽389
11.6.3 MPP的STAP基准程序测试评估391
11.6.4 MPP体系结构的含义394
11.7 参考文献注释和习题396
第四篇 并行编程399
第12章 并行范例和编程模型399
12.1 范例和可编程性400
12.1.1 算法范例400
12.1.2 可编程性问题402
12.1.3 并行编程举例402
12.2.1 蕴式并行性405
12.2 并行编程模型405
12.2.2 显式并行模型407
12.2.3 四种模型的比较410
12.2.4 其他并行编程模型412
12.3 共享存储器编程413
12.3.1 ANSI X3H5共享存储器模型413
12.3.2 POSIX线程模型416
12.3.3 OpenMP标准417
12.3.4 SGI Power C模型420
12.3.5 C//:一种结构化的并行C语言422
12.4 参考文献注释和习题426
第13章 消息传递编程429
13.1 消息传递范例429
13.1.1 消息传递库429
13.1.2 消息传递方式430
13.2 消息传递接口432
13.2.1 MPI消息434
13.2.2 MPI中的消息信封439
13.2.3 点对点通信443
13.2.4 集合MPI通信445
13.2.5 MPI-2扩展448
13.3 并行虛拟机450
13.3.1 虚拟机结构451
13.3.2 PVM中的进程管理453
13.3.3 用PVM进行通信455
13.4 参考文献注释和习题458
第14章 数据并行编程462
14.1 数据并行模型462
14.2 Fortran 90方法462
14.2.1 并行数组操作463
14.2.2 Fortran 90中的本征函数464
14.3 高性能Fortran466
14.3.1 对数据并行性的支持466
14.3.2 HPF中的数据映射468
14.3.3 对Fortran 90和HPF的总结472
14.4 其他的数据并行方法474
14.4.1 Fortran 95和Fortran 2001475
14.4.2 PC++和Nesl方法477
14.5 参考文献注释和习题480
参考文献482
Web地址表510
热门推荐
- 801278.html
- 2251818.html
- 3536564.html
- 3785133.html
- 2846047.html
- 3194758.html
- 2838560.html
- 3441454.html
- 2918131.html
- 3134982.html
- http://www.ickdjs.cc/book_1325993.html
- http://www.ickdjs.cc/book_2112470.html
- http://www.ickdjs.cc/book_760632.html
- http://www.ickdjs.cc/book_2575936.html
- http://www.ickdjs.cc/book_46951.html
- http://www.ickdjs.cc/book_3619768.html
- http://www.ickdjs.cc/book_938279.html
- http://www.ickdjs.cc/book_590524.html
- http://www.ickdjs.cc/book_3847022.html
- http://www.ickdjs.cc/book_2475116.html