第10章 并行测试和调优 379
10.1 准备并行测试 379
10.1.1 使用性能剖析功能 383
10.1.2 测量并发性 385
10.2 常见问题模式的解决方案 394
10.2.1 串行化的执行 395
10.2.2 锁争用 397
10.2.3 锁封护 398
10.2.4 申请超额 401
10.2.5 申请不足 404
10.2.6 分区问题 406
10.2.7 工作站垃圾回收开销 408
10.2.8 使用服务器垃圾回收 411
10.2.9 I/O瓶颈 412
10.2.10 主线程过载 413
10.3 理解伪共享 416
10.4 小结 419
第11章 向量化、SIMD指令以及其他并行库 421
11.1 理解SIMD和向量化 421
11.2 从MMX到SSE4.X和AVX 423
11.3 使用Intel Math KernelLibrary 425
11.3.1 使用适用于多核的高度优化的软件函数 433
11.3.2 将基于任务的编程和外部优化的库混合使用 434
11.3.3 并行生成伪随机数 434
11.4 使用Intel IntegratedPerformance Primitives 439
11.5 小结 445
附录A .NET 4中与并行相关的类图 447
附录B 并发UML模型 461
附录C Parallel Extensions Extras 469