安培微架构

Nvidia Ampere
制造工艺	台積電 7 nm（专业）; 三星 8 nm（消费）;
历史
前代产品	图灵（消费）; 伏打（专业）;
后继产品	愛達·勒芙蕾絲（英语：Ada Lovelace (microarchitecture)）（消费）; 霍普（英语：Hopper (microarchitecture)）（专业）;

安培微架构（Ampere）是NVIDIA于2020年5月发布的一个GPU架构。用以取代圖靈微架構（Turing microarchitecture）。命名為「安培」以向法國物理學家安德烈-馬里·安培（André-Marie Ampère）致敬。Ampere架构拥有晶体管达540亿，是三星8nm级芯片。^[1]是世界上晶体管最多的晶片，直到後來被蘋果M1 Max擊敗^[2]。

NVIDIA在 GTC 2022 上宣布了安培微架构的繼任者霍普微架构（英语：Hopper (microarchitecture)霍普）(Hopper)，並在 2021 年 GPU 技術大會上宣布了 2024 年發布的「Ampere Next Next」。

硬件

NVIDIA A100 Tensor Core GPU基于NVIDIA Ampere架构，是针对 AI、数据分析和 HPC的GPU。^[3]

DGX A100系统集成8个NVIDIA A100 Tensor Core GPU、有着320GB内存，拥有NVIDIA Mellanox® HDR 200Gbps互连以及5Petaflops 的AI性能。^[4]

DGX SuperPOD是140台DGX A100系统运用MellanoxHDR 200Gbps InfiniBand互连技术组成的一个集群，AI计算能力达到了700Petaflops。^[5]

NVIDIA EGX™ A100是NVIDIA于2020年5月发布的基于Ampere架构的一款边缘AI平台。^[6]

NVIDIA GeForce 30系列
- GeForce RTX 3050
- GeForce RTX 3060
- GeForce RTX 3060Ti
- GeForce RTX 3070
- GeForec RTX 3070Ti
- GeForce RTX 3080 10GB
- GeForce RTX 3080 12GB
- GeForce RTX 3080Ti
- GeForce RTX 3090
- GeForce RTX 3090Ti

核心配置


核心代号	GPC	SM/GPC	每个SM含有的各类核心						制程	显存支持	芯片面积（mm²）	晶体管数（亿个）
核心代号	GPC	SM/GPC	单精度浮点核心	双精度浮点核心	32位整数核心	张量运算核心	光线追踪核心	纹理映射单元	制程	显存支持	芯片面积（mm²）	晶体管数（亿个）
GA100	8	16	64	32	64	4	-	4	台积电 7nm	HBM2	826	542
GA102	7	12	128	-			1		三星 8nm	GDDR6X	628	283
GA104	4	12	128	-			1		三星 8nm	GDDR6	393	174

在作为计算卡专用的GA100核心中，和其前身一样，每个SM中安排有32个双精度浮点核心；在作为非计算卡使用的GA102等核心中，这些双精度浮点核心被替换为两倍数量的单精度浮点核心。由于单精度浮点核心事实上作为绝大多数游戏的流处理器，因此单个SM表观流处理器数量达到上一代的2倍，RTX 3070的流处理器数量达到近6千个，接近上代旗舰RTX 2080 Ti；但相应的，用单精度浮点核心模拟双精度的效率并不高，因此游戏显卡的双精度浮点计算速度（主要作用于挖矿和深度学习等应用）相较上代并没有明显提升。
晶体管密度：GA100使用台积电7nm制程达到约6600万/mm²，GA102、GA104使用三星8nm制程达到约4500万/mm²，而上代的图灵全系列均使用台积电12nm制程，仅达到约2500万/mm²。
A100显卡中每个SM私有的L1/共享内存容量达到了192KB，相比于前代V100显卡的128KB增加了1.5倍。

记录

2020年7月，根据MLPerf基准测试结果，NVIDIA宣布安培打破16项世界纪录，包括加速器的八项基准测试和集群DGX SuperPOD的八项。^[7]

參考資料

^ 英伟达发布全新数据中心GPU-新浪网. www.finance.sina.com.cn/. 2020-05-19 [2020-08-30]. （原始内容存档于2022-05-09）（中文（中国大陆））.
^ 存档副本. [2021-10-20]. （原始内容存档于2022-05-09）.
^ 百度智能云基于全新NVIDIA A100 Tensor Core GPU为客户提供更强AI算力-中国信息网. www.cscaa.org.cn/. 2020-05-15 [2020-08-30]. （原始内容存档于2021-03-18）（中文（中国大陆））.
^ 性能提升20倍：英伟达GPU旗舰A100登场，全新7nm架构安培出炉 -新浪网. www.tech.sina.com.cn/. 2020-05-15 [2020-08-30]. （原始内容存档于2020-05-21）（中文（中国大陆））.
^ NVIDIA DGX A100帮助对抗COVID-19-新浪网. www.finance.sina.com.cn/. 2020-05-14 [2020-08-30]. （原始内容存档于2020-05-21）（中文（中国大陆））.
^ 英伟达正式发布7nm安培GPU：八代史上性能最大飞跃-新浪网. www.tech.sina.com.cn/. 2020-05-14 [2020-08-30]. （原始内容存档于2020-05-21）（中文（中国大陆））.
^ NVIDIA安培打破16项世界纪录：一年半性能暴增4倍-新浪网. www.tech.sina.com.cn/. 2020-07-30 [2020-08-30]. （原始内容存档于2020-08-01）（中文（中国大陆））.

外部链接

NVIDIA A100 Tensor Core GPU Architecture whitepaper （页面存档备份，存于互联网档案馆）
Nvidia Ampere Architecture （页面存档备份，存于互联网档案馆）
Nvidia A100 Tensor Core GPU （页面存档备份，存于互联网档案馆）
NVIDIA Ampere Architecture In-Depth （页面存档备份，存于互联网档案馆）

[1] 英伟达发布全新数据中心GPU-新浪网. www.finance.sina.com.cn/. 2020-05-19 [2020-08-30]. （原始内容存档于2022-05-09）（中文（中国大陆））.

[2] 存档副本. [2021-10-20]. （原始内容存档于2022-05-09）.

[3] 百度智能云基于全新NVIDIA A100 Tensor Core GPU为客户提供更强AI算力-中国信息网. www.cscaa.org.cn/. 2020-05-15 [2020-08-30]. （原始内容存档于2021-03-18）（中文（中国大陆））.

[4] 性能提升20倍：英伟达GPU旗舰A100登场，全新7nm架构安培出炉 -新浪网. www.tech.sina.com.cn/. 2020-05-15 [2020-08-30]. （原始内容存档于2020-05-21）（中文（中国大陆））.

[5] NVIDIA DGX A100帮助对抗COVID-19-新浪网. www.finance.sina.com.cn/. 2020-05-14 [2020-08-30]. （原始内容存档于2020-05-21）（中文（中国大陆））.

[6] 英伟达正式发布7nm安培GPU：八代史上性能最大飞跃-新浪网. www.tech.sina.com.cn/. 2020-05-14 [2020-08-30]. （原始内容存档于2020-05-21）（中文（中国大陆））.

[7] NVIDIA安培打破16项世界纪录：一年半性能暴增4倍-新浪网. www.tech.sina.com.cn/. 2020-07-30 [2020-08-30]. （原始内容存档于2020-08-01）（中文（中国大陆））.

[1]

[2]

[3]

[4]

[5]

[6]

[7]