Nvidia Ampere制造工艺 | |
---|
|
前代产品 | |
---|
后继产品 | |
---|
安培微架构(Ampere)是NVIDIA于2020年5月发布的一个GPU架构。用以取代圖靈微架構(Turing microarchitecture)。命名為「安培」以向法國物理學家安德烈-馬里·安培(André-Marie Ampère)致敬。Ampere架构拥有晶体管达540亿,是三星8nm级芯片。[1]是世界上晶体管最多的晶片,直到後來被蘋果M1 Max擊敗[2]。
NVIDIA在 GTC 2022 上宣布了安培微架构的繼任者霍普微架构(Hopper),並在 2021 年 GPU 技術大會上宣布了 2024 年發布的「Ampere Next Next」。
硬件
- NVIDIA A100 Tensor Core GPU基于NVIDIA Ampere架构,是针对 AI、数据分析和 HPC的GPU。[3]
- DGX A100系统集成8个NVIDIA A100 Tensor Core GPU、有着320GB内存,拥有NVIDIA Mellanox® HDR 200Gbps互连以及5Petaflops 的AI性能。[4]
- DGX SuperPOD是140台DGX A100系统运用MellanoxHDR 200Gbps InfiniBand互连技术组成的一个集群,AI计算能力达到了700Petaflops。[5]
- NVIDIA EGX™ A100是NVIDIA于2020年5月发布的基于Ampere架构的一款边缘AI平台。[6]
- NVIDIA GeForce 30系列
- GeForce RTX 3050
- GeForce RTX 3060
- GeForce RTX 3060Ti
- GeForce RTX 3070
- GeForec RTX 3070Ti
- GeForce RTX 3080 10GB
- GeForce RTX 3080 12GB
- GeForce RTX 3080Ti
- GeForce RTX 3090
- GeForce RTX 3090Ti
核心配置
核心代号
|
GPC
|
SM/GPC
|
每个SM含有的各类核心
|
制程
|
显存支持
|
芯片面积(mm2)
|
晶体管数(亿个)
|
单精度浮点核心
|
双精度浮点核心
|
32位整数核心
|
张量运算核心
|
光线追踪核心
|
纹理映射单元
|
GA100
|
8
|
16
|
64
|
32
|
64
|
4
|
-
|
4
|
台积电 7nm
|
HBM2
|
826
|
542
|
GA102
|
7
|
12
|
128
|
-
|
1
|
三星 8nm
|
GDDR6X
|
628
|
283
|
GA104
|
4
|
GDDR6
|
393
|
174
|
- 在作为计算卡专用的GA100核心中,和其前身一样,每个SM中安排有32个双精度浮点核心;在作为非计算卡使用的GA102等核心中,这些双精度浮点核心被替换为两倍数量的单精度浮点核心。由于单精度浮点核心事实上作为绝大多数游戏的流处理器,因此单个SM表观流处理器数量达到上一代的2倍,RTX 3070的流处理器数量达到近6千个,接近上代旗舰RTX 2080 Ti;但相应的,用单精度浮点核心模拟双精度的效率并不高,因此游戏显卡的双精度浮点计算速度(主要作用于挖矿和深度学习等应用)相较上代并没有明显提升。
- 晶体管密度:GA100使用台积电7nm制程达到约6600万/mm2,GA102、GA104使用三星8nm制程达到约4500万/mm2,而上代的图灵全系列均使用台积电12nm制程,仅达到约2500万/mm2。
- A100显卡中每个SM私有的L1/共享内存容量达到了192KB,相比于前代V100显卡的128KB增加了1.5倍。
记录
2020年7月,根据MLPerf基准测试结果,NVIDIA宣布安培打破16项世界纪录,包括加速器的八项基准测试和集群DGX SuperPOD的八项。[7]
參考資料
外部链接