Dalam hal GPU, Nvidia adalah pakar terkemuka. Berada di bisnis ini sejak 1993, Nvidia telah menghasilkan berbagai macam GPU profesional dan konsumen berkualitas tinggi. Arsitektur terhormat dari prosesor mereka berada di balik kesuksesan produk mereka, terutama lini utama mereka, GeForce. GPU Nvidia melampaui ruang game, memperluas kehadirannya dalam pembelajaran mendalam, AI (Kecerdasan Buatan), dan analitik yang dipercepat. Nvidia menyusup ke pasar pusat data satu dekade lalu, dimulai dengan chip Fermi. Iterasi berikutnya dibuat, dan perusahaan terus merilis GPU yang memenuhi permintaan tak terpuaskan untuk kecepatan pemrosesan yang lebih cepat di pusat data. GPU Nvidia telah berevolusi selama bertahun-tahun, dan desain arsitektur utamanya mendorong evolusi.
Arsitektur Ampere Nvidia
Persaingan sangat ketat di antara produsen GPU, tetapi Nvidia tidak menahan apa pun untuk mengambil posisi teratas. Faktanya, Nvidia telah mendominasi pasar AI dalam dekade terakhir. Pada tahun 2020, berita tentang GPU 7nm (8nm untuk komponen konsumen) pertama Nvidia dengan 54 miliar transistor yang dikompresi sedemikian kecil membuat cukup ramai. Nama kode Amper setelah ahli matematika Prancis André-Marie Ampre, Arsitektur prosesor Nvidia meningkatkan peningkatan besar-besaran dari pendahulunya, Turing dan Volta, menjanjikan lebih banyak fungsionalitas, efisiensi yang lebih baik, dan kinerja yang lebih tinggi pada tingkat daya yang lebih rendah. Ampere berada di belakang GPU RTX generasi kedua Nvidia, seri RTX 30, dan dikatakan dua kali lebih cepat dari rekan seri RTX 20 mereka. Arsitektur Ampere juga merupakan kekuatan di balik GPU pusat data Nvidia A100.
Spesifikasi Ampere
Ampere adalah GPU 7nm/8nm pertama Nvidia, generasi kedua ray tracing konsumen, dan memiliki inti tensor generasi ketiga. Ampere adalah arsitektur dasar GPU GA100, GA102, dan GA104 yang tertanam di GeForce RTX 3090, RTX 3080, RTX 3070, dan yang terbaru, RTX 3060. Nvidia juga dijadwalkan untuk merilis RTX 3050 di bulan-bulan berikutnya. Sementara itu, GPU GA100 perusahaan memberikan daya komputasi 20x lebih banyak daripada GPU pusat data generasi sebelumnya. Berikut adalah ikhtisar GPU profesional dan konsumen berbasis Ampere Nvidia [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Kartu grafik | NVIDIA A100 A | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Proses (nm) | TSMC N7 | Samsung 8N | Samsung 8N | Samsung 8N |
Transistor (miliar) | 54 | 28.3 | 28.3 | 17.4 |
Ukuran Cetakan (mm^2) | 826 | 628.4 | 628.4 | 392.5 |
Konfigurasi GPC | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
SMS | 108 | 82 | 68 | 46 |
Inti CUDA | 6912 | 10496 | 8704 | 5888 |
Inti RT | Tidak ada | 82 | 68 | 46 |
Inti Tensor | 432 | 328 | 272 | 184 |
Meningkatkan Jam (MHz) | 1410 | 1700 | 1710 | 1730 |
Kecepatan VRAM (Gbps) | 2.43 | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (GB) | 40 (maks 48) | 24 | 10 | 8 |
Lebar Bus | 5120 (maks 6144) | 384 | 320 | 256 |
ROP | 128 | 112 | 96 | 96 |
TMU | 864 | 656 | 544 | 368 |
GFLOPS FP32 | 19492 | 35686 | 29768 | 20372 |
RT TFLOPS | T/A | 69 | 58 | 40 |
Tensor TFLOPS FP16 (kesebaran) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Bandwidth (GB/dtk) | 1555 | 936 | 760 | 448 |
TBP (watt) | 400 (250 PCIe) | 350 | 320 | 220 |
NVIDIA A100 A
Nvidia A100 adalah GPU pertama yang menggunakan arsitektur Ampere. Chip perusahaan ditargetkan pada pusat data dan dirancang untuk tugas-tugas intensif GPU seperti pembelajaran mendalam dan AI. Dibangun menggunakan proses 7nm TSMC, ini menampung 54 miliar transistor. Ini telah mengungguli GPU perusahaan generasi sebelumnya dengan peningkatan kinerja 20x yang menampilkan 6.912 inti CUDA, 432 unit pemetaan tekstur, 160 ROP, inti Tensor generasi ketiga, dan VRAM 40GB dengan bandwidth memori yang mencapai 1.6 TB/dtk. DGX A100 adalah sistem AI pertama di dunia dengan kluster delapan A100 dan label harga yang lumayan $199.000.
GeForce RTX 30 Series
Selain mendominasi pasar perusahaan, Nvidia selalu mempertimbangkan konsumen, terutama gamer dan kreator. Arsitektur Ampere juga diadopsi dalam kartu grafis konsumen Nvidia. GeForce RTX generasi kedua mengusung GPU berbasis Ampere yang meningkatkan kinerja hingga dua kali lipat dari generasi sebelumnya.
Dalam sebagian besar aspek, Ampere memiliki lebih dari dua kali kekuatan pemrosesan Turing. Ini telah menggandakan kinerja shader Turing dengan dua kali jumlah core CUDA FP32. Secara khusus, ia memiliki 30 Shader-TFLOPS, 2.7x lebih banyak dari Turing yang hanya 11 Shader-TFLOPS. Demikian juga, Tensor Core Turing mengukur pada 89 Tensor-TFLOPS, tetapi Ampere memiliki kecepatan lebih dari dua kali lipat dengan 238 Tensor-TFLOPS-nya. Tak ketinggalan rate Ray Tracing Core-nya, yaitu 58 RT-TFLOPS, 1.7x lebih cepat dari 34 RT-TFLOPS Turing, dan untuk membuat GPU berjalan lebih cepat, chip Ampere terhubung ke memori tercepat di dunia, Micron G6X.
Seri RTX 30 dibuat menggunakan Samsung 8N Nvidia Custom Process dengan 28 miliar transistor untuk GA102 dan 17 miliar transistor untuk GA104. Kelas Titan RTX 3090 ditenagai oleh GPU GA102 dan memberikan kinerja kartu konsumen yang sangat kuat. Berbeda dengan generasi sebelumnya, RTX 3090 terbuka untuk pihak ketiga untuk desain khusus.
RTX 3080 juga menggunakan GPU GA102, memberikan kinerja dua kali lipat dari RTX 2080 dan kehebatan gaming 4K yang mengesankan. RTX 3070, didukung oleh GPU GA104, setara dengan RTX 2080 Ti dengan setengah harga. RTX 3060 yang baru saja dirilis juga tidak pernah gagal untuk mengesankan dengan kinerjanya yang menakjubkan yang didorong oleh Ray Tracing Cores, Tensor Cores, multiprosesor streaming baru, dan memori G6 berkecepatan tinggi yang ditingkatkan.
Terlepas dari peningkatan kinerja yang luar biasa, GPU RTX baru tidak membebani kantong. Kartu grafis yang jauh lebih cepat mudah diakses dalam hal harga. Unggulan Nvidia GeForce, RTX 3080, mulai dari $ 699, RTX 3070 dijual seharga $ 499, dan RTX 3060 memiliki label harga $ 329. RTX 3090 kelas atas berharga $1.499; masih sangat murah mengingat kinerjanya di level Titan.
Hanya beberapa bulan setelah dirilis, dilaporkan ada kekurangan kartu grafis berbasis Ampere, dan tidak mengherankan dengan kinerja Ampere yang menakjubkan dengan harga yang wajar. Bagi mereka yang mempertimbangkan peningkatan GPU, sekarang adalah waktu terbaik untuk mendapatkan GPU berbasis Ampere Nvidia.
Sumber
[1] Walton, Jarred. “Nvidia RTX 30-Series Ampere Architecture Deep Dive: Semua yang Kami Ketahui”. https://www.perangkat keras.com/features/nvidia-ampere-architecture-deep-dive. 13 Oktober 2020.