
NVIDIA Blackwell là nền tảng kiến trúc của dòng GPU RTX 50-series, bài này tôi sẽ giải thích những chức năng cốt lõi, quan trọng của Blackwell và dòng GPU RTX 50-series.
Điểm nổi bật của kiến trúc RTX Blackwell
- Tối ưu hóa khối lượng công việc nơ-ron thần kinh mới (neural workloads)
- Giảm dấu chân bộ nhớ (memory footprint)
- Chất lượng mới cho service
- Hiệu quả năng lượng
- Blackwell là dòng GPU hỗ trợ DisplayPort 2.1 UHBR20 (80 Gbps) thay cho DisplayPort 1.4a.
- Hỗ trợ PCIe 5.0 (tuy nhiên có thể không áp dụng cho tất cả dòng RTX 50-series)
- Mã hóa và giải mã video được cải tiến, hỗ trợ các luồng video 4:2:2.
Nhìn chung, có rất nhiều thứ được kế thừa từ kiến trúc Ada Lovelace của dòng RTX 40-series. Các nâng cấp và cải tiến chủ yếu xoay quanh AI và các công nghệ kết xuất thần kinh.
1. Tensor core FP4
Nền tảng NVIDIA Blackwell, điển hình là GPU RTX 50-series tự hào có Tensor Core thế hệ thứ năm với phép tính dấu phẩy động 4 bit (FP4). Đây là công nghệ không thể thiếu để tăng tốc các mô hình AI tạo sinh hiện đại. Trên card đồ họa dòng RTX 50-series, bạn nhận được hiệu suất AI lên đến hàng 3000-4000 TOPS, phần lớn sự gia tăng này đến từ hỗ trợ FP4 gốc. Nếu đem so sánh trực tiếp với thế hệ trước (RTX 40-series) thì nó tăng hơn khoảng 25%.
2. Tối ưu hóa Neural Shaders
Theo xu hướng ứng dụng và phát triển AI, NVIDIA đã làm cho các lõi shader trong Blackwell hoàn toàn tương thích với FP32/INT32. Ở thế hệ trước, NVIDIA chia lõi CUDA ra một phần cho FP32 và một phần cho INT32, nhưng ở thể hệ Blackwell này, họ đã gộp tất cả lõi CUDA lại.
NVIDIA cũng đã thay đổi một số thứ trong luồng kết xuất shader để cho phép hòa trộn tốt hơn giữa shader và tensor, đây là thứ mà họ gọi là Neural Shaders (thay vì chỉ là Shaders). Điều này sẽ giúp tăng hiệu suất xử lý lõi của GPU so với các thế hệ trước, đặc biệt là trong các tác vụ AI. Những thay đổi cụ thể được NVIDIA giữ kín, nhưng có lẽ đó một phần trong số đó đến từ việc cải tiến SER (Shader Execution Reordering), nó đã nhanh gấp đôi trên Blackwell so với trên Ada.
3. Tiêu chuẩn VRAM thế hệ mới GDDR7
Một điều hay ho đáng kể đó là Blackwell đã hỗ trợ tiêu chuẩn VRAM GDDR7 mới. Đây là một sự thay đổi lớn bởi vì VRAM GDDR6 đã sử dụng từ đời RTX 20-series (năm 2018), qua nhiều đời rồi, nó chỉ có tốc độ 14Gbps, hay bản nâng cấp GDDR6X cũng chỉ có tốc độ 21Gbps. Nhưng với GDDP7, tốc độ lên đến 28-30Gbps (nhanh hơn 33%).
4. Bộ xử lý quản lý AI
AI Management Processor (bộ xử lý quản lý AI) là một tính năng mới của kiến trúc Blackwell, nhằm tối ưu tài nguyên trong quá trình xử lý các tác vụ AI.
Bây giờ mọi thứ có xu hướng cần đến AI để tối ưu, các game ngày càng nâng cấp, từ kết cấu thần kinh, tạo khung hình, đến NPC AI,… NVIDIA muốn tận dụng AI xử lý các yêu cầu này một cách hiệu quả. Đó là một khối lượng công việc rất lớn, cần một bộ quản lý tài nguyên tốt hơn. AI Management Processor sẽ sắp xếp các tiến trình chờ xử lý và quyết định tiến trình nào cần hoàn thành trước, ví dụ một tác vụ tạo văn bản có thể chờ một chút để ưu tiên cho tác vụ tạo khung hình được xử lý trước.
5. Cải tiến về nguồn và tiết kiệm điện
Blackwell cũng được cải tiến về nguồn và quản lý năng lượng. Nó có khả năng vào trạng thái ngủ sâu (deep sleep) nhanh hơn so với thế hệ trước, giúp tiết kiệm năng lượng hơn. Đi kèm với đó là khả năng thoát trạng thái ngủ sâu (deep sleep) nhanh hơn, giúm giảm thời gian chờ.
Trên đây là những điểm chính cần biết về Blackwell, nhiều thứ đã được nâng cấp và cải tiến đáng kể, đặc biệt là hiệu suất AI. Bạn có câu hỏi nào không? Hãy để lại phản hồi của bạn nhé.