Nvidia ra mắt Blackwell Ultra B300 AI GPU, thống trị thị trường phần cứng AI

Bởi admin vào 24 Tháng Sáu, 2025

Tại hội nghị GTC thường niên mới đây, Nvidia đã khẳng định vị thế độc tôn trong ngành công nghiệp chip trí tuệ nhân tạo với loạt công bố đột phá về các kiến trúc GPU thế hệ mới. Nổi bật nhất trong số đó là Blackwell Ultra, dòng sản phẩm nâng cấp từ nền tảng Blackwell hiện tại, hứa hẹn mang đến hiệu năng vượt trội cho các ứng dụng AI phức tạp. Cùng Phong Vũ Tech News tìm hiểu chi tiết về sản phẩm mới này của NVIDIA trong bài viết dưới đây nhé!

Chiến lược phát hành sản phẩm mới

Theo chia sẻ từ CEO Jensen Huang, Nvidia đang thay đổi chiến lược phát hành sản phẩm từ chu kỳ hai năm một lần sang mỗi năm một lần, nhằm đáp ứng nhu cầu ngày càng tăng của thị trường AI. Lộ trình sản phẩm mới bao gồm Blackwell Ultra dự kiến ra mắt vào nửa cuối năm 2025, tiếp theo là kiến trúc Vera Rubin vào năm 2026 và Rubin Ultra (hay còn gọi là Rubin Next) vào năm 2027.

Sự thay đổi này không chỉ phản ánh năng lực phát triển công nghệ vượt trội của Nvidia mà còn thể hiện tham vọng duy trì vị thế dẫn đầu trong cuộc đua AI đang diễn ra vô cùng khốc liệt.

Blackwell Ultra: Vượt qua giới hạn của Blackwell

Năm 2024, kiến trúc Blackwell đã trở thành tâm điểm chú ý của ngành công nghệ với những bộ xử lý như GB200 mang lại hiệu suất vượt trội cho các doanh nghiệp ứng dụng AI. Tuy nhiên, quá trình sản xuất hàng loạt thiết kế phức tạp này đã gặp không ít khó khăn, dẫn đến việc chậm trễ trong lịch giao hàng từ Quý III/2024 sang năm 2025.

Giữa làn sóng đồn đoán về những sai sót trong thiết kế của nền tảng Blackwell, Jensen Huang đã công bố phiên bản nâng cấp mang tên Blackwell Ultra. Dù không phải là một kiến trúc hoàn toàn mới, Blackwell Ultra vẫn mang đến những cải tiến đáng kể so với thế hệ trước.

Cụ thể, một chip Blackwell Ultra đơn lẻ sở hữu hiệu năng AI đạt 20 petaflops, tương đương với Blackwell, nhưng được trang bị bộ nhớ HBM3e lên đến 288 GB – tăng đáng kể so với bộ nhớ 192 GB của Blackwell. Điều này đặc biệt quan trọng đối với các mô hình AI lớn đòi hỏi khả năng truy cập dữ liệu nhanh chóng và xử lý khối lượng thông tin khổng lồ.

So với dòng H100 ra mắt năm 2022, Blackwell Ultra mang lại hiệu năng suy luận FP4 gấp 1.5 lần và tăng tốc đáng kể khả năng "lý luận AI". Đặc biệt, cụm NVL72 sử dụng Blackwell Ultra có thể chạy mô hình ngôn ngữ lớn DeepSeek-R1 671B và đưa ra câu trả lời chỉ trong 10 giây, một bước nhảy vọt so với 1,5 phút của H100. Chip mới này còn có khả năng xử lý tới 1.000 token mỗi giây, gấp 10 lần so với H100.

Niềm tin của thị trường vào sức mạnh của kiến trúc mới được thể hiện qua việc các khách hàng lớn đã đặt mua số lượng chip Blackwell gấp 3 lần so với Hopper, cho thấy nhu cầu mạnh mẽ đối với công nghệ này.

Vera Rubin: Kiến trúc GPU thế hệ tiếp theo

Không dừng lại ở Blackwell Ultra, Nvidia còn hé lộ về kiến trúc GPU thế hệ tiếp theo mang tên Vera Rubin, dự kiến ra mắt vào nửa cuối năm 2026. Hệ thống này bao gồm hai thành phần chính là CPU Vera (thiết kế CPU tùy chỉnh đầu tiên của Nvidia dựa trên kiến trúc Olympus) và GPU Rubin.

Theo thông tin từ The Verge, CPU Vera được thiết kế với tốc độ nhanh gấp đôi CPU được sử dụng trong chip Grace Blackwell năm 2024. Trong khi đó, GPU Rubin hứa hẹn mang lại hiệu suất vượt trội với khả năng quản lý 50 petaflops khi thực hiện suy luận, hơn gấp đôi so với 20 petaflops của chip Blackwell hiện tại. Rubin cũng hỗ trợ bộ nhớ nhanh lên đến 288 GB, một thông số quan trọng đối với các nhà phát triển AI.

Một thay đổi đáng chú ý trong kiến trúc Rubin là cách Nvidia định nghĩa lại khái niệm GPU. Thay vì xem xét một chip duy nhất được lắp ráp từ nhiều thành phần là một GPU, Nvidia sẽ gọi mỗi thành phần là một GPU riêng biệt khi chúng được kết hợp lại. Điều này đồng nghĩa chip Rubin sẽ có tới hai GPU trên một con chip, mở ra tiềm năng mở rộng đáng kể cho hiệu năng xử lý AI.

Rubin Ultra và tầm nhìn dài hạn

Tiếp nối Vera Rubin, Nvidia dự kiến ra mắt Rubin Ultra vào nửa cuối năm 2027. Rubin Ultra sẽ là một bước tiến lớn về hiệu năng, khi một chip duy nhất sẽ chứa hai GPU Rubin kết nối với nhau, mang lại hiệu suất FP4 lên đến 100 petaflops – gấp đôi so với GPU Rubin. Ngoài ra, bộ nhớ của Rubin Ultra cũng được nâng cấp đáng kể đạt 1 TB, mở ra khả năng xử lý các mô hình AI phức tạp hơn nữa.

Trong tầm nhìn dài hạn, Nvidia tiếp tục hé lộ về kiến trúc chip sau Vera Rubin, dự kiến ra mắt vào năm 2028, sẽ được đặt tên là Feynman dựa theo tên nhà vật lý lý thuyết nổi tiếng Richard Feynman.

Tác động đến thị trường AI

NVIDIA giới thiệu sản phẩm mới tạo nên tác động mạnh mẽ vào thị trường công nghệ

Những công bố mới này diễn ra trong bối cảnh Nvidia đang hưởng lợi lớn từ sự bùng nổ của AI. Doanh số của công ty đã tăng 6 lần kể từ khi ChatGPT ra mắt, nhờ vào sự thống trị của GPU Nvidia trong lĩnh vực phát triển AI.

Nhu cầu về sức mạnh tính toán AI đang tăng trưởng với tốc độ chóng mặt và CEO Jensen Huang tin rằng ngành công nghiệp cần sức mạnh tính toán gấp 100 lần so với dự đoán của năm 2024 để đáp ứng nhu cầu này. Một điểm nhấn đáng chú ý tại GTC 2025 là việc Nvidia đang hợp tác chặt chẽ với các công ty AI hàng đầu, bao gồm cả DeepSeek của Trung Quốc. Việc sử dụng mô hình R1 của DeepSeek để đo điểm chuẩn cho các chip mới cho thấy Nvidia chú trọng đến hiệu suất trong các tác vụ suy luận phức tạp, đồng thời mở rộng tầm ảnh hưởng trên toàn cầu.

Với lộ trình phát triển sản phẩm đầy tham vọng từ Blackwell Ultra đến Feynman, Nvidia không chỉ khẳng định vị thế thống trị trong thị trường phần cứng AI mà còn định hình tương lai của ngành công nghiệp trí tuệ nhân tạo trong nhiều năm tới. Theo dõi Phong Vũ Tech News để tiếp tục cập nhật thêm nhiều tin tức mới của Nvidia và các tin công nghệ hấp dẫn khác nhé!