» انویدیا » جهش سخت‌افزاری و نرم‌افزاری Blackwell انویدیا
جهش سخت‌افزاری و نرم‌افزاری Blackwell انویدیا
انویدیا - تکنولوژی - هوش مصنوعی

جهش سخت‌افزاری و نرم‌افزاری Blackwell انویدیا

شهریور ۲۲, ۱۴۰۴ 0025

۴۵ درصد سرعت بیشتر نسبت به GB200 انویدیا در تست‌های هوش مصنوعی

انویدیا بار دیگر رکورد های خودش را در بنچمارک‌ های MLPerf شکست. این بار با استفاده از نسل جدید Blackwell Ultra GB300 NVL72 توانسته در تست DeepSeek R1، تا ۴۵ درصد سریع‌ تر از پلتفرم GB200 عمل کند. ترکیب بهبود های سخت‌ افزاری و نرم‌ افزاری باعث شده GB300 در اجرای مجموعه‌ ای از مدل‌ های معروف هوش مصنوعی بهترین نتیجه را بگیرد

معماری Blackwell همان چیزی است که در کارت‌های گرافیک سری RTX 50 استفاده میشود کارت‌ هایی که بهترین تجربه بازی را ارائه میدهند،  اما قدرت اصلی Blackwell در مراکز داده و پلتفرم‌ های عظیم GPU مثل GB200 نمایان میشود. نسخه جدید و قوی‌ تر آن یعنی GB300 Ultra حالا وارد میدان شده و رکوردهای تازه‌ ای در MLPerf ثبت کرده است.

مدل‌ هایی که آزمایش شدند

نسخه اخیر بنچمارک MLPerf روی مدل‌های هوش مصنوعی مختلفی اجرا شد: DeepSeek R1، Llama 3.1 405B، Llama 3.1 8B و Whisper

در همه این تست‌ها، GB300 بهترین عملکرد را داشت:

  • ۴۵٪ سرعت بیشتر نسبت به GB200 روی مدل DeepSeek

  • تا ۵ برابر سرعت بالاتر نسبت به کارت‌های قدیمی‌تر Hopper

جهش سخت‌افزاری و نرم‌افزاری Blackwell انویدیا
جهش سخت‌افزاری و نرم‌افزاری Blackwell انویدیا

دلیل این جهش کارایی

این پیشرفت‌ ها فقط به خاطر سخت‌ افزار قوی‌ تر نیست، بلکه مجموعه‌ ای از تغییرات سخت‌ افزاری و نرم‌ افزاری با هم باعث شده‌ اند:

  • استفاده از هسته‌ های جدید Blackwell که سرعت پردازش بخش‌ های مهم مدل‌ های هوش مصنوعی را تا ۲ برابر افزایش داده و توان پردازشی را ۱.۵ برابر بیشتر کرده است.

  • بهره‌ گیری از فرمت NVFP4 برای کوچک‌تر کردن مدل DeepSeek R1 و سریع‌ تر شدن محاسبات بدون کاهش دقت.

  • تقسیم مدل‌ های خیلی بزرگ مثل Llama 3.1 405B بین چند GPU به‌صورت همزمان، که به لطف سرعت فوق‌ العاده بالای NVLink امکان‌ پذیر شده است؛ جایی که هرکدام از ۷۲ GPU با سرعت 1.8 ترابایت بر ثانیه به هم متصل هستند و مجموعاً ۱۳۰ ترابایت بر ثانیه پهنای‌ باند دارند.

هدف نهایی انویدیا

انویدیا میگوید Blackwell Ultra میتواند در راه‌اندازی  هوش مصنوعی یک تغییر اقتصادی بزرگ ایجاد کند. چرا که با توان پردازشی بیشتر و نرم‌ افزار بهینه‌تر، GB300 پلتفرمی سودآورتر برای مراکز داده آینده خواهد بود.
با توجه به اینکه ارسال GB300 از همین ماه شروع میشود، انتشار این نتایج دقیقاً در همین زمان کاملاً حساب‌ شده به نظر میرسد.

به این نوشته امتیاز بدهید!

محمدرضا شیرین آبادی

محمدرضا شیرین آبادی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

  • ×