جهش سختافزاری و نرمافزاری Blackwell انویدیا
۴۵ درصد سرعت بیشتر نسبت به GB200 انویدیا در تستهای هوش مصنوعی
انویدیا بار دیگر رکورد های خودش را در بنچمارک های MLPerf شکست. این بار با استفاده از نسل جدید Blackwell Ultra GB300 NVL72 توانسته در تست DeepSeek R1، تا ۴۵ درصد سریع تر از پلتفرم GB200 عمل کند. ترکیب بهبود های سخت افزاری و نرم افزاری باعث شده GB300 در اجرای مجموعه ای از مدل های معروف هوش مصنوعی بهترین نتیجه را بگیرد
معماری Blackwell همان چیزی است که در کارتهای گرافیک سری RTX 50 استفاده میشود کارت هایی که بهترین تجربه بازی را ارائه میدهند، اما قدرت اصلی Blackwell در مراکز داده و پلتفرم های عظیم GPU مثل GB200 نمایان میشود. نسخه جدید و قوی تر آن یعنی GB300 Ultra حالا وارد میدان شده و رکوردهای تازه ای در MLPerf ثبت کرده است.
مدل هایی که آزمایش شدند
نسخه اخیر بنچمارک MLPerf روی مدلهای هوش مصنوعی مختلفی اجرا شد: DeepSeek R1، Llama 3.1 405B، Llama 3.1 8B و Whisper
در همه این تستها، GB300 بهترین عملکرد را داشت:
-
۴۵٪ سرعت بیشتر نسبت به GB200 روی مدل DeepSeek
-
تا ۵ برابر سرعت بالاتر نسبت به کارتهای قدیمیتر Hopper
دلیل این جهش کارایی
این پیشرفت ها فقط به خاطر سخت افزار قوی تر نیست، بلکه مجموعه ای از تغییرات سخت افزاری و نرم افزاری با هم باعث شده اند:
-
استفاده از هسته های جدید Blackwell که سرعت پردازش بخش های مهم مدل های هوش مصنوعی را تا ۲ برابر افزایش داده و توان پردازشی را ۱.۵ برابر بیشتر کرده است.
-
بهره گیری از فرمت NVFP4 برای کوچکتر کردن مدل DeepSeek R1 و سریع تر شدن محاسبات بدون کاهش دقت.
-
تقسیم مدل های خیلی بزرگ مثل Llama 3.1 405B بین چند GPU بهصورت همزمان، که به لطف سرعت فوق العاده بالای NVLink امکان پذیر شده است؛ جایی که هرکدام از ۷۲ GPU با سرعت 1.8 ترابایت بر ثانیه به هم متصل هستند و مجموعاً ۱۳۰ ترابایت بر ثانیه پهنای باند دارند.
هدف نهایی انویدیا
انویدیا میگوید Blackwell Ultra میتواند در راهاندازی هوش مصنوعی یک تغییر اقتصادی بزرگ ایجاد کند. چرا که با توان پردازشی بیشتر و نرم افزار بهینهتر، GB300 پلتفرمی سودآورتر برای مراکز داده آینده خواهد بود.
با توجه به اینکه ارسال GB300 از همین ماه شروع میشود، انتشار این نتایج دقیقاً در همین زمان کاملاً حساب شده به نظر میرسد.