تراشه «ورا روبین» انویدیا سرعت پردازش دیتاسنترها را ۵ برابر می‌کند

جنسن هوانگ مدیرعامل انویدیا در نمایشگاه CES ۲۰۲۶ از پلتفرم محاسباتی Vera Rubin رونمایی کرد که با تکیه بر حافظه HBM۴ و پردازنده مرکزی اختصاصی، محدودیت‌های موجود در توسعه هوش مصنوعی استدلالی را رفع می‌کند.

نویسنده : اشکان حاسبی

کد خبر : 1024354

اشتراک گذاری

به گزارش خبرگزاری آنا؛ رونمایی از این معماری جدید در لاس‌وگاس نشان داد که بزرگ‌ترین تراشه‌سازی گرافیکی جهان استراتژی خود را تغییر داده و فاصله عرضه محصولاتش را به یک سال رسانده است تا پاسخگوی نیاز سیری‌ناپذیر شرکت‌های فناوری به قدرت محاسباتی باشد. پلتفرم روبین که نام خود را از ستاره‌شناس مشهور ماده تاریک گرفته، قرار است جایگزین زیرساخت‌های فعلی شود و طبق ادعای سازنده، هزینه‌های تولید و به‌کارگیری مدل‌های زبانی بزرگ را به شکل قابل توجهی کاهش دهد. تمرکز اصلی این نسل بر هماهنگی کامل میان پردازنده مرکزی و گرافیکی است تا داده‌ها با کمترین تأخیر ممکن جابه‌جا شوند.

خداحافظی زودهنگام با عصر بلک‌ول

نسل پیشین تراشه‌های انویدیا با نام بلک‌ول که هم‌اکنون بار اصلی پردازش‌های هوش مصنوعی در جهان را به دوش می‌کشد، استاندارد‌های سخت‌افزاری را ارتقا داده بود. معماری بلک‌ول با استفاده از حافظه‌های HBM۳e و طراحی مبتنی بر چیپلت، توانست مسیر را برای مدل‌های GPT-۴ و مشابه آن هموار کند. وبلاگ توسعه‌دهندگان انویدیا پیش‌تر توضیح داده بود که بلک‌ول بر پایه موازی‌سازی گسترده بنا شده است، اما محدودیت‌های فیزیکی در انتقال داده‌ها همچنان وجود داشت. حال انویدیا تصمیم گرفته است پیش از آنکه رقبا به گرد پای بلک‌ول برسند، با معرفی روبین و تغییر نوع حافظه، جهش بعدی را رقم بزند و معماری قبلی را بازنشسته کند.

معماری ۳ نانومتری و حافظه انقلابی

مشخصات فنی منتشر شده از روبین نشان می‌دهد که مهندسان انویدیا تمرکز خود را بر حل مشکل حافظه گذاشته‌اند. تراشه گرافیکی R۱۰۰ که هسته اصلی این پلتفرم است، از لیتوگرافی ۳ نانومتری شرکت TSMC بهره می‌برد که اجازه می‌دهد ترانزیستور‌های بیشتری در فضای محدود جای بگیرند. اما تغییر اصلی در بخش حافظه رخ داده است. Tom's Hardware در تحلیل خود اشاره کرده که استفاده از ۲۸۸ گیگابایت حافظه HBM۴ در این تراشه، پهنای باند را به سطحی رسانده که پیش از این ممکن نبود. این حافظه‌ها ارتفاع کمتری دارند و به صورت مستقیم‌تری با واحد پردازش ارتباط برقرار می‌کنند که نتیجه آن کاهش تأخیر و مصرف انرژی است.

جهش از HBM۳e به HBM۴

تفاوت میان روبین و نسل قبل تنها در نام‌گذاری خلاصه نمی‌شود. معماری جدید به لطف حافظه HBM۴ می‌تواند داده‌ها را بسیار سریع‌تر از حافظه‌های HBM۳e موجود در بلک‌ول فراخوانی کند. این تغییر سخت‌افزاری منجر به افزایش ۵ برابری سرعت در بخش استنتاج شده است. استنتاج همان بخشی است که کاربر نهایی با آن سروکار دارد؛ یعنی زمانی که شما سوالی از چت‌بات می‌پرسید و منتظر پاسخ هستید. علاوه بر این، سرعت آموزش مدل‌ها نیز ۳.۵ برابر شده است که به معنای کاهش زمان توسعه مدل‌های جدید از چندین ماه به چند هفته خواهد بود.

مغز متفکر در کنار بازوی گرافیکی انویدیا

برای تکمیل قدرت تراشه گرافیکی R۱۰۰، پردازنده مرکزی جدیدی به نام Vera را نیز طراحی کرده است. پردازنده Vera که جایگزین مدل Grace می‌شود، وظیفه مدیریت منابع و تغذیه اطلاعات به GPU را بر عهده دارد. طراحی این پردازنده همچنان مبتنی بر معماری ARM است، اما برای تعامل با حافظه‌های پرسرعت بهینه‌سازی شده است. کارشناسان سخت‌افزار معتقدند که انویدیا با تولید Vera می‌خواهد وابستگی خود را به پردازنده‌های x۸۶ ساخت اینتل و AMD قطع کند و اکوسیستمی کاملاً یکپارچه بسازد. این پردازنده به گونه‌ای طراحی شده که بتواند حجم عظیمی از داده‌های خام را پیش از ارسال به واحد گرافیکی پردازش و مرتب‌سازی کند.

تراشه «ورا روبین» انویدیا سرعت پردازش دیتاسنترها را ۵ برابر می‌کند

محدودیت حافظه و راهکار استراتژیک انویدیا

مدل‌های هوش مصنوعی امروزی تشنه‌ی حافظه هستند و انتقال داده از رم به پردازنده، کندترین بخش عملیات محسوب می‌شود. معماری روبین با استفاده از تکنولوژی بسته‌بندی CoWoS-L، این فاصله فیزیکی را از میان برداشته است. این فناوری اجازه می‌دهد که تراشه‌های حافظه و پردازشگر در نزدیک‌ترین فاصله ممکن و روی یک بستر سیلیکونی مشترک قرار بگیرند. نتیجه این نزدیکی، رفع محدودیت انتقال داده است که برای مدل‌های هوش مصنوعی استدلالی که نیاز به نگهداری زنجیره افکار در حافظه موقت دارند، حیاتی است.

عبور از مرز‌های حرارتی

افزایش تراکم ترانزیستور‌ها و سرعت پردازش، چالش بزرگ گرمای تولیدی را به همراه دارد. دیتاسنتر‌هایی که میزبان روبین خواهند بود، دیگر نمی‌توانند از سیستم‌های خنک‌کننده بادی سنتی استفاده کنند. انویدیا همزمان با معرفی تراشه، استاندارد‌های جدیدی برای رک‌های سرور معرفی کرده که تماماً مبتنی بر خنک‌کنندگی مایع هستند. این سیستم‌ها مایع خنک‌کننده را مستقیماً از روی چیپ‌ها عبور می‌دهند تا حرارت چند هزار واتی تولید شده را دفع کنند. تغییر زیرساخت فیزیکی دیتاسنتر‌ها برای پذیرش این سیستم‌ها، یکی از هزینه‌های جانبی، اما اجتناب‌ناپذیر برای شرکت‌های خریدار خواهد بود.

چه زمانی دیتاسنتر‌ها تجهیز می‌شوند؟

برنامه زمانی اعلام شده توسط انویدیا نشان می‌دهد که تولید نمونه‌های اولیه این تراشه آغاز شده است. گزارش‌ها حاکی از آن است که تولید انبوه و تحویل نهایی به مشتریان بزرگ نظیر مایکروسافت و گوگل برای نیمه دوم سال ۲۰۲۶ تنظیم شده است. همچنین نسخه قدرتمندتر این پلتفرم با نام Rubin Ultra که از حافظه‌های HBM۴ با ظرفیت و لایه‌های بیشتر بهره می‌برد، برای سال ۲۰۲۷ در نظر گرفته شده است. این زمان‌بندی فشرده نشان می‌دهد که انویدیا قصد ندارد به رقبا فرصت تنفس بدهد.

تراشه «ورا روبین» انویدیا سرعت پردازش دیتاسنترها را ۵ برابر می‌کند

تأثیر بر بازار سهام و رقابت جهانی

تحلیلگران بازار بر این باورند که انویدیا با این محصول، جایگاه خود را به عنوان تنها تأمین‌کننده زیرساخت‌های حیاتی هوش مصنوعی تثبیت کرده است. شرکت‌های AMD و اینتل که تلاش می‌کردند با محصولات خود سهمی از بازار بلک‌ول را بگیرند، حالا با مانع بلندتری به نام روبین مواجه هستند. فاصله تکنولوژیکی ایجاد شده، به‌ویژه در بخش نرم‌افزار و هماهنگی سخت‌افزار، باعث می‌شود که مهاجرت شرکت‌ها از پلتفرم انویدیا به سایر گزینه‌ها دشوارتر و پرهزینه‌تر شود.

کاربرد در صنایع فراتر از چت‌بات قدرت پردازشی روبین تنها محدود به ساخت چت‌بات‌های هوشمند نیست. صنایع داروسازی برای شبیه‌سازی مولکولی و کشف دارو‌های جدید، و صنعت خودروسازی برای آموزش سیستم‌های رانندگی خودکار به این سطح از پردازش نیاز مبرم دارند. شبیه‌سازی‌های فیزیکی دقیق برای پیش‌بینی آب‌وهوا و مدل‌سازی تغییرات اقلیمی نیز از دیگر کاربرد‌هایی است که با معماری جدید امکان‌پذیرتر می‌شود. سرعت بالای استنتاج در روبین اجازه می‌دهد که این پردازش‌ها به صورت بلادرنگ انجام شوند، موضوعی که تا پیش از این نیازمند ساعت‌ها محاسبه بود.

چشم‌انداز آینده

هوش مصنوعی مسیر حرکت انویدیا نشان می‌دهد که هوش مصنوعی از فاز تولید محتوا به فاز حل مسئله وارد می‌شود. سیستم‌های آینده باید بتوانند فکر کنند، استدلال کنند و برای حل مسائل پیچیده سناریو‌های مختلف را بررسی کنند. پلتفرم ورا روبین زیرساخت فیزیکی لازم برای این تحول نرم‌افزاری را فراهم می‌کند. همان‌طور که بلک‌ول امکان ظهور چت‌جی‌پی‌تی را فراهم کرد، انتظار می‌رود روبین نیز بستر ظهور نسل بعدی هوش مصنوعی را فراهم کند که شاید توانایی‌هایی فراتر از تصور امروز ما داشته باشد.

انتهای پیام/

منبع: خبرگزاری آنا