تراشه «ورا روبین» انویدیا سرعت پردازش دیتاسنترها را ۵ برابر میکند
به گزارش خبرگزاری آنا؛ رونمایی از این معماری جدید در لاسوگاس نشان داد که بزرگترین تراشهسازی گرافیکی جهان استراتژی خود را تغییر داده و فاصله عرضه محصولاتش را به یک سال رسانده است تا پاسخگوی نیاز سیریناپذیر شرکتهای فناوری به قدرت محاسباتی باشد. پلتفرم روبین که نام خود را از ستارهشناس مشهور ماده تاریک گرفته، قرار است جایگزین زیرساختهای فعلی شود و طبق ادعای سازنده، هزینههای تولید و بهکارگیری مدلهای زبانی بزرگ را به شکل قابل توجهی کاهش دهد. تمرکز اصلی این نسل بر هماهنگی کامل میان پردازنده مرکزی و گرافیکی است تا دادهها با کمترین تأخیر ممکن جابهجا شوند.
خداحافظی زودهنگام با عصر بلکول
نسل پیشین تراشههای انویدیا با نام بلکول که هماکنون بار اصلی پردازشهای هوش مصنوعی در جهان را به دوش میکشد، استانداردهای سختافزاری را ارتقا داده بود. معماری بلکول با استفاده از حافظههای HBM۳e و طراحی مبتنی بر چیپلت، توانست مسیر را برای مدلهای GPT-۴ و مشابه آن هموار کند. وبلاگ توسعهدهندگان انویدیا پیشتر توضیح داده بود که بلکول بر پایه موازیسازی گسترده بنا شده است، اما محدودیتهای فیزیکی در انتقال دادهها همچنان وجود داشت. حال انویدیا تصمیم گرفته است پیش از آنکه رقبا به گرد پای بلکول برسند، با معرفی روبین و تغییر نوع حافظه، جهش بعدی را رقم بزند و معماری قبلی را بازنشسته کند.
معماری ۳ نانومتری و حافظه انقلابی
مشخصات فنی منتشر شده از روبین نشان میدهد که مهندسان انویدیا تمرکز خود را بر حل مشکل حافظه گذاشتهاند. تراشه گرافیکی R۱۰۰ که هسته اصلی این پلتفرم است، از لیتوگرافی ۳ نانومتری شرکت TSMC بهره میبرد که اجازه میدهد ترانزیستورهای بیشتری در فضای محدود جای بگیرند. اما تغییر اصلی در بخش حافظه رخ داده است. Tom's Hardware در تحلیل خود اشاره کرده که استفاده از ۲۸۸ گیگابایت حافظه HBM۴ در این تراشه، پهنای باند را به سطحی رسانده که پیش از این ممکن نبود. این حافظهها ارتفاع کمتری دارند و به صورت مستقیمتری با واحد پردازش ارتباط برقرار میکنند که نتیجه آن کاهش تأخیر و مصرف انرژی است.
جهش از HBM۳e به HBM۴
تفاوت میان روبین و نسل قبل تنها در نامگذاری خلاصه نمیشود. معماری جدید به لطف حافظه HBM۴ میتواند دادهها را بسیار سریعتر از حافظههای HBM۳e موجود در بلکول فراخوانی کند. این تغییر سختافزاری منجر به افزایش ۵ برابری سرعت در بخش استنتاج شده است. استنتاج همان بخشی است که کاربر نهایی با آن سروکار دارد؛ یعنی زمانی که شما سوالی از چتبات میپرسید و منتظر پاسخ هستید. علاوه بر این، سرعت آموزش مدلها نیز ۳.۵ برابر شده است که به معنای کاهش زمان توسعه مدلهای جدید از چندین ماه به چند هفته خواهد بود.
مغز متفکر در کنار بازوی گرافیکی انویدیا
برای تکمیل قدرت تراشه گرافیکی R۱۰۰، پردازنده مرکزی جدیدی به نام Vera را نیز طراحی کرده است. پردازنده Vera که جایگزین مدل Grace میشود، وظیفه مدیریت منابع و تغذیه اطلاعات به GPU را بر عهده دارد. طراحی این پردازنده همچنان مبتنی بر معماری ARM است، اما برای تعامل با حافظههای پرسرعت بهینهسازی شده است. کارشناسان سختافزار معتقدند که انویدیا با تولید Vera میخواهد وابستگی خود را به پردازندههای x۸۶ ساخت اینتل و AMD قطع کند و اکوسیستمی کاملاً یکپارچه بسازد. این پردازنده به گونهای طراحی شده که بتواند حجم عظیمی از دادههای خام را پیش از ارسال به واحد گرافیکی پردازش و مرتبسازی کند.

محدودیت حافظه و راهکار استراتژیک انویدیا
مدلهای هوش مصنوعی امروزی تشنهی حافظه هستند و انتقال داده از رم به پردازنده، کندترین بخش عملیات محسوب میشود. معماری روبین با استفاده از تکنولوژی بستهبندی CoWoS-L، این فاصله فیزیکی را از میان برداشته است. این فناوری اجازه میدهد که تراشههای حافظه و پردازشگر در نزدیکترین فاصله ممکن و روی یک بستر سیلیکونی مشترک قرار بگیرند. نتیجه این نزدیکی، رفع محدودیت انتقال داده است که برای مدلهای هوش مصنوعی استدلالی که نیاز به نگهداری زنجیره افکار در حافظه موقت دارند، حیاتی است.
عبور از مرزهای حرارتی
افزایش تراکم ترانزیستورها و سرعت پردازش، چالش بزرگ گرمای تولیدی را به همراه دارد. دیتاسنترهایی که میزبان روبین خواهند بود، دیگر نمیتوانند از سیستمهای خنککننده بادی سنتی استفاده کنند. انویدیا همزمان با معرفی تراشه، استانداردهای جدیدی برای رکهای سرور معرفی کرده که تماماً مبتنی بر خنککنندگی مایع هستند. این سیستمها مایع خنککننده را مستقیماً از روی چیپها عبور میدهند تا حرارت چند هزار واتی تولید شده را دفع کنند. تغییر زیرساخت فیزیکی دیتاسنترها برای پذیرش این سیستمها، یکی از هزینههای جانبی، اما اجتنابناپذیر برای شرکتهای خریدار خواهد بود.
چه زمانی دیتاسنترها تجهیز میشوند؟
برنامه زمانی اعلام شده توسط انویدیا نشان میدهد که تولید نمونههای اولیه این تراشه آغاز شده است. گزارشها حاکی از آن است که تولید انبوه و تحویل نهایی به مشتریان بزرگ نظیر مایکروسافت و گوگل برای نیمه دوم سال ۲۰۲۶ تنظیم شده است. همچنین نسخه قدرتمندتر این پلتفرم با نام Rubin Ultra که از حافظههای HBM۴ با ظرفیت و لایههای بیشتر بهره میبرد، برای سال ۲۰۲۷ در نظر گرفته شده است. این زمانبندی فشرده نشان میدهد که انویدیا قصد ندارد به رقبا فرصت تنفس بدهد.

تأثیر بر بازار سهام و رقابت جهانی
تحلیلگران بازار بر این باورند که انویدیا با این محصول، جایگاه خود را به عنوان تنها تأمینکننده زیرساختهای حیاتی هوش مصنوعی تثبیت کرده است. شرکتهای AMD و اینتل که تلاش میکردند با محصولات خود سهمی از بازار بلکول را بگیرند، حالا با مانع بلندتری به نام روبین مواجه هستند. فاصله تکنولوژیکی ایجاد شده، بهویژه در بخش نرمافزار و هماهنگی سختافزار، باعث میشود که مهاجرت شرکتها از پلتفرم انویدیا به سایر گزینهها دشوارتر و پرهزینهتر شود.
کاربرد در صنایع فراتر از چتبات قدرت پردازشی روبین تنها محدود به ساخت چتباتهای هوشمند نیست. صنایع داروسازی برای شبیهسازی مولکولی و کشف داروهای جدید، و صنعت خودروسازی برای آموزش سیستمهای رانندگی خودکار به این سطح از پردازش نیاز مبرم دارند. شبیهسازیهای فیزیکی دقیق برای پیشبینی آبوهوا و مدلسازی تغییرات اقلیمی نیز از دیگر کاربردهایی است که با معماری جدید امکانپذیرتر میشود. سرعت بالای استنتاج در روبین اجازه میدهد که این پردازشها به صورت بلادرنگ انجام شوند، موضوعی که تا پیش از این نیازمند ساعتها محاسبه بود.
چشمانداز آینده
هوش مصنوعی مسیر حرکت انویدیا نشان میدهد که هوش مصنوعی از فاز تولید محتوا به فاز حل مسئله وارد میشود. سیستمهای آینده باید بتوانند فکر کنند، استدلال کنند و برای حل مسائل پیچیده سناریوهای مختلف را بررسی کنند. پلتفرم ورا روبین زیرساخت فیزیکی لازم برای این تحول نرمافزاری را فراهم میکند. همانطور که بلکول امکان ظهور چتجیپیتی را فراهم کرد، انتظار میرود روبین نیز بستر ظهور نسل بعدی هوش مصنوعی را فراهم کند که شاید تواناییهایی فراتر از تصور امروز ما داشته باشد.
انتهای پیام/