صفحه نخست

آناتک

آنامدیا

دانشگاه

علم

سیاست

اقتصاد

فرهنگ‌

ورزش

عکس

فیلم

استانها

بازار

اردبیل

آذربایجان شرقی

آذربایجان غربی

اصفهان

البرز

ایلام

بوشهر

تهران

چهارمحال و بختیاری

خراسان جنوبی

خراسان رضوی

خراسان شمالی

خوزستان

زنجان

سمنان

سیستان و بلوچستان

فارس

قزوین

قم

کردستان

کرمان

کرمانشاه

کهگیلویه و بویراحمد

گلستان

گیلان

لرستان

مازندران

مرکزی

همدان

هرمزگان

یزد

پخش زنده

۲۰:۰۴ | ۱۰ / ۰۲ /۱۴۰۴
| |

علی‌بابا مدل‌های زبانی Qwen۳ را معرفی کرد

شرکت چینی علی‌بابا با رونمایی از مجموعه مدل‌های زبانی جدید خود با نام Qwen۳، گام بلندی در رقابت جهانی هوش مصنوعی برداشت. این مدل‌ها که به ادعای طراح آن در برخی تست‌ها از نمونه‌های پیشرفته شرکت‌هایی، چون OpenAI و گوگل عملکرد بهتری داشته‌اند، قابلیت‌های گسترده‌ای به کاربران ارائه و معادلات بازار مدل‌های زبانی را تغییر می‌دهند.
کد خبر : 970314

شرکت علی‌بابا روز از نسل جدید مدل‌های زبانی پیشرفته خود با نام Qwen۳ رونمایی کرد؛ مجموعه‌ای که به گفته مهندسان این مجموعه، در برخی آزمون‌ها از مدل‌های مطرحی، چون Gemini ۲.۵ Pro گوگل و o۳-mini OpenAI نیز برتر ظاهر شده است.

مدل‌های Qwen۳ در اندازه‌هایی از ۰.۶ تا ۲۳۵ میلیارد پارامتر توسعه داده شده‌اند و اغلب آنها از طریق پلتفرم‌هایی مثل Hugging Face و گیت‌هاب یا منتشر شده‌اند یا به‌زودی در اختیار توسعه‌دهندگان قرار می‌گیرند. بزرگ‌ترین عضو این مجموعه، مدل Qwen۳-۲۳۵B-A۲۲B، در زمینه‌هایی همچون کدنویسی، ریاضی و استدلال با مدل‌های شاخص جهانی رقابت می‌کند.

بر اساس اطلاعات منتشرشده از سوی شرکت علی‌بابا، مدل‌های Qwen۳ از معماری هیبریدی و گاهی ساختار Mixture of Experts یا به اختصار MoE بهره می‌برند. این معماری باعث می‌شود مدل‌ها بتوانند متناسب با شدت پیچیدگی وظایف، بهینه‌ترین حالت پردازش را انتخاب کرده و ضمن حفظ سرعت در انجام کار‌های ساده، دقت بالایی در حل مسائل پیچیده از خود به نمایش بگذارند.

تیم توسعه Qwen در بیانیه‌ای اعلام کرد: «ما امکان کنترل بودجه تفکر را برای کاربران فراهم کردیم تا هر کس بتواند عملکرد مدل را مطابق با نیاز‌های خاص خود تنظیم کند.»

قابلیت پشتیبانی از ۱۱۹ زبان و آموزش با استفاده از دیتاستی شامل بیش از ۳۶ تریلیون توکن از دیگر ویژگی‌های برجسته Qwen۳ است. این حجم عظیم داده شامل متن‌های آموزشی، جفت پرسش و پاسخ، کد‌های برنامه‌نویسی و اطلاعات تولیدشده توسط هوش مصنوعی می‌شود.

به اذعان علی‌بابا، نسخه جدید Qwen نسبت به نسل قبلی خود (Qwen۲) پیشرفت محسوسی داشته و حتی در برخی آزمون‌ها عملکردی بهتر از مدل‌های شناخته‌شده‌ای مانند OpenAI o۱ ارائه داده است؛ هرچند طبق تایید توسعه‌دهندگان، هنوز هیچ‌یک از نسخه‌های منتشرشده موفق به پشت سر گذاشتن کامل مدل‌های رده‌بالای بازار نشده‌اند.

شایان ذکر است بزرگ‌ترین نسخه Qwen۳ هنوز به‌صورت عمومی عرضه نشده، اما مدل Qwen۳-۳۲B اکنون در دسترس کاربران قرار گرفته و در رقابت با مدل‌های قدرتمندی مانند DeepSeek R۱ و OpenAI o۱ قرار دارد. این مدل همچنین عملکرد قابل قبولی را در اجرای دستورات، تعامل با ابزار‌ها و حفظ فرمت دقیق داده‌ها از خود نشان داده است. Qwen۳ علاوه بر دانلود مستقیم، از طریق پلتفرم‌های ابری نظیر Fireworks AI و Hyperbolic نیز ارائه می‌شود.

کارشناسان می‌گویند معرفی این مدل‌های جدید از سوی علی‌بابا، به منزله‌ی قدرت‌گیری جدی مدل‌های متن‌باز در برابر سیستم‌های بسته، حتی با وجود محدودیت‌های صادرات تراشه به چین است؛ موضوعی که می‌تواند در آینده رقابت بین‌المللی هوش مصنوعی را دگرگون کند.

انتهای پیام/

ارسال نظر