علیبابا مدلهای زبانی Qwen۳ را معرفی کرد
شرکت علیبابا روز از نسل جدید مدلهای زبانی پیشرفته خود با نام Qwen۳ رونمایی کرد؛ مجموعهای که به گفته مهندسان این مجموعه، در برخی آزمونها از مدلهای مطرحی، چون Gemini ۲.۵ Pro گوگل و o۳-mini OpenAI نیز برتر ظاهر شده است.
مدلهای Qwen۳ در اندازههایی از ۰.۶ تا ۲۳۵ میلیارد پارامتر توسعه داده شدهاند و اغلب آنها از طریق پلتفرمهایی مثل Hugging Face و گیتهاب یا منتشر شدهاند یا بهزودی در اختیار توسعهدهندگان قرار میگیرند. بزرگترین عضو این مجموعه، مدل Qwen۳-۲۳۵B-A۲۲B، در زمینههایی همچون کدنویسی، ریاضی و استدلال با مدلهای شاخص جهانی رقابت میکند.
بر اساس اطلاعات منتشرشده از سوی شرکت علیبابا، مدلهای Qwen۳ از معماری هیبریدی و گاهی ساختار Mixture of Experts یا به اختصار MoE بهره میبرند. این معماری باعث میشود مدلها بتوانند متناسب با شدت پیچیدگی وظایف، بهینهترین حالت پردازش را انتخاب کرده و ضمن حفظ سرعت در انجام کارهای ساده، دقت بالایی در حل مسائل پیچیده از خود به نمایش بگذارند.
تیم توسعه Qwen در بیانیهای اعلام کرد: «ما امکان کنترل بودجه تفکر را برای کاربران فراهم کردیم تا هر کس بتواند عملکرد مدل را مطابق با نیازهای خاص خود تنظیم کند.»
قابلیت پشتیبانی از ۱۱۹ زبان و آموزش با استفاده از دیتاستی شامل بیش از ۳۶ تریلیون توکن از دیگر ویژگیهای برجسته Qwen۳ است. این حجم عظیم داده شامل متنهای آموزشی، جفت پرسش و پاسخ، کدهای برنامهنویسی و اطلاعات تولیدشده توسط هوش مصنوعی میشود.
به اذعان علیبابا، نسخه جدید Qwen نسبت به نسل قبلی خود (Qwen۲) پیشرفت محسوسی داشته و حتی در برخی آزمونها عملکردی بهتر از مدلهای شناختهشدهای مانند OpenAI o۱ ارائه داده است؛ هرچند طبق تایید توسعهدهندگان، هنوز هیچیک از نسخههای منتشرشده موفق به پشت سر گذاشتن کامل مدلهای ردهبالای بازار نشدهاند.
شایان ذکر است بزرگترین نسخه Qwen۳ هنوز بهصورت عمومی عرضه نشده، اما مدل Qwen۳-۳۲B اکنون در دسترس کاربران قرار گرفته و در رقابت با مدلهای قدرتمندی مانند DeepSeek R۱ و OpenAI o۱ قرار دارد. این مدل همچنین عملکرد قابل قبولی را در اجرای دستورات، تعامل با ابزارها و حفظ فرمت دقیق دادهها از خود نشان داده است. Qwen۳ علاوه بر دانلود مستقیم، از طریق پلتفرمهای ابری نظیر Fireworks AI و Hyperbolic نیز ارائه میشود.
کارشناسان میگویند معرفی این مدلهای جدید از سوی علیبابا، به منزلهی قدرتگیری جدی مدلهای متنباز در برابر سیستمهای بسته، حتی با وجود محدودیتهای صادرات تراشه به چین است؛ موضوعی که میتواند در آینده رقابت بینالمللی هوش مصنوعی را دگرگون کند.
انتهای پیام/