میسترال مدلهای قدرتمند و سبک برنامهنویسی Devstral ۲ را به میدان آورد
توسعهدهندگان نرمافزار اکنون به خانواده مدلهای زبانی Devstral ۲ دسترسی دارند که تنها چند روز پس از معرفی مدل عمومی Mistral ۳ معرفی شدهاند. استراتژی جدید این شرکت بر ارائه گزینههای منعطف تمرکز دارد: یک مدل بسیار سنگین برای پردازشهای پیچیده و یک نسخه سبکتر که قابلیت اجرا روی لپتاپهای شخصی را بهصورت کاملاً آفلاین دارد. هدف اصلی این انتشار، پر کردن شکاف میان عملکرد مدلهای انحصاری و انعطافپذیری مدلهای متنباز عنوان شده است تا مهندسان بتوانند بسته به نیاز امنیتی و سختافزاری خود، ابزار مناسب را انتخاب کنند.
نسخه اصلی و پرچمدار این سری با نام Devstral ۲ دارای ۱۲۳ میلیارد پارامتر و پنجره متنی ۲۵۶ هزار توکن است. دادههای فنی منتشر شده نشان میدهد این مدل در بنچمارک SWE-bench Verified که استاندارد ارزیابی وظایف مهندسی نرمافزار در مخازن واقعی کد است، امتیاز ۷۲.۲ درصد را کسب کرده است. معماری این مدل بر اساس ترنسفورمرهای متراکم بنا شده و برای استدلالهای طولانی و حل مسائل پیچیده در سطح پروژههای بزرگ بهینهسازی شده است.
مدل کوچکتر این خانواده تحت عنوان Devstral Small ۲ با ۲۴ میلیارد پارامتر عرضه شده، اما همان پنجره متنی وسیع را حفظ کرده است. عملکرد این نسخه با کسب امتیاز ۶۸ درصد در آزمون SWE-bench، بالاتر از بسیاری از رقبای ۷۰ میلیارد پارامتری قرار میگیرد. میسترال اعلام کرده است که این مدل با وجود اندازه ۵ برابر کوچکتر از مدل دیپسیک V۳.۲ و ۸ برابر کوچکتر از Kimi K۲، توانسته است در شاخصهای استدلال نرمافزاری عملکردی رقابتی از خود نشان دهد. مقایسههای انجام شده حاکی از آن است که نسخه کامل Devstral ۲ در ۴۲.۸ درصد موارد بر دیپسیک V۳.۲ غلبه کرده، هرچند در برابر مدل بسته کلود Sonnet ۴.۵ همچنان در ۵۳.۱ درصد موارد عملکرد ضعیفتری داشته است.

ابزار خط فرمان Vibe نیز همزمان با این مدلها منتشر شده که محیط ترمینال را به یک دستیار هوشمند مجهز میکند. مهندسان میتوانند برخلاف افزونههای معمول ویرایشگر کد، از Vibe برای درک ساختار فایلها، بررسی وضعیت Git و اجرای دستورات شل استفاده کنند. این واسط کاربری برخلاف چتباتهای معمول، مستقیماً با فایلهای پروژه تعامل دارد و قابلیت اسکریپتنویسی و تغییر رفتار را برای خودکارسازی فرآیندهای توسعه فراهم میآورد.
مجوزهای انتشار این دو مدل تفاوتهای آشکاری با یکدیگر دارند که بر نحوه استفاده تجاری آنها اثرگذار است. نسخه Devstral Small ۲ تحت لایسنس استاندارد Apache ۲.۰ منتشر شده که استفاده از آن را برای تمامی اشخاص و شرکتها بدون محدودیت درآمدی آزاد میگذارد. نسخه بزرگتر ۱۲۳ میلیارد پارامتری، اما از مجوز MIT اصلاحشده پیروی میکند؛ طبق این مجوز، شرکتهایی با درآمد ماهانه تلفیقی بیش از ۲۰ میلیون دلار، اجازه استفاده از این مدل حتی برای مصارف داخلی را بدون دریافت مجوز تجاری جداگانه ندارند.
قابلیت اجرای آفلاین نسخه کوچک روی یک پردازنده گرافیکی یا لپتاپهای قدرتمند، راهکار جدیدی برای صنایع دارای دادههای حساس ایجاد کرده است. بخشهای مالی، دفاعی و بهداشتی که به دلیل قوانین انطباق امکان ارسال کدها به سرورهای ابری را ندارند، میتوانند از این مدل برای استنتاج محلی استفاده کنند. اجرای مدل بزرگتر Devstral ۲ نیازمند حداقل ۴ پردازنده گرافیکی کلاس H۱۰۰ است، در حالی که مدل کوچک روی سختافزارهای محدودتر نیز قابل پیادهسازی است.
قیمتگذاری استفاده از API این مدلها نیز پس از دوره رایگان اولیه اعلام شده است. هزینه پردازش هر میلیون توکن ورودی برای مدل بزرگ ۰.۴۰ دلار و برای مدل کوچک ۰.۱۰ دلار تعیین شده که پایینتر از نرخهای GPT-۴ توربو و کلود Sonnet است. این اقدام میسترال در ادامه روند انتشار مدلهای تخصصی کدنویسی است و تکمیلکننده مسیر مدلهای Codestral محسوب میشود که پیشتر در سال ۲۰۲۴ معرفی شده بودند.
انتهای پیام/


