«علی بابا» برای حل مسائل ریاضی مدل هوش مصنوعی ساخت

شرکت فناور چندملیتی چینی «علی بابا» یک مدل جدید هوش مصنوعی ساخته که قرار است از نظر محاسبات ریاضیاتی با جی‌پی‌تی-۴ رقابت کند.

کد خبر : 926856

اشتراک گذاری

به گزارش خبرگزاری علم و فناوری آنا به نقل از ساوت آو چاینا مورنینگ، هلدینگ گروه علی‌بابا، شرکت فناور چندملیتی چینی که در زمینۀ تجارت الکترونیک فعال است، سری جدیدی از مدل‌های بزرگ زبانی مخصوص ریاضیات به نام اُوِن ۲ – مث (Qwen۲-Math) را راه‌اندازی کرده است که به ادعای این شرکت می‌تواند در قابلیت‌های ریاضی از جی‌پی‌تی –۴ پیشی بگیرد.

تیم اُوِن، بخشی از واحد محاسبات ابری علی‌بابا، اظهار داشت که تلاش‌های قابل توجهی در سال گذشته برای تقویت توانایی‌های استدلال مدل‌های بزرگ زبانی، به‌ویژه در حل مسائل حساب و ریاضی انجام شده است.

مدل‌های اُوِن ۲ – مث بر اساس مدل بزرگ زبانی اُوِن ۲ ساخته شده‌اند که در ماه ژوئن منتشر شده بود و بر اساس پارامتر‌های آن دسته‌بندی می‌شود که برای تعریف چگونگی تولید خروجی‌های مدل در طول آموزش ضروری است.

مدل برتر «اُوِن ۲ – مث ۷۲ بی اینستراکت» (Qwen۲-Math-۷۲B-Instruct) از چندین مدل بزرگ زبانی توسعه یافته از جمله جی‌پی‌تی ۴ و کلاد سانت ۳.۵ (Claude ۳.۵ Sonnet) با معیار‌های مختلف ریاضیاتی ساخته شده است.

این مدل‌ها با استفاده از معیار‌های انگلیسی و چینی که در آزمون‌های ورودی دانشگاه‌ها مورد استفاده قرار می‌گیرند توسعه یافتند. اگرچه مدل‌های اُوِن در حال حاضر فقط انگلیسی را پشتیبانی می‌کنند، برنامه‌هایی برای توسعه نسخه‌های دوزبانه و چند زبانه به زودی در دست اجراست.

این ابتکار شهرت علی بابا را در فضای هوش مصنوعی افزایش می‌دهد، به ویژه آنکه مدل «اُوِن ۲ – مث ۷۲ بی اینستراکت» در بین مدل‌های منبع باز رتبه بالایی دارد. در طول سال گذشته میلادی، علی‌بابا پیشرفت‌های قابل توجهی در زمینه هوش مصنوعی داشته است به طوری که مدل «اُوِن ۲ –۷۲ بی» را در ماه جولای از نظر محاسبات، استدلال منطقی و سایر معیار‌ها در رده‌بندی سوپر کلو (SuperClue) در جایگاه دوم قرار داد.

به نظر کارشناسان رقابت بین مدل‌های هوش مصنوعی چینی و ایالات متحده در حال تشدید است و پیشرفت‌های مدل‌های بزرگ زبانی در داخل چین در سال ۲۰۲۳ بسیار چشمگیر بوده است.

انتهای پیام/