«علی بابا» برای حل مسائل ریاضی مدل هوش مصنوعی ساخت
به گزارش خبرگزاری علم و فناوری آنا به نقل از ساوت آو چاینا مورنینگ، هلدینگ گروه علیبابا، شرکت فناور چندملیتی چینی که در زمینۀ تجارت الکترونیک فعال است، سری جدیدی از مدلهای بزرگ زبانی مخصوص ریاضیات به نام اُوِن ۲ – مث (Qwen۲-Math) را راهاندازی کرده است که به ادعای این شرکت میتواند در قابلیتهای ریاضی از جیپیتی –۴ پیشی بگیرد.
تیم اُوِن، بخشی از واحد محاسبات ابری علیبابا، اظهار داشت که تلاشهای قابل توجهی در سال گذشته برای تقویت تواناییهای استدلال مدلهای بزرگ زبانی، بهویژه در حل مسائل حساب و ریاضی انجام شده است.
مدلهای اُوِن ۲ – مث بر اساس مدل بزرگ زبانی اُوِن ۲ ساخته شدهاند که در ماه ژوئن منتشر شده بود و بر اساس پارامترهای آن دستهبندی میشود که برای تعریف چگونگی تولید خروجیهای مدل در طول آموزش ضروری است.
مدل برتر «اُوِن ۲ – مث ۷۲ بی اینستراکت» (Qwen۲-Math-۷۲B-Instruct) از چندین مدل بزرگ زبانی توسعه یافته از جمله جیپیتی ۴ و کلاد سانت ۳.۵ (Claude ۳.۵ Sonnet) با معیارهای مختلف ریاضیاتی ساخته شده است.
این مدلها با استفاده از معیارهای انگلیسی و چینی که در آزمونهای ورودی دانشگاهها مورد استفاده قرار میگیرند توسعه یافتند. اگرچه مدلهای اُوِن در حال حاضر فقط انگلیسی را پشتیبانی میکنند، برنامههایی برای توسعه نسخههای دوزبانه و چند زبانه به زودی در دست اجراست.
این ابتکار شهرت علی بابا را در فضای هوش مصنوعی افزایش میدهد، به ویژه آنکه مدل «اُوِن ۲ – مث ۷۲ بی اینستراکت» در بین مدلهای منبع باز رتبه بالایی دارد. در طول سال گذشته میلادی، علیبابا پیشرفتهای قابل توجهی در زمینه هوش مصنوعی داشته است به طوری که مدل «اُوِن ۲ –۷۲ بی» را در ماه جولای از نظر محاسبات، استدلال منطقی و سایر معیارها در ردهبندی سوپر کلو (SuperClue) در جایگاه دوم قرار داد.
به نظر کارشناسان رقابت بین مدلهای هوش مصنوعی چینی و ایالات متحده در حال تشدید است و پیشرفتهای مدلهای بزرگ زبانی در داخل چین در سال ۲۰۲۳ بسیار چشمگیر بوده است.
انتهای پیام/