نسخه جدید هوش مصنوعی «گروک» تصاویر را پردازش میکند
به گزارش خبرگزاری علم و فناوری آنا به نقل از انگجت، «ایکس ایآی» (xAI)، رقیب اوپن ایآی که توسط ایلان ماسک تأسیس شده است، نخستین نسخه «گورک» را معرفی کرده است که میتواند اطلاعات تصویری را پردازش کند. گورک ۱.۵ نسل اول مدل هوش مصنوعی چندوجهی این شرکت است که نه تنها متن را پردازش میکند، بلکه اسناد، نمودارها، اسکرین شاتها و عکسها را نیز پردازش میکند.
در اطلاعیه ایکس ایآی، مواردی از نحوه استفاده از قابلیتهای آن در دنیای واقعی ارائه شده است. به عنوان مثال، میتوانید عکسی از یک نمودار جریان را به آن نشان دهید و از گروک بخواهید آن را به کد پایتون ترجمه کند، از آن بخواهید داستانی بر اساس یک نقاشی بنویسد و حتی از آن بخواهید یک میم را که متوجه آن نمیشوید توضیح دهد.
نسخه جدید گوگل در حالی عرضه شده که شرکت چند هفته قبل از گورک ۱.۵ رونمایی کرد. این مدل برای بهبود کدنویسی و محاسبات ریاضی نسبت به نسخههای پیشین توسعه یافته بود و میتوانست متون طولانیتر را پردازش کند تا به این ترتیب اطلاعات را از منابع بیشتری کنترل کند و به درک بهتری از جستجوهای مخصوص برسد.
«ایکس ایآی» گفت که آزمایشکنندگان اولیه و کاربران فعلی آن به زودی میتوانند از قابلیتهای گورک ۱.۵ لذت ببرند، اگرچه جدول زمانی دقیقی برای عرضه آن ارائه نکرد.
علاوه بر معرفی گورک ۱.۵، این شرکت همچنین مجموعه دادههای معیاری را منتشر کرده است که «ریل ورلد کیو ای» (RealWorldQA) نامیده میشود که میتوانید از هر یک از ۷۰۰ تصویر آن برای ارزیابی مدلهای هوش مصنوعی استفاده کنید. هر مورد با سؤالات و پاسخهایی همراه است که میتوانید به راحتی آنها را تأیید کنید، اما ممکن است مدلهای چندوجهی مانند گروک را دچار مشکل کند. «ایکس ایآی» ادعا کرد که فناوری آن در برابر رقبای مانند جیپیتی ۴، جمنای پرو ۱.۵ بالاترین امتیاز را دریافت کرده است.
انتهای پیام/