مدل هوش مصنوعی متا با قابلیت ترجمه و گفتار به ۱۰۰ زبان منتشر شد
به گزارش خبرنگار خبرگزاری علم و فناوری آنا به نقل از رویترز، متا یک مدل هوش مصنوعی با قابلیت ترجمه و گفتار به دَهها زبان را منتشر کرد.
این شرکت در یک پست وبلاگی گفت که مدل «سیملس ام ۴ تی» (SeamlessM ۴ T) میتواند از ترجمه بین متن و گفتار در نزدیک به ۱۰۰ زبان و ترجمه کامل گفتار به گفتار برای ۳۵ زبان پشتیبانی کند، همچنین تکنولوژی را با هم ترکیب کند که قبلا فقط در مدلهای جداگانه در دسترس بود. متا این مدل را برای استفاده غیر تجاری در دسترس عموم قرار میدهد.
به گفته «مارک زاکربرگ»، مدیرعامل شرکت متا چنین ابزارهایی برای تسهیل تعاملات بین کاربران سراسر جهان در متاورس، مجموعهای از جهانهای مجازی به هم پیوسته، منتشر میشوند.
بزرگترین شرکت رسانههای اجتماعی جهان، امسال مجموعهای از مدلهای رایگان هوش مصنوعی را منتشر کرده است، از جمله یک مدل زبانی بزرگ به نام «لاما» (Llama) که چالشی جدی برای مدلهای اختصاصی فروخته شده توسط مایکروسافت و آلفابت ایجاد میکند.
زاکربرگ میگوید: «یک اکوسیستم باز هوش مصنوعی به نفع متا عمل میکند، چرا که این شرکت بیشتر از آنکه برای دسترسی به مدلها هزینه کند، باید با جمعسپاری موثر و ایجاد ابزارهای مشتری محور برای پلتفرمهای اجتماعی خود کسب درآمد کند.»
با این حال؛ متا با سوالات قانونی مشابهی با بقیه صنایع پیرامون، دادههای آموزشی که برای ایجاد مدلهای آن استفاده میشود، مواجه است.
در ماه ژوئیه «سارا سیلورمن»، کمدین و دو نویسنده دیگر، دادخواست نقض کپیرایت را علیه متا و «اوپنایآی» (OpenAI) تنظیم کردند و شرکتها را متهم کردند که بدون اجازه از کتابهایشان بهعنوان دادههای آموزشی استفاده میکنند.
برای مدل سیملس ام ۴ تی، محققان متا در یک مقاله تحقیقاتی گفتند که آنها دادههای آموزش صوتی را از ۴ میلیون ساعت صدای خام نشأت گرفته از یک مخزن عمومی از دادههای وب جمعآوری کردهاند؛ آن هم بدون مشخص کردن منبع.
سخنگوی متا به سوالات در مورد منشأ دادههای صوتی پاسخ نداد.
بر اساس این مقاله تحقیقاتی، دادههای متنی از مجموعه دادههای ایجاد شده در سال گذشته به دست آمدهاند که محتوا را از ویکیپدیا و وبسایتهای مرتبط استخراج کردهاند.
انتهای پیام/