صفحه نخست

آموزش و دانشگاه

علم‌وفناوری

ارتباطات و فناوری اطلاعات

سلامت

پژوهش

علم +

سیاست

اقتصاد

فرهنگ‌ و‌ جامعه

ورزش

عکس

فیلم

استانها

بازار

اردبیل

آذربایجان شرقی

آذربایجان غربی

اصفهان

البرز

ایلام

بوشهر

تهران

چهارمحال و بختیاری

خراسان جنوبی

خراسان رضوی

خراسان شمالی

خوزستان

زنجان

سمنان

سیستان و بلوچستان

فارس

قزوین

قم

کردستان

کرمان

کرمانشاه

کهگیلویه و بویراحمد

گلستان

گیلان

لرستان

مازندران

مرکزی

هرمزگان

همدان

یزد

هومیانا

پخش زنده

دیده بان پیشرفت علم، فناوری و نوآوری

مدل هوش مصنوعی متا با قابلیت ترجمه و گفتار به ۱۰۰ زبان منتشر شد

متا به‌تازگی یک مدل هوش مصنوعی با قابلیت ترجمه و گفتار به دَه‌ها زبان مختلف دنیا را منتشر کرده است.
کد خبر : 864703

به گزارش خبرنگار خبرگزاری علم و فناوری آنا به نقل از رویترز، متا یک مدل هوش مصنوعی با قابلیت ترجمه و گفتار به دَه‌ها زبان را منتشر کرد.

این شرکت در یک پست وبلاگی گفت که مدل «سیم‌لس ام ۴ تی» (SeamlessM ۴ T) می‌تواند از ترجمه بین متن و گفتار در نزدیک به ۱۰۰ زبان و ترجمه کامل گفتار به گفتار برای ۳۵ زبان پشتیبانی کند، همچنین تکنولوژی را با هم ترکیب کند که قبلا فقط در مدل‌های جداگانه در دسترس بود. متا این مدل را برای استفاده غیر تجاری در دسترس عموم قرار می‌دهد.

به گفته «مارک زاکربرگ»، مدیرعامل شرکت متا چنین ابزار‌هایی برای تسهیل تعاملات بین کاربران سراسر جهان در متاورس، مجموعه‌ای از جهان‌های مجازی به هم پیوسته، منتشر می‌شوند.

بزرگ‌ترین شرکت رسانه‌های اجتماعی جهان، امسال مجموعه‌ای از مدل‌های رایگان هوش مصنوعی را منتشر کرده است، از جمله یک مدل زبانی بزرگ به نام «لاما» (Llama) که چالشی جدی برای مدل‌های اختصاصی فروخته شده توسط مایکروسافت و آلفابت ایجاد می‌کند.

زاکربرگ می‌گوید: «یک اکوسیستم باز هوش مصنوعی به نفع متا عمل می‌کند، چرا که این شرکت بیشتر از آن‌که برای دسترسی به مدل‌ها هزینه کند، باید با جمع‌سپاری موثر و ایجاد ابزار‌های مشتری محور برای پلتفرم‌های اجتماعی خود کسب درآمد کند.»

با این حال؛ متا با سوالات قانونی مشابهی با بقیه صنایع پیرامون، داده‌های آموزشی که برای ایجاد مدل‌های آن استفاده می‌شود، مواجه است.

در ماه ژوئیه «سارا سیلورمن»، کمدین و دو نویسنده دیگر، دادخواست نقض کپی‌رایت را علیه متا و «اوپن‌ای‌آی» (OpenAI) تنظیم کردند و شرکت‌ها را متهم کردند که بدون اجازه از کتاب‌هایشان به‌عنوان داده‌های آموزشی استفاده می‌کنند.

برای مدل سیم‌لس ام ۴ تی، محققان متا در یک مقاله تحقیقاتی گفتند که آن‌ها داده‌های آموزش صوتی را از ۴ میلیون ساعت صدای خام نشأت گرفته از یک مخزن عمومی از داده‌های وب جمع‌آوری کرده‌اند؛ آن هم بدون مشخص کردن منبع.

سخنگوی متا به سوالات در مورد منشأ داده‌های صوتی پاسخ نداد.

بر اساس این مقاله تحقیقاتی، داده‌های متنی از مجموعه داده‌های ایجاد شده در سال گذشته به دست آمده‌اند که محتوا را از ویکی‌پدیا و وب‌سایت‌های مرتبط استخراج کرده‌اند.

انتهای پیام/

ارسال نظر