پشتیبانی از هزار زبان پرمخاطب با هوش مصنوعی
به گزارش گروه دانش و فناوری خبرگزاری آنا، گوگل از پروژه بلندپروازانه جدید خود برای توسعه یک مدل مترجم زبان مبتنیبر هوش مصنوعی که از هزار زبان پرمخاطب در سرتاسر جهان پشتیبانی میکند، خبر داده است. این شرکت بهعنوان اولین گام خود در مسیر ساخت مدل مذکور، یک مدل هوش مصنوعی را با بیشاز ۴۰۰ زبان آموزش داده است و آن را بهعنوان بزرگترین پوشش زبانی که امروزه در یک مدل گفتاری دیده میشود، توصیف میکند.
زبان و هوش مصنوعی، همیشه در قلب محصولات گوگل قرار داشتهاند، اما پیشرفتهای اخیر در یادگیری ماشینی، بهخصوص توسعه مدلهای زبان بزرگ یا LLM قدرتمند و چندمنظوره، تأکید جدیدی روی این حوزهها دارد.
گوگل از مدتی قبل، ادغام مدلهای زبانی را در محصولاتی مثل سرویس جستوجوی خود آغاز کرده است و مشکلات مربوط به عملکرد سیستمها را نیز برطرف میکند. مدلهای زبانی، نقصهایی دارند که ازجمله میتوان به تمایل به بازگرداندن سوگیریهای مضر اجتماعی مثل نژادپرستی و بیگانههراسی و ناتوانی در تجزیهی زبان براساس حساسیتهای انسانی اشاره کرد. شایانذکر است این شرکت محققان خود را پساز انتشار مقالاتی درمورد مشکلات مذکور، اخراج کرد.
اگرچه مدلهای هوش مصنوعی، قادر به انجام کارهای مختلفی مثل تولید زبان (مثل GPT-3 OpenAI) تا ترجمه (مثل پروژهی No Language Left Behind متا) هستند، اما ابتکار گوگل برای پشتیبانی از هزار زبان مختلف، روی عملکرد خاصی تمرکز ندارد و درعوض بر ایجاد یک سیستم واحد با وسعت زیاد برای زبانهای سرتاسر جهان، متمرکز است.
زوبین قهرمانی، معاون ایرانی واحد تحقیقات هوش مصنوعی گوگل در گفتوگو با پایگاه خبری تحلیلی دی ورج اعلام کرد که این شرکت معتقد است ایجاد مدلی با این ابعاد بزرگ، باعث خواهد شد کارکردهای مختلف هوش مصنوعی، برای زبانهایی که در فضاهای آنلاین و مجموعه دادههای آموزشی هوش مصنوعی، حضور ضعیفی ندارند، آسانتر شود. او همچنین به زبانهایی که منابع زیادی از آنها وجود ندارد اشاره کرد.
به گفته قهرمانی «یک مدل واحد که بسیاری از زبانهای مختلف را پوشش میدهد و روی آنها آموزش داده میشود، عملکرد بسیار بهتری برای زبانهایی که منابع کمی از آنها وجود دارد، ارائه خواهد داد. روش ما برای پشتیبانی از ۱۰۰۰ زبان مختلف، ساختن ۱۰۰۰ مدل مجزا نیست. زبانها مثل موجودات زنده هستند و از روی یکدیگر تکامل پیدا کردهاند؛ درنتیجه شباهتهایی میان آنها وجود دارد. بههرحال، زمانیکه دادههای یک زبان جدید را در مدل ۱۰۰۰ زبانی خود بگنجانیم و توانایی ترجمه از زبانهای مطرح به زبانی که منابع کمی از آن دردسترس است را داشته باشیم، قادر خواهیم بود به پیشرفتهای بسیار شگفتانگیزی دست یابیم.»
تحقیقات گذشته، اثربخشی این رویکرد را نشان داده است و مقیاس مدل برنامهریزیشده گوگل میتواند دستاوردهای درخورتوجهی نسبت به تلاشهای گذشته داشته باشد. چنین پروژههایی درمقیاس بزرگ، بهنوعی جاهطلبی شرکتهای فناوری برای تسلط بر تحقیقات هوش مصنوعی و استفاده از مزیتهای منحصربهفرد این شرکتها ازنظر دسترسی به حجم عظیمی از قدرت محاسباتی و دادههای آموزشی را نشان میدهند. متا نیز در این زمینه پروژهی مشابهی را برای ساخت یک مترجم جهانی گفتاری آغاز کرده است.
بااینحال، دسترسی به دادهها هنگام آموزش مدلها برای بسیاری از زبانها، یک مشکل است و گوگل میگوید بهمنظور پشتیبانی از کار روی مدل ۱۰۰۰ زبانی، جمعآوری دادهها را برای زبانهای کممنبع، از ضبط صدا و متون نوشتاری، تأمین میکند.
غول جست وجوی اینترنت معتقد است که «هیچ برنامه مستقیمی درمورد مکان استفاده از عملکرد مدل ۱۰۰۰ زبانی خود ندارد و فقط انتظار میرود در طیف وسیعی از محصولات این شرکت از سرویس مترجم متن گرفته تا زیرنویسهای یوتیوب و موارد دیگر، کاربرد داشته باشد.»
قهرمانی اعتقاد دارد که «یکی از نکات واقعاً جالب درمورد مدلهای زبانی بزرگ و بهطور کلی، تحقیقات زبانی این است که آنها میتوانند بسیاری از وظایف مختلف را انجام دهند. همان مدل زبان میتواند دستورهای یک ربات را به کد تبدیل کند، میتواند مسائل ریاضی را حل یا زبانهای مختلف را ترجمه کند. ویژگیهای جالب درمورد مدلهای زبان این است که درحال تبدیلشدن به مخزن عظیمی از دانش هستند و با بررسی آنها به روشهای مختلف میتوانید بهبخشهای مختلف عملکردهای مفید، دست پیدا کنید.»
گوگل مدل ۱۰۰۰ زبانه خود را برای محصولات جدید مبتنیبر هوش مصنوعی خود معرفی کرده است. این شرکت همچنین تحقیقات جدیدی را درمورد مدلهای تبدیل متن به ویدیو، نمونهاولیه دستیار داستاننویسی هوش مصنوعی بهنام Wordcraft و بهروزرسانی برنامه AI Test Kitchen خود بهاشتراک گذاشت؛ برنامهای که امکان دسترسی محدود به مدلهای هوش مصنوعی این شرکت ازجمله موتور تبدیل متن به تصویر Imagen را برای کاربران فراهم میکند.
انتهای پیام/110/
انتهای پیام/