«موتور صوتی» اوپنایآی رونمایی شد/ شبیهسازی صدا با نمونه صوتی ۱۵ ثانیهای
به گزارش خبرگزاری علم و فناوری آنا به نقل از اینترستینگ اینجینرینگ، همانطور که هوش مصنوعی (AI) به سرعت در حال پیشرفت است، اوپن ایآی سازنده چت جیپیتی در خط مقدم این پیشرفت قرار دارد.
این آزمایشگاه تحقیقاتی از فناوری جدید و قدرتمند شبیه سازی صدا به نام «موتور صوتی» (Voice Engine) رونمایی کرده است که فقط با یک نمونه صوتی ۱۵ ثانیهای، میتواند کپی مصنوعی از صدای یک فرد را که بهعنوان «صدای طبیعی» توصیف میشود تولید کند.
در حالی که این شرکت مزایای بالقوهای را برای آن پیش بینی میکند، این فناوری همچنین خطرات قابل توجهی را به همراه دارد، به ویژه هنگامی که دستکاری عمیق پیچیدهتر میشود.
موتور صوتی چیست؟
موتور صوتی گسترش و توسعه فناوری تبدیل متن به گفتار توسط اوپنایآی است. با استفاده از این ابزار، هر کسی میتواند با آپلود نمونه صوتی ۱۵ ثانیهای از صدای یک فرد، صدای مصنوعی آن را تولید کند. اوپنایآی با دقت در دسترس بودن این ابزار را در مرحله پیش نمایش آن محدود میکند تا پتانسیل این فناوری را برای کاربردهای مثبت و منفی ارزیابی کند. این شرکت بر اهمیت درک خطرات و ایجاد تدابیر امنیتی قبل از انتشار عمومیتر تاکید میکند.
با کمال تعجب، موتور صوتی اوپنایآی به ذخیره یا تنظیم دقیق نمونههای صوتی ارسال شده توسط کاربر متکی نیست. این دستگاه از یک مدل هوش مصنوعی پیشرفته استفاده میکند که هم قطعه صوتی ارائه شده و هم متن مورد مطالعه را تجزیه و تحلیل میکند و صدایی منطبق را بدون ایجاد ضبط دائمی از صدای فرد ایجاد میکند.
در حالی که شبیه سازی صوتی جدید نیست، اوپنایآی ادعا میکند که رویکرد آن کیفیت برتری را ارائه میدهد. علاوه بر این، قیمت گذاری تهاجمی که در مواد اولیه بازاریابی معرفی شده است، بر پتانسیل موتور صوتی برای ایجاد اختلال در صنایع وابسته به صدا تاکید میکند.
نگاهی به مزایای موتور صوتی
اوپنایآی پیشبینی میکند که موتور صوتی به مشکلات خواندن، ترجمه زبانها و حتی کمک به افرادی که ارتباط گفتاری خود را از دست دادهاند کمک کند. آنها به خلبانی از دانشگاه براون اشاره میکنند که در آن یک بیمار دچار اختلال گفتاری از شبیهسازی موتور صوتی ایجاد شده از ضبط پروژه قدیمی استفاده میکند.
خطرات جدی شبیهسازی صدا
همانطور که تولید صدای هوش مصنوعی پیشرفتهتر و قابل دسترستر میشود، ترسیم اینکه بازیگران بد چگونه میتوانند از این فناوری برای دیپفیکهای مخرب سوء استفاده کنند، سخت نیست. موتور صوتی به محیطی میرسد که در آن تولید اطلاعات نادرست با کمک دستکاری واقعی صدا و تصویر یکی از نگرانیهای اصلی است. اوپنایآی خطرات جدیرا تأیید میکند، که در طول انتخابات حتی بیشتر آشکار میشود.
همچنین، موتور صوتی میتواند کار صوتی را کالایی کند و استفاده از صداهای مصنوعی را به جای استخدام استعدادهای انسانی برای مشاغل ارزانتر و آسانتر کند. در حالی که برخی از شرکتهای هوش مصنوعی بازارها یا مدلهای جبرانی را برای صداپیشگانی که صدایشان شبیهسازی شده است، ارائه میدهند، رویکرد اوپنایآی در درجه اول به رضایت کاربر متکی است. باید دید صنعت چگونه با این فناوری سازگار خواهد شد و آیا مقرراتی برای تضمین جبران منصفانه و استفاده اخلاقی از استعدادهای صداپیشگی وضع خواهد شد یا خیر.
قیمت مقرون بهصرفه و تاخیر در عرضه عمومی
با تشخیص خطرات و رعایت احتیاط، اوپنایآی در حال انجام یک پیشنمایش محدود است و در عین حال بازخورد بخشهای مختلف را برای کاهش پتانسیل آسیب در خود گنجانده است. آزمایشکنندگان پیشنمایش باید با خطمشیهایی موافقت کنند که جعل هویت بدون رضایت را ممنوع میکند و نیاز به افشای واضح گفتار تولید شده توسط هوش مصنوعی دارد. علاوه بر این، اوپنایآی در حال اجرای برچسب گذاری برای ردیابی منشاء صدا است و نحوه استفاده از سیستم را نظارت خواهد کرد. هدف فهرست «صدای ممنوع» جلوگیری از تولید صدای چهرههای برجسته است.
در حالی که تاریخ انتشار رسمی ناشناخته است، اطلاعات فاش شده نشان میدهد که موتور صوتی میتواند بسیار مقرون به صرفه باشد. این امر بسیاری از رقبا را از بین میبرد و میتواند کتابهای صوتی تولید شده توسط هوش مصنوعی را وسوسه انگیز کند.
اعلامیههای اوپنایآی فراتر از موتور صوتی است. این هفته، آنها همچنین از همکاری با مایکروسافت برای ساخت ابرکامپیوتر هوش مصنوعی «استارگیت» (Stargate) که یک پروژه ۱۰۰ میلیارد دلاری است، پرده برداشتند.
انتهای پیام/