«موتور صوتی» اوپن‌ای‌آی رونمایی شد/ شبیه‌سازی صدا با نمونه‌ صوتی ۱۵ ثانیه‌ای

اوپن‌ای‌آی از فناوری جدید و قدرتمند شبیه‌سازی صدای خود به نام «موتور صوتی» (Voice Engine) رونمایی کرد.

کد خبر : 903496

اشتراک گذاری

به گزارش خبرگزاری علم و فناوری آنا به نقل از اینترستینگ اینجینرینگ، همانطور که هوش مصنوعی (AI) به سرعت در حال پیشرفت است، اوپن ای‌آی سازنده چت جی‌پی‌تی در خط مقدم این پیشرفت قرار دارد.

این آزمایشگاه تحقیقاتی از فناوری جدید و قدرتمند شبیه سازی صدا به نام «موتور صوتی» (Voice Engine) رونمایی کرده است که فقط با یک نمونه صوتی ۱۵ ثانیه‌ای، می‌تواند کپی مصنوعی از صدای یک فرد را که به‌عنوان «صدای طبیعی» توصیف می‌شود تولید کند.

در حالی که این شرکت مزایای بالقوه‌ای را برای آن پیش بینی می‌کند، این فناوری همچنین خطرات قابل توجهی را به همراه دارد، به ویژه هنگامی که دستکاری عمیق پیچیده‌تر می‌شود.

موتور صوتی چیست؟

موتور صوتی گسترش و توسعه فناوری تبدیل متن به گفتار توسط اوپن‌ای‌آی است. با استفاده از این ابزار، هر کسی می‌تواند با آپلود نمونه صوتی ۱۵ ثانیه‌ای از صدای یک فرد، صدای مصنوعی آن را تولید کند. اوپن‌ای‌آی با دقت در دسترس بودن این ابزار را در مرحله پیش نمایش آن محدود می‌کند تا پتانسیل این فناوری را برای کاربرد‌های مثبت و منفی ارزیابی کند. این شرکت بر اهمیت درک خطرات و ایجاد تدابیر امنیتی قبل از انتشار عمومی‌تر تاکید می‌کند.

با کمال تعجب، موتور صوتی اوپن‌ای‌آی به ذخیره یا تنظیم دقیق نمونه‌های صوتی ارسال شده توسط کاربر متکی نیست. این دستگاه از یک مدل هوش مصنوعی پیشرفته استفاده می‌کند که هم قطعه صوتی ارائه شده و هم متن مورد مطالعه را تجزیه و تحلیل می‌کند و صدایی منطبق را بدون ایجاد ضبط دائمی از صدای فرد ایجاد می‌کند.

در حالی که شبیه سازی صوتی جدید نیست، اوپن‌ای‌آی ادعا می‌کند که رویکرد آن کیفیت برتری را ارائه می‌دهد. علاوه بر این، قیمت گذاری تهاجمی که در مواد اولیه بازاریابی معرفی شده است، بر پتانسیل موتور صوتی برای ایجاد اختلال در صنایع وابسته به صدا تاکید می‌کند.

نگاهی به مزایای موتور صوتی

اوپن‌ای‌آی پیش‌بینی می‌کند که موتور صوتی به مشکلات خواندن، ترجمه زبان‌ها و حتی کمک به افرادی که ارتباط گفتاری خود را از دست داده‌اند کمک کند. آنها به خلبانی از دانشگاه براون اشاره می‌کنند که در آن یک بیمار دچار اختلال گفتاری از شبیه‌سازی موتور صوتی ایجاد شده از ضبط پروژه قدیمی استفاده می‌کند.

خطرات جدی‌ شبیه‌سازی صدا

همانطور که تولید صدای هوش مصنوعی پیشرفته‌تر و قابل دسترس‌تر می‌شود، ترسیم اینکه بازیگران بد چگونه می‌توانند از این فناوری برای دیپ‌فیک‌های مخرب سوء استفاده کنند، سخت نیست. موتور صوتی به محیطی می‌رسد که در آن تولید اطلاعات نادرست با کمک دستکاری واقعی صدا و تصویر یکی از نگرانی‌های اصلی است. اوپن‌ای‌آی خطرات جدیرا تأیید می‌کند، که در طول انتخابات حتی بیشتر آشکار می‌شود.

همچنین، موتور صوتی می‌تواند کار صوتی را کالایی کند و استفاده از صدا‌های مصنوعی را به جای استخدام استعداد‌های انسانی برای مشاغل ارزان‌تر و آسان‌تر کند. در حالی که برخی از شرکت‌های هوش مصنوعی بازار‌ها یا مدل‌های جبرانی را برای صداپیشگانی که صدایشان شبیه‌سازی شده است، ارائه می‌دهند، رویکرد اوپن‌ای‌آی در درجه اول به رضایت کاربر متکی است. باید دید صنعت چگونه با این فناوری سازگار خواهد شد و آیا مقرراتی برای تضمین جبران منصفانه و استفاده اخلاقی از استعداد‌های صداپیشگی وضع خواهد شد یا خیر.

قیمت مقرون به‌صرفه و تاخیر در عرضه عمومی

با تشخیص خطرات و رعایت احتیاط، اوپن‌ای‌آی در حال انجام یک پیش‌نمایش محدود است و در عین حال بازخورد بخش‌های مختلف را برای کاهش پتانسیل آسیب در خود گنجانده است. آزمایش‌کنندگان پیش‌نمایش باید با خط‌مشی‌هایی موافقت کنند که جعل هویت بدون رضایت را ممنوع می‌کند و نیاز به افشای واضح گفتار تولید شده توسط هوش مصنوعی دارد. علاوه بر این، اوپن‌ای‌آی در حال اجرای برچسب گذاری برای ردیابی منشاء صدا است و نحوه استفاده از سیستم را نظارت خواهد کرد. هدف فهرست «صدای ممنوع» جلوگیری از تولید صدای چهره‌های برجسته است.

در حالی که تاریخ انتشار رسمی ناشناخته است، اطلاعات فاش شده نشان می‌دهد که موتور صوتی می‌تواند بسیار مقرون به صرفه باشد. این امر بسیاری از رقبا را از بین می‌برد و می‌تواند کتاب‌های صوتی تولید شده توسط هوش مصنوعی را وسوسه انگیز کند.

اعلامیه‌های اوپن‌ای‌آی فراتر از موتور صوتی است. این هفته، آنها همچنین از همکاری با مایکروسافت برای ساخت ابرکامپیوتر هوش مصنوعی «استارگیت» (Stargate) که یک پروژه ۱۰۰ میلیارد دلاری است، پرده برداشتند.

انتهای پیام/