چالشی جدید برای گویندگان/ هوش مصنوعی کتاب‌ صوتی تولید می‌کند

هوش مصنوعی با قابلیت‌های بی‌نظیرش برای گویندگان چالش ایجاد می‌کند؛ اما برخی از نویسندگان و ناشران هنوز هم تمایل دارند کتاب‌های صوتی را با صدای یک انسان بشنوند.

کد خبر : 865157

اشتراک گذاری

به گزارش خبرنگار خبرگزاری علم و فناوری آنا، سازنده صدای هوش مصنوعی «الون لبس» (ElevenLabs) اعلام کرد که شبیه‌سازی صوتی جدیدش اکنون از ۲۲ زبان دیگر از جمله اوکراینی، کره‌ای، سوئدی، عربی و ... پشتیبانی می‌کند.

به گفته وی، مولد صدای هوش مصنوعی از حالت بتا خارج شده و از سازندگان بازی‌های ویدئویی و کتاب‌های صوتی پشتیبانی خواهد کرد. مشکل جعل صدا با مجبورکردن کاربران به تأیید صدای خودشان، حل شده است.

این مدل جدید وعده می‌دهد که می‌تواند صدای غنی از احساس را در مجموع به ۳۰ زبان تولید کند. این شرکت دو ابزار صوتی هوش مصنوعی ارائه می‌دهد؛ یکی مدل متن به گفتار و دیگری «ویس لب» (VoiceLab).

این دو مدل به کاربران اجازه می‌دهد با وارد کردن بخش‌هایی از گفتار خود، یک صدا را شبیه‌سازی کنند تا نوعی مخروط صدا ایجاد شود. با مدل «وی۲» (v ۲) کاربران می‌توانند این صدا‌های تولید شده را به زبان‌های یونانی، مالایی یا ترکی صحبت کنند.

کاربران فقط باید متن را به زبان واقعی آن تایپ کنند تا صدای ترجمه شده را بشنوند و باید با هر کلون صوتی ایجاد شده توسط شرکت یا کاربران کار کند.

ارائه کتاب‌های صوتی مبتنی بر هوش مصنوعی

پلتفرم الون لبس پس از راه‌اندازی در سال گذشته، شاهد بحث و جدل‌های زیادی بوده است. پلتفرم بتای اولیه این شرکت، شاهد سوءاستفاده چهار نفر از کاربران از سیستم‌های آن برای جعل هویت افراد مشهور بود و آن‌ها را مجبور به گفتن نوشته‌های نژادپرستانه، بدگمانانه و ... می‌کرد.

این روش همچنین توسط هواخواهان هوش مصنوعی برای حمله به گویندگان که از استفاده گسترده از فناوری شبیه‌سازی صدا شکایت داشتند، مورد استفاده قرار گرفت. از آن زمان به بعد، الون لبس ادعا می‌کند که اقدامات یکپارچه خود را برای اطمینان از اینکه کاربران فقط می‌توانند صدای خود را شبیه‌سازی کنند، انجام می‌دهد. کاربران باید گفتار خود را با یک اسکرین‌شات متنی تایید کنند که سپس با نمونه صدای اصلی مقایسه می‌شود.

«ماتی استانیسزوسکی»، یکی از بنیان‌گذاران این شرکت در بیانیه‌ای گفت: «در نهایت امیدواریم با کمک هوش مصنوعی، زبان‌ها و صدا‌های بیشتری را پوشش دهیم و موانع زبانی محتوا را از بین ببریم.»

خارج از بتا، الون لبس در تلاش است تا صدا‌های هوش مصنوعی را در رسانه‌ها پخش کند. این اقدام نشان می‌دهد که فناوری شبیه‌سازی صدای هوش مصنوعی دیگر در فاز بتای خود قرار ندارد، درست همان‌طور که این شرکت در حال حفاری عمیق‌تر برای در دسترس قرار دادن این فناوری برای شرکت‌های رسانه‌ای استدر ماه ژوئن، الون لبس در کنار رئیس سابق «دیپ‌مایند» (DeepMind) که اکنون مصطفی سلیمان، هم‌بنیان‌گذار هوش مصنوعی «اینفلکشن» (Inflection) است، ۱۹ میلیون دلار سرمایه اولیه از افرادی نظیر اندرسن هوروویتز، سرمایه گذار حوزه فناوری دریافت کرد.

الون لبس فناوری شبیه‌سازی صدای خود را به عنوان راهی برای شرکت‌ها برای ایجاد کتاب‌های صوتی، ویدئو و حتی «ان‌پی‌سی» (NPC)‌های صوتی در بازی‌های ویدئویی ترویج می‌کند. این شرکت ادعا دارد که با ناشر بازی‌هایی مانند «لیگ قهرمانان اروپا» قرارداد بسته است.

در زمینه کتاب‌ها، غول‌های فناوری مانند گوگل و اپل تلاش کرده‌اند، کتاب‌های صوتی مبتنی بر هوش مصنوعی را عرضه کنند. برنامه کتاب‌های اپل شروع به نمایش راویانی با نام‌های مستعاری مانند «آرچی» و «وارن» برای بیان برخی محتوا کرده است. افرادی که به کتاب‌های صوتی گوش می‌دهند، به این نکته اشاره کرده‌اند که این صدا‌ها می‌توانند به ظهور و سقوط یک روایت توجه کنند.

اتحادیه بازیگران و انجمن نویسندگان آمریکا در حال حاضر در اعتصاب به سر می‌برند و بخش بزرگی از مذاکرات فعلی با صنعت سرگرمی بر هوش مصنوعی متمرکز شده است. با این حال، الون لبس تبلیغ می‌کند که صدا‌های هوش مصنوعی می‌توانند هم در زمان و هم در هزینه ایجاد کتاب‌های صوتی صرفه‌جویی کنند.

چالشی برای گویندگان به راه افتاد

در یک پست وبلاگی در روز دوشنبه، این شرکت اعلام کرد که با «لوکمن ادبی»، یک آژانس ادبی و یک شرکت انتشاراتی کوچک برای تنظیم دقیق پردازش کتاب صوتی خود همکاری کرده است. این شرکت ادعا کرد که تولید یک کتاب صوتی تنها چند هفته طول می‌کشد، اما با هوش مصنوعی به چند ساعت خلاصه می‌شود. لوکمن در کنار دیگر آثار داستانی به انتشار کتاب‌هایی از چهره‌های سرشناسی، چون «راتگر هویر» و «دالایی لاما» کمک کرده است؛ بنابراین برنامه‌ای برای تبدیل عناوین معرفی شده این آژانس به روایت هوش مصنوعی وجود نداشت. با این حال، وی در مورد کسب‌وکار نشر خود گفت که هرگز از روایت هوش مصنوعی استقبال نمی‌کند، زیرا کیفیت در آن وجود نداشت، اما از زمان آزمایش ویژگی‌های الون لبس به اندازه کافی تحت تاثیر قرار گرفته تا به‌طور بالقوه از آن استفاده کند. روایت هوش مصنوعی برای نویسندگان مستقل یک موهبت الهی است، زیرا بسیار ارزان‌تر از روایت انسانی است.

به گفته لوکمن هوش مصنوعی قطعا چالشی برای گویندگان ایجاد خواهد کرد، اما برخی از نویسندگان و ناشران هنوز هم تمایل دارند کتاب‌های صوتی را توسط صدای یک انسان بشنوند. پتانسیل صدور مجوز برای صدا‌و‌سیما نیز وجود دارد، سوال اصلی این است که این کار تا چه حد رایج خواهد بود، چقدر درآمد جدید به آن اضافه خواهد شد و آیا این امر منجر به کاهش درآمد نهایی صدا‌و‌سیما خواهد شد یا خیر.

چه فعالان حوزه صدا در نهایت بتوانند مجوز استفاده از صدای خود را به هوش مصنوعی بدهند یا ندهند، این نوع توافق‌ها هنوز برای صنعت نشر که بیش از پیش شیفته هوش مصنوعی شده است، بیگانه هستند. با ادامه اعتصاب، ممکن است زمان ببرد تا بفهمیم بازیگران بزرگ چگونه به صنعتی پاسخ می‌دهند که به دنبال راهی برای نقد کردن روند کتاب‌های صوتی است، اما بدون صدای واقعی انسان.

انتهای پیام/

گزارش خطا

پسندها : 2

اشتراک گذاری

ارسال نظر

پربازدید
آخرین اخبار
پربحث