چالشی جدید برای گویندگان/ هوش مصنوعی کتاب صوتی تولید میکند
به گزارش خبرنگار خبرگزاری علم و فناوری آنا، سازنده صدای هوش مصنوعی «الون لبس» (ElevenLabs) اعلام کرد که شبیهسازی صوتی جدیدش اکنون از ۲۲ زبان دیگر از جمله اوکراینی، کرهای، سوئدی، عربی و ... پشتیبانی میکند.
به گفته وی، مولد صدای هوش مصنوعی از حالت بتا خارج شده و از سازندگان بازیهای ویدئویی و کتابهای صوتی پشتیبانی خواهد کرد. مشکل جعل صدا با مجبورکردن کاربران به تأیید صدای خودشان، حل شده است.
این مدل جدید وعده میدهد که میتواند صدای غنی از احساس را در مجموع به ۳۰ زبان تولید کند. این شرکت دو ابزار صوتی هوش مصنوعی ارائه میدهد؛ یکی مدل متن به گفتار و دیگری «ویس لب» (VoiceLab).
این دو مدل به کاربران اجازه میدهد با وارد کردن بخشهایی از گفتار خود، یک صدا را شبیهسازی کنند تا نوعی مخروط صدا ایجاد شود. با مدل «وی۲» (v ۲) کاربران میتوانند این صداهای تولید شده را به زبانهای یونانی، مالایی یا ترکی صحبت کنند.
کاربران فقط باید متن را به زبان واقعی آن تایپ کنند تا صدای ترجمه شده را بشنوند و باید با هر کلون صوتی ایجاد شده توسط شرکت یا کاربران کار کند.
ارائه کتابهای صوتی مبتنی بر هوش مصنوعی
پلتفرم الون لبس پس از راهاندازی در سال گذشته، شاهد بحث و جدلهای زیادی بوده است. پلتفرم بتای اولیه این شرکت، شاهد سوءاستفاده چهار نفر از کاربران از سیستمهای آن برای جعل هویت افراد مشهور بود و آنها را مجبور به گفتن نوشتههای نژادپرستانه، بدگمانانه و ... میکرد.
این روش همچنین توسط هواخواهان هوش مصنوعی برای حمله به گویندگان که از استفاده گسترده از فناوری شبیهسازی صدا شکایت داشتند، مورد استفاده قرار گرفت. از آن زمان به بعد، الون لبس ادعا میکند که اقدامات یکپارچه خود را برای اطمینان از اینکه کاربران فقط میتوانند صدای خود را شبیهسازی کنند، انجام میدهد. کاربران باید گفتار خود را با یک اسکرینشات متنی تایید کنند که سپس با نمونه صدای اصلی مقایسه میشود.
«ماتی استانیسزوسکی»، یکی از بنیانگذاران این شرکت در بیانیهای گفت: «در نهایت امیدواریم با کمک هوش مصنوعی، زبانها و صداهای بیشتری را پوشش دهیم و موانع زبانی محتوا را از بین ببریم.»
خارج از بتا، الون لبس در تلاش است تا صداهای هوش مصنوعی را در رسانهها پخش کند. این اقدام نشان میدهد که فناوری شبیهسازی صدای هوش مصنوعی دیگر در فاز بتای خود قرار ندارد، درست همانطور که این شرکت در حال حفاری عمیقتر برای در دسترس قرار دادن این فناوری برای شرکتهای رسانهای استدر ماه ژوئن، الون لبس در کنار رئیس سابق «دیپمایند» (DeepMind) که اکنون مصطفی سلیمان، همبنیانگذار هوش مصنوعی «اینفلکشن» (Inflection) است، ۱۹ میلیون دلار سرمایه اولیه از افرادی نظیر اندرسن هوروویتز، سرمایه گذار حوزه فناوری دریافت کرد.
الون لبس فناوری شبیهسازی صدای خود را به عنوان راهی برای شرکتها برای ایجاد کتابهای صوتی، ویدئو و حتی «انپیسی» (NPC)های صوتی در بازیهای ویدئویی ترویج میکند. این شرکت ادعا دارد که با ناشر بازیهایی مانند «لیگ قهرمانان اروپا» قرارداد بسته است.
در زمینه کتابها، غولهای فناوری مانند گوگل و اپل تلاش کردهاند، کتابهای صوتی مبتنی بر هوش مصنوعی را عرضه کنند. برنامه کتابهای اپل شروع به نمایش راویانی با نامهای مستعاری مانند «آرچی» و «وارن» برای بیان برخی محتوا کرده است. افرادی که به کتابهای صوتی گوش میدهند، به این نکته اشاره کردهاند که این صداها میتوانند به ظهور و سقوط یک روایت توجه کنند.
اتحادیه بازیگران و انجمن نویسندگان آمریکا در حال حاضر در اعتصاب به سر میبرند و بخش بزرگی از مذاکرات فعلی با صنعت سرگرمی بر هوش مصنوعی متمرکز شده است. با این حال، الون لبس تبلیغ میکند که صداهای هوش مصنوعی میتوانند هم در زمان و هم در هزینه ایجاد کتابهای صوتی صرفهجویی کنند.
چالشی برای گویندگان به راه افتاد
در یک پست وبلاگی در روز دوشنبه، این شرکت اعلام کرد که با «لوکمن ادبی»، یک آژانس ادبی و یک شرکت انتشاراتی کوچک برای تنظیم دقیق پردازش کتاب صوتی خود همکاری کرده است. این شرکت ادعا کرد که تولید یک کتاب صوتی تنها چند هفته طول میکشد، اما با هوش مصنوعی به چند ساعت خلاصه میشود. لوکمن در کنار دیگر آثار داستانی به انتشار کتابهایی از چهرههای سرشناسی، چون «راتگر هویر» و «دالایی لاما» کمک کرده است؛ بنابراین برنامهای برای تبدیل عناوین معرفی شده این آژانس به روایت هوش مصنوعی وجود نداشت. با این حال، وی در مورد کسبوکار نشر خود گفت که هرگز از روایت هوش مصنوعی استقبال نمیکند، زیرا کیفیت در آن وجود نداشت، اما از زمان آزمایش ویژگیهای الون لبس به اندازه کافی تحت تاثیر قرار گرفته تا بهطور بالقوه از آن استفاده کند. روایت هوش مصنوعی برای نویسندگان مستقل یک موهبت الهی است، زیرا بسیار ارزانتر از روایت انسانی است.
به گفته لوکمن هوش مصنوعی قطعا چالشی برای گویندگان ایجاد خواهد کرد، اما برخی از نویسندگان و ناشران هنوز هم تمایل دارند کتابهای صوتی را توسط صدای یک انسان بشنوند. پتانسیل صدور مجوز برای صداوسیما نیز وجود دارد، سوال اصلی این است که این کار تا چه حد رایج خواهد بود، چقدر درآمد جدید به آن اضافه خواهد شد و آیا این امر منجر به کاهش درآمد نهایی صداوسیما خواهد شد یا خیر.
چه فعالان حوزه صدا در نهایت بتوانند مجوز استفاده از صدای خود را به هوش مصنوعی بدهند یا ندهند، این نوع توافقها هنوز برای صنعت نشر که بیش از پیش شیفته هوش مصنوعی شده است، بیگانه هستند. با ادامه اعتصاب، ممکن است زمان ببرد تا بفهمیم بازیگران بزرگ چگونه به صنعتی پاسخ میدهند که به دنبال راهی برای نقد کردن روند کتابهای صوتی است، اما بدون صدای واقعی انسان.
انتهای پیام/