صفحه نخست

آناتک

آنامدیا

دانشگاه

فرهنگ‌

علم

سیاست و جهان

اقتصاد

ورزش

عکس

فیلم

استانها

بازار

اردبیل

آذربایجان شرقی

آذربایجان غربی

اصفهان

البرز

ایلام

بوشهر

تهران

چهارمحال و بختیاری

خراسان جنوبی

خراسان رضوی

خراسان شمالی

خوزستان

زنجان

سمنان

سیستان و بلوچستان

فارس

قزوین

قم

کردستان

کرمان

کرمانشاه

کهگیلویه و بویراحمد

گلستان

گیلان

لرستان

مازندران

مرکزی

همدان

هرمزگان

یزد

پخش زنده

۱۵:۵۰ | ۰۲ / ۰۴ /۱۴۰۵
| |
در گفت‌وگو با آناتک مطرح شد:

تشخیص ویدئو‌های جعلی در عصر هوش‌مصنوعی هر روز مشکل‌تر می‌شود

نسل تازه مدل‌های هوش‌مصنوعی، مفهوم اصالت در محتوای بصری را وارد مرحله‌ای جدید و تا حدودی بحرانی کرده است. امروز در فضایی زندگی می‌کنیم که پیشرفت روزافزون هوش‌مصنوعی مولد تشخیص حقیقت از جعل را بیش از هر زمان دیگر دشوار می‌نماید. در این وضع ارزش نشانه‌های ظاهری برای تشخیص محتوای واقعی کاهش یافته است و مانند قبل، دیگر فقط پیدا کردن اشتباهات در آنها کافی نیست.
کد خبر : 1063383

از سوی دیگر مسئله فقط تولید تصویر یا ویدئو نیست، بلکه توانایی این سیستم‌ها در شبیه‌سازی برای باورپذیر کردن آنهاست؛ اتفاقی که می‌تواند بنیان اعتماد در فضای دیجیتال را متزلزل کند. در این اوضاع باید چه کرد؟ به بررسی این پرسش و پرسش‌های دیگر در این زمینه به گفت‌وگو با سید تقی کمالی، پژوهشگر ارشد حکمرانی دیجیتال، پرداختیم.

تشخیص ویدئو‌های ساخته شده با هوش‌مصنوعی سخت‌تر است یا تصاویر و چرا؟

تشخیص ویدئو‌های تولیدشده توسط هوش‌مصنوعی دشوارتر از تصاویر است. این مسئله ناشی از چندلایه بودن اطلاعات، اثر روان‌شناختی حرکت و پیشرفت مدل‌های ویدئوساز است. در تصویر تنها یک قاب وجود دارد، اما در ویدئو باید هم‌زمان تصویر، حرکت، زمان و صدا تحلیل شوند.

مطالعات علوم‌شناختی نیز نشان داده‌اند که مغز انسان حرکت روان را به‌ عنوان نشانه‌ای از واقعیت تفسیر می‌کند بنابراین احتمال فریب خوردن در برابر ویدئو‌ها بیشتر است. سری جدید مدل‌های تولید ویدئو توانسته‌اند بسیاری از خطا‌های آشکار گذشته را برطرف کرده و کیفیتی نزدیک به واقعیت ایجاد کنند.

حرکت افراد و اشیا در ویدئو‌های ساخته شده با هوش‌مصنوعی به سطح طبیعی و انسانی رسیده است؟

مطالعات علوم‌شناختی نیز نشان داده‌اند که مغز انسان حرکت روان را به‌ عنوان نشانه‌ای از واقعیت تفسیر می‌کند بنابراین احتمال فریب خوردن در برابر ویدئو‌ها بیشتر است. سری جدید مدل‌های تولید ویدئو توانسته‌اند بسیاری از خطا‌های آشکار گذشته را برطرف کرده و کیفیتی نزدیک به واقعیت ایجاد کنند

در بسیاری از موارد نزدیک شده است، اما هنوز کامل نیست. بررسی‌ها نشان می‌دهد که مدل‌های پیشرفته در بازسازی راه‌ رفتن، دویدن، حرکات دست و تعاملات ساده اجتماعی عملکرد بالایی دارند، اما هنوز مشکلاتی در ریزحرکت‌های انسانی وجود دارد، زیرا انسان‌ها دائماً در حال انجام حرکات بسیار ظریف هستند و بسیاری از مدل‌های ویدئوساز هنوز در بازتولید این حرکات کاملاً موفق نیستند. ناهمخوانی زمانی و ترتیبی اشیا هم در این‌گونه ویدئو‌ها قابل مشاهده است. گاهی در طول ویدئو تغییر شکل، جابه‌جایی گوش، تغییر ناگهانی عینک و تغییر ابعاد انگشتان مشاهده می‌شود. 

در ویدئو‌ها صدای افراد و پس‌زمینه نیز وجود دارد، صدا‌های ساخته شده با هوش‌مصنوعی چه ویژگی‌هایی دارند که باید به آن توجه کرد؟

صدا‌های مصنوعی نیز پیشرفت چشمگیری داشته‌اند. در تشخیص صدا‌های مصنوعی چند ویژگی قابل توجه است از جمله یکنواختی آوایی، تنفس غیرطبیعی، احساسات مصنوعی و ناسازگاری محیطی. در بسیاری از صدا‌های مصنوعی زیر و بم صدا بیش از حد منظم است، تغییرات طبیعی گفتار کمتر دیده می‌شود و ریتم گفتار بیش از حد پایدار است. در گفتار طبیعی تنفس بخشی از ساختار آوایی است، اما تا این اواخر مدل‌های مصنوعی در بازتولید الگو‌های پیچیده تنفس با محدودیت مواجه بوده‌اند و اخیراً پیشرفت‌های خوبی در این زمینه حاصل شده است و برخی مدل‌های جدید تا اندازه‌ای تغییرات ظریف حجم و مکان تنفس را اعمال می‌کنند. همچنین هیجان‌ها مانند ترس، خشم و غم در گفتار واقعی دارای تغییرات ظریف فراوانی هستند که بازسازی کامل آنها برای سامانه‌های مصنوعی دشوار است. گاهی نیز صدای محیط با ویژگی‌های آکوستیک فضای نمایش داده شده سازگار نیست.

آیا تشخیص این ویدئو‌ها به علت پیشرفت روزافزون هوش‌مصنوعی سخت‌تر شده است؟

بله همین‌طور است. نکاتی که به آنها اشاره کردم از جمله مواردی هستند که همچنان قدرت تشخیص را نزد کاربران بالا نگه می‌دارد با این حال لازم به ذکر است که در روند توسعه فناورانه این امر پیچیده‌تر و تخصصی‌تر شده و نیاز به مراجعه به متخصصان خبره و سامانه‌های هوشمند برای تشخیص، راستی‌آزمایی و اعتبارسنجی است. هر سری جدید از مدل‌های مولد موجب کاهش کارایی آشکارساز‌های نسل قبل می‌شود. در نتیجه بسیاری از پژوهشگران معتقدند که آینده این حوزه نه در تشخیص جعل بلکه در تأیید اصالت محتوا قرار دارد.

باید گفت که هیچ شاخص منحصربه‌فردی برای تشخیص محتوای تولید شده توسط هوش‌مصنوعی وجود ندارد. اگرچه خطا‌های آناتومیک، ناسازگاری‌های فیزیکی، ناهمخوانی‌های زمانی و ویژگی‌های صوتی می‌توانند نشانه‌هایی از مصنوعی بودن محتوا باشند، اما پیشرفت سریع مدل‌های مولد موجب کاهش ارزش تشخیصی این نشانه‌ها شده است. به همین دلیل رویکرد‌های نوین به سمت اعتبارسنجی منشأ محتوا، امضای دیجیتال، واترمارک‌های نامرئی و سامانه‌های تأیید اصالت حرکت می‌کنند. این رویکردی است که احتمالاً در دهه آینده به استاندارد اصلی اعتماد دیجیتال تبدیل خواهد شد.

ارسال نظر
captcha