هوش مصنوعی ادوبی ویدئو‌های تار را ۸ برابر واضح‌تر می‌کند

جدیدترین ابزار هوش مصنوعی ادوبی به جزئیات ظریف مانند بافت پوست و حتی تار‌های تکی مو توجه ویژه‌ای دارد و می‌تواند ویدئو‌ها را ۸ برابر واضح‌تر کند.

کد خبر : 908752

اشتراک گذاری

به گزارش خبرگزاری علم و فناوری آنا به نقل از اینترستینگ اینجینرینگ، محققان ادوبی از «ویدئو گیگا گان» (VideoGigaGAN)، یک مدل خلاقانه هوش مصنوعی که می‌تواند حوزه ویرایش ویدئو را متحول کند، رونمایی کردند. این فناوری جدید می‌تواند کیفیت و وضوح ویدئوهای موجود، قدیمی و تار را تا ۸ برابر افزایش دهد.

وب سایت این پروژه همچنین ویدئوهای نمایشی این مدل هوش مصنوعی را منتشر کرده است. این ویدئوها قابلیت «ویدئو گیگا گان» را برای گرفتن ویدئوهای تار و با وضوح پایین و تبدیل آنها به فیلم‌های بکر و با کیفیت بالا نشان می‌دهد.

از طریق این توسعه، ادوبی قصد دارد به طور بالقوه استاندارد جدیدی برای بازیابی و بهبود ویدیو ارائه دهد. تصور کنید که ویدیوی مورد علاقه خود را از یک فرم تار و پیکسلی (رزولوشن ۱۲۸×۱۲۸) به یک شاهکار واضح و با جزئیات ۱۰۲۴×۱۰۲۴ تبدیل کنید.

همچنین، این فناوری به سادگی وضوح را افزایش نمی‌دهد. در ویدئوهایی که موجودات زنده را به نمایش می‌گذارند، به جزئیات ظریف مانند بافت پوست، چین و چروک‌ها و تک تک رشته‌های مو توجه ویژه‌ای می‌کند.

طبق گفته محققان، «ویدئو گیگا گان» یک مدل جدید «وی اس آر» VSR (ویدئو با وضوح فوق العاده) است که می‌تواند ویدئوهایی با جزئیات فرکانس بالا و سازگاری زمانی تولید کند.

توجه به جزئیات

در حالی که مفهوم ارتقای مقیاس ویدیو جدید نیست، چیزی که «ویدئو گیگا گان» را متمایز می‌کند توجه آن به جزئیات است.

محققان می‌گویند: آزمایش‌های ما نشان می‌دهد که برخلاف روش‌های قبلی «وی اس آر»، «ویدئو گیگا گان» ویدئوهای سازگار زمانی با جزئیات ظاهری ظریف‌تر تولید می‌کند. ما کارایی «ویدئو گیگا گان» را با مقایسه آن با مدل‌های پیشرفته «وی اس آر» در مجموعه داده‌های عمومی و نمایش نتایج ویدیویی با وضوح فوق‌العاده ۸ برابر تأیید می‌کنیم.

اصطلاح «گان» (GAN) در «ویدئو گیگا گان» مخفف شبکه متخاصم مولد است، یک تکنیک هوش مصنوعی که برای ایجاد تصاویر واقعی شناخته شده است. مدل ادوبی مبتنی بر «گیگا گان» (GigaGAN) است، سیستمی که برای ارتقاء محتوای تصویر طراحی شده است.

اما ویدئوها از چندین فریم به صورت متوالی پخش می‌شوند. حفظ ثبات بین این فریم ها، حذف اشکالات بصری، و حفظ جزئیات واضح در طول ویدیو چالش برانگیز است. محققان ادوبی با ترکیبی از نوآوری‌های فنی بر این چالش‌ها غلبه کرده اند.

در مقاله تحقیقاتی آمده است: مدل ما قادر به نمونه‌برداری ۸ برابری ویدیویی با ثبات زمانی خوب و کیفیت در هر فریم با جزئیات غنی است.

محدودیت‌ها و برنامه‌های آینده

با این حال، برخی از مشکلات با «ویدئو گیگا گان» نیز وجود دارد. در حال حاضر، مدل هوش مصنوعی با مشکلاتی برای ویدئوهای بیش از ۲۰۰ فریم و رندر کردن اجسام کوچک در داخل فیلم مواجه است. هنگامی که این مسائل حل شود، این فناوری جدید می‌تواند آینده کار خلاقانه را شکل دهد.

در همین حال، ادوبی به طور فعال هوش مصنوعی را در نرم افزار خود ادغام کرده است.

انتهای پیام/