هوش مصنوعی ادوبی ویدئوهای تار را ۸ برابر واضحتر میکند
به گزارش خبرگزاری علم و فناوری آنا به نقل از اینترستینگ اینجینرینگ، محققان ادوبی از «ویدئو گیگا گان» (VideoGigaGAN)، یک مدل خلاقانه هوش مصنوعی که میتواند حوزه ویرایش ویدئو را متحول کند، رونمایی کردند. این فناوری جدید میتواند کیفیت و وضوح ویدئوهای موجود، قدیمی و تار را تا ۸ برابر افزایش دهد.
وب سایت این پروژه همچنین ویدئوهای نمایشی این مدل هوش مصنوعی را منتشر کرده است. این ویدئوها قابلیت «ویدئو گیگا گان» را برای گرفتن ویدئوهای تار و با وضوح پایین و تبدیل آنها به فیلمهای بکر و با کیفیت بالا نشان میدهد.
از طریق این توسعه، ادوبی قصد دارد به طور بالقوه استاندارد جدیدی برای بازیابی و بهبود ویدیو ارائه دهد. تصور کنید که ویدیوی مورد علاقه خود را از یک فرم تار و پیکسلی (رزولوشن ۱۲۸×۱۲۸) به یک شاهکار واضح و با جزئیات ۱۰۲۴×۱۰۲۴ تبدیل کنید.
همچنین، این فناوری به سادگی وضوح را افزایش نمیدهد. در ویدئوهایی که موجودات زنده را به نمایش میگذارند، به جزئیات ظریف مانند بافت پوست، چین و چروکها و تک تک رشتههای مو توجه ویژهای میکند.
طبق گفته محققان، «ویدئو گیگا گان» یک مدل جدید «وی اس آر» VSR (ویدئو با وضوح فوق العاده) است که میتواند ویدئوهایی با جزئیات فرکانس بالا و سازگاری زمانی تولید کند.
توجه به جزئیات
در حالی که مفهوم ارتقای مقیاس ویدیو جدید نیست، چیزی که «ویدئو گیگا گان» را متمایز میکند توجه آن به جزئیات است.
محققان میگویند: آزمایشهای ما نشان میدهد که برخلاف روشهای قبلی «وی اس آر»، «ویدئو گیگا گان» ویدئوهای سازگار زمانی با جزئیات ظاهری ظریفتر تولید میکند. ما کارایی «ویدئو گیگا گان» را با مقایسه آن با مدلهای پیشرفته «وی اس آر» در مجموعه دادههای عمومی و نمایش نتایج ویدیویی با وضوح فوقالعاده ۸ برابر تأیید میکنیم.
اصطلاح «گان» (GAN) در «ویدئو گیگا گان» مخفف شبکه متخاصم مولد است، یک تکنیک هوش مصنوعی که برای ایجاد تصاویر واقعی شناخته شده است. مدل ادوبی مبتنی بر «گیگا گان» (GigaGAN) است، سیستمی که برای ارتقاء محتوای تصویر طراحی شده است.
اما ویدئوها از چندین فریم به صورت متوالی پخش میشوند. حفظ ثبات بین این فریم ها، حذف اشکالات بصری، و حفظ جزئیات واضح در طول ویدیو چالش برانگیز است. محققان ادوبی با ترکیبی از نوآوریهای فنی بر این چالشها غلبه کرده اند.
در مقاله تحقیقاتی آمده است: مدل ما قادر به نمونهبرداری ۸ برابری ویدیویی با ثبات زمانی خوب و کیفیت در هر فریم با جزئیات غنی است.
محدودیتها و برنامههای آینده
با این حال، برخی از مشکلات با «ویدئو گیگا گان» نیز وجود دارد. در حال حاضر، مدل هوش مصنوعی با مشکلاتی برای ویدئوهای بیش از ۲۰۰ فریم و رندر کردن اجسام کوچک در داخل فیلم مواجه است. هنگامی که این مسائل حل شود، این فناوری جدید میتواند آینده کار خلاقانه را شکل دهد.
در همین حال، ادوبی به طور فعال هوش مصنوعی را در نرم افزار خود ادغام کرده است.
انتهای پیام/