صفحه نخست

آموزش و دانشگاه

علم‌وفناوری

ارتباطات و فناوری اطلاعات

ورزش

سلامت

پژوهش

سیاست

اقتصاد

فرهنگ‌ و‌ جامعه

علم +

عکس

فیلم

استانها

بازار

اردبیل

آذربایجان شرقی

آذربایجان غربی

اصفهان

البرز

ایلام

بوشهر

تهران

چهارمحال و بختیاری

خراسان جنوبی

خراسان رضوی

خراسان شمالی

خوزستان

زنجان

سمنان

سیستان و بلوچستان

فارس

قزوین

قم

کردستان

کرمان

کرمانشاه

کهگیلویه و بویراحمد

گلستان

گیلان

لرستان

مازندران

مرکزی

هرمزگان

همدان

یزد

هومیانا

پخش زنده

دیده بان پیشرفت علم، فناوری و نوآوری
۱۹:۳۰ - ۱۰ مرداد ۱۳۹۷

هوش مصنوعی لب‌خوانی می‌کند

میلیون‌ها نفر در جهان ناشنوا هستند. برای این افراد، لب‌خوانی دریچه‌ای به سوی مکالمه با افراد دیگر است که بدون آن کاملا تعامل‌شان را از دست خواهند داد و البته خود این لب‌خوانی کار بسیار دشوار و با خطای بسیار است. بر همین اساس متخصصان هوش مصنوعی‌ای را طراحی کرده‌اند که به لب‌خوانی افراد ناشنوا کمک می‌کند.
کد خبر : 300545

به گزارش گروه علم و فناوری خبرگزاری آنا از ساینس‌مگ، محققان خبر از طراحی یک هوش مصنوعی داده‌اند که از لب‌خوانان حرفه‌ای و بهترین برنامه هوش مصنوعی‌ای که تاکنون ساخته‌ شده است، بهره می‌برد. فقط کافی است که این برنامه به دستگاه هوشمندی وصل شود تا کل لب‌خوانی را کف دستان افراد ناشنوا بگذارد.


به گفته متخصصان، نوشتن کد کامپیوتری که بتواند لب‌خوانی کند کار بسیار سخت است. به همین دلیل دانشمندان در مطالعات جدید خود از نوعی هوش مصنوعی با عنوان یادگیری ماشینی بهره برده‌اند که این برنامه آزمون و خطا انجام می‌دهد و خودش تجربه کسب می‌کند و می‌آموزد.


برای این که این هوش مصنوعی لب‌خوانی را یاد بگیرد، محققان 140 هزار ساعت ویدئو از یوتیوب از افرادی که در شرایط مختلف در حال صحبت هستند را در اختیار این برنامه قرار دادند. سپس برنامه‌ای را طراحی کردند که کلیپ‌های چند ثانیه‌ای از حرکات لب برای ادای کلمات تولید می‌کرد.


این برنامه سخنرانی‌های غیرانگلیسی، صورت‌هایی که اصلا صحبت نمی‌کنند، ویدئوهای بی‌کیفیت و همچنین آنهایی که صورت فرد به صورت کامل مشخص نیست را از بقیه جدا می‌کرد. سپس تکه‌هایی از ویدئو را که در آنها صورت و لب‌های افراد مشخص بودند، ذخیره کردند. نتیجه این کار 4 هزار ساعت ویدئو از مکالمات انسانی باقی ماند که در آنها به‌درستی حرکات لب قابل دیدن و شناسایی است و شامل 127 هزار کلمه انگلیسی است.


حسن اکبری، دانشمند کامپیوتر دانشگاه کلمبیا که نقشی در این پروژه نداشته، می‌گوید: «کل فرآیند گفته شده و همچنین تنظیم اطلاعات نتیجه‌گیری شده، هفت برابر سخت‌تر از زمانی است که می‌خواهید سیستم لب‌خوانی را به یک انسان یاد دهید».


فرایند یادگیری لب‌خوانی به هوش مصنوعی در این بخش به شبکه عصبی مصنوعی متکی است. الگوریتم‌های هوش مصنوعی حاوی بسیاری از عناصر محاسباتی ساده متصل با یکدیگر هستند که اطلاعات را به نحوی شبیه به مغز انسان یاد می‌گیرند و پردازش می‌کنند.


انتهای پیام/4056


انتهای پیام/

ارسال نظر