نرمافزار لبخوانی که راز تصاویر بیصدا را فاش میکند
به گزارش گروه علم و فناوری آنا به نقل از BBC، این محققان معتقدند که این نرمافزار کاربرد وسیعی خواهد داشت، از تحقیقات جنایی گرفته تا مقابله با تروریسم یا هر شرایطی که صدا آنقدر خوب نیست که بشود فهمید دیگران چه میگویند.
یکی از نیازهای پلیس و نیروهای امنیتی این است که در بازبینی دوربینهای مدار بسته از آنچه مظنونان میگویند مطلع شوند. علاوه بر این خبرنگاران هم برای فهمیدن آنچه چهرههای سرشناس میگویند به چنین نرمافزاری نیاز و علاقه خواهند داشت.
هلن بر، از دانشکده علوم کامپیوتر دانشگاه ایست انگلیا، میگوید: «اگر تکنولوژی لبخوانی خوبی داشتیم، میتوانستیم واکنش زیدان را بهتر درک کنیم، شاید هم هر دو اخراج میشدند».
اشاره بر به فینال جام جهانی ۲۰۰۶ بین ایتالیا و فرانسه است که زیدان، ستاره فوتبال فرانسه، به دلیل کله زدن به مارکو ماتراتزی بازیکن ایتالیا اخراج شد در حالی که به نظر میرسید حرفهایی که ماتراتزی به او میزد باعث واکنش زیدان شد.
او میگوید: «از لبخوانی برای فهمیدن آنچه بازیکنان فوتبال در لحظات پرتنش مسابقه میگویند قبلا استفاده شده اما به احتمال زیاد عملیترین کاربرد آن در مواقعی است که سر و صدای زیادی وجود دارد مثلا در ماشین یا در کابین خلبان هواپیما».
او میافزاید: «با اینکه این نرمافزار هنوز باید دقیقتر شود، نکته مهم این است که آن را در موارد بسیاری میتوان به کار گرفت، مثلا برای کسانی که نقص شنوایی یا گفتاری دارند».
محققان میگویند برای افرادی که متخصص لبخوانی هستند تمایز بین صداهایی مثل «ب» یا «پ» یا «م» کار بسیار دشواری است اما این نرمافزار میتواند بین این صداها تمایز بگذارد و متن دقیقتری فراهم کند.
ریچارد هاروی یکی از دیگر مبتکران این سیستم میگوید: «لبخوانی یکی از بزرگترین چالشها در هوش مصنوعی است بنابراین پیشرفت این جنبه دشوار اتفاق بسیار خوبی است، یعنی اینکه بتوانیم ماشین را برای تشخیص ظاهر و شکل لب انسان تخصصی کنیم».
انتهای پیام/