تفکیک صدای افراد مختلف حتی دریک محیط شلوغ
به گزارش گروه رسانههای دیگر خبرگزاری آنا، معمولا انسانها قادرند تا یک صدا را حتی در میان شلوغی نیز تشخیص دهند اما تاکنون این توانایی در رایانههای موجود متدوال نبوده است.
کافی است در یک مهمانی یا یک مکان پراز سر و صدا با دستیار صوتی گوشی هوشمند خود صحبت کنید تا عدم توانایی گوشی برای تفکیک صدا را مشاهده کنید.
در همین راستا گوگل یک راه حل شگفت آور ارائه داده است و محققان آن یک سیستم عمیق یادگیری تولید کردهاند که میتواند با تماشای چهره مردم به هنگام صحبت کردن، صدای آنها را تشخیص دهد و بیاید.
این تیم تحقیقاتی در ابتدا مدل شبکه عصبی این فناوری را به نحوی طراحی کردند که بتواند افرادی که با خودشان در حال صحبت کردن هستند را تشخیص دهد، سپس این مدل را به یک مهمانی مجازی تغییر دادند و در پیش زمینه آن صداهای گوناگونی را افزود.
هدف از ایجاد مهمانی مجازی این بود که به بخش هوش مصنوعی (AI) سیستم آموزش داده شود که چگونه چند صدای مختلف را به آهنگهای صوتی مجزا مبدل سازد.
این سیستم به نحوی طراحی شده است که حتی اگر فرد با دستانش صورت خود را بپوشاند، باز هم بتواندصدای فرد را تشخیص دهد.
گوگل اخیرا به دنبال کاوش فرصتها است تا بتواند از این سیستم در محصولات و فناوریهای خود استفاده کند.
به عنوان مثال این سیستم برای سرویسهای چت ویدئویی یک امکان ایده آل محسوب میشود زیرا به کاربر این امکان را میدهد که حتی اگر با فردی که در یک اتاق شلوغ است، در حال گفتوگو است، بتواندبه راحتی صدای وی را تشخیص دهد.
این سیستم همچنین میتواند برای افزایش کیفیت صدا به هنگام ضبط ویدئو نیز مفید باشد.
منبع: ایسنا
انتهای پیام/