تفکیک صدای افراد مختلف حتی دریک محیط شلوغ

گوگل با استفاده از هوش مصنوعی، سیستمی طراحی کرده است که می‌تواند صدای افراد مختلف را از هم تمیز دهد. حتی اگر آنها در یک محیط پراز سر و صدا حضور داشته باشند.

کد خبر : 272627

اشتراک گذاری

به گزارش گروه رسانه‌های دیگر خبرگزاری آنا، معمولا انسان‌ها قادرند تا یک صدا را حتی در میان شلوغی نیز تشخیص دهند اما تاکنون این توانایی در رایانه‌های موجود متدوال نبوده است.

کافی است در یک مهمانی یا یک مکان پراز سر و صدا با دستیار صوتی گوشی هوشمند خود صحبت کنید تا عدم توانایی گوشی برای تفکیک صدا را مشاهده کنید.

در همین راستا گوگل یک راه حل شگفت آور ارائه داده است و محققان آن یک سیستم عمیق یادگیری تولید کرده‌اند که می‌تواند با تماشای چهره مردم به هنگام صحبت کردن، صدای آنها را تشخیص دهد و بیاید.

این تیم تحقیقاتی در ابتدا مدل شبکه عصبی این فناوری را به نحوی طراحی کردند که بتواند افرادی که با خودشان در حال صحبت کردن هستند را تشخیص دهد، سپس این مدل را به یک مهمانی مجازی تغییر دادند و در پیش زمینه آن صداهای گوناگونی را افزود.

هدف از ایجاد مهمانی مجازی این بود که به بخش هوش مصنوعی (AI) سیستم آموزش داده شود که چگونه چند صدای مختلف را به آهنگ‌های صوتی مجزا مبدل سازد.

این سیستم به نحوی طراحی شده است که حتی اگر فرد با دستانش صورت خود را بپوشاند، باز هم بتواندصدای فرد را تشخیص دهد.

گوگل اخیرا به دنبال کاوش فرصت‌ها است تا بتواند از این سیستم در محصولات و فناوری‌های خود استفاده کند.

به عنوان مثال این سیستم برای سرویس‌های چت ویدئویی یک امکان ایده آل محسوب می‌شود زیرا به کاربر این امکان را می‌دهد که حتی اگر با فردی که در یک اتاق شلوغ است، در حال گفت‌وگو است، بتواندبه راحتی صدای وی را تشخیص دهد.

این سیستم همچنین می‌تواند برای افزایش کیفیت صدا به هنگام ضبط ویدئو نیز مفید باشد.

منبع: ایسنا

انتهای پیام/