صحبت بدون تارهای صوتی با برچسب هوش مصنوعی
به گزارش خبرگزاری علم و فناوری آنا به نقل از اینترستینگ اینجینرینگ، صحبت کردن اغلب برای افرادی که ناهنجاریهای صوتی دارند، از جمله کسانی که بیماریهای پاتولوژیک تارهای صوتی دارند یا پس از انجام عملهای سرطان حنجره در حال بهبودی هستند، چالشبرانگیز یا غیرممکن است.
برای کمک به چنین مواردی، محققان دانشگاه «یو سی ال ای» (UCLA) ابزاری سبک، انعطافپذیر و نرم ساختهاند که کمی بزرگتر از یک اینچ مربع است که با نصب روی پوست گلو به افرادی که تارهای صوتی ناقص دارند کمک کند تا توانایی صحبت کردن خود را بازیابی کنند.
با کمک فناوری یادگیری ماشینی، این دستگاه میتواند سیگنالهای ماهیچههای حنجره متحرک فرد را با دقت تقریباً ۹۵ درصد به گفتار قابل شنیدن تفسیر کند.
گروه مهندسی دانشکده ساموئلی یوسیالای قبلاً دستکش پوشیدنی ایجاد کرده بود که میتوانست گفتار زبان اشاره آمریکایی (ASL) را به زبان انگلیسی ترجمه کند و ارتباط بین کاربران را تسهیل کند. جزئیات تحقیق این محققان در مجله «نیچر کامیونیکشنز» منتشر شده است.
تبدیل سیگنال حرکتی ماهیچهها به صدا
این اختراع دستگاهی نوآورانه، کاربرپسند و وصلهمانند است که از دو قسمت تشکیل شده: یک جزء حسگر مستقل است که سیگنالهای حرکتی ماهیچهها را به سیگنالهای الکتریکی قابل تجزیه و تحلیل، با دقت بالا تشخیص داده و ترجمه میکند. سپس یک الگوریتم یادگیری ماشینی این دادههای الکتریکی را به سیگنالهای گفتاری ترجمه میکند. در نهایت این تکانههای گفتاری به صدای مورد نظر تبدیل میشوند.
به گفته محققان، هر جزء دارای دو لایه است: یک لایه القای مغناطیسی متشکل از سیم پیچهای القایی مس و یک لایه از ترکیب سیلیکونی زیست سازگار پلی دی متیل سیلوکسان یا «پیدیاماس» (PDMS) با ویژگیهای الاستیک. لایه پنجم که میدان مغناطیسی ایجاد میکند، بین دو جزء دیگر قرار گرفته و حاوی پلی دی متیل سیلوکسان همراه با ریزمغناطیس است.
این دستگاه با استفاده از ۲ جزء و ۵ لایه، حرکت ماهیچهها را به سیگنالهای الکتریکی تبدیل میکند. سپس توسط یک مدل یادگیری ماشین به سیگنالهای گفتاری برای بیان شنیداری ترجمه میشود.
این گجت میتواند تغییرات میدان مغناطیسی ناشی از نیروهای مکانیکی، مانند حرکت عضلات حنجره را تشخیص دهد؛ زیرا از مکانیزم حسگر مغناطیسی الاستیک نرمی استفاده میکند که تیم چن در سال ۲۰۲۱ ایجاد کرد.
قابلیت استفاده این دستگاه به ابعاد آن کمک میکند که در هر طرف فقط ۱.۲ اینچ قطر و حدود ۷ گرم وزن دارد و تنها ۰.۰۶ اینچ ضخامت دارد. نوار دو طرفه زیست سازگار به راحتی روی گردن نزدیک آکوردهای صوتی نصب میشود و میتوان با استفاده مجدد از نوار در صورت لزوم دوباره از آن استفاده کرد.
راه حلهای موجود مانند دستگاههای ویبراتور حنجره و روشهای سوراخ کردن نای مری میتوانند ناخوشایند، تهاجمی یا ناراحت کننده باشند. جون چن، سرپرست گروه تحقیقاتی بیوالکترونیک پوشیدنی در «یو سی ال ای»، گفت: این دستگاه جدید گزینهای پوشیدنی و غیر تهاجمی را ارائه میدهد که میتواند به بیماران در برقراری ارتباط در طول دوره قبل از درمان و دوره بهبودی پس از درمان برای اختلالات صوتی کمک کند.
نقش یادگیری ماشینی چیست؟
هشت فرد سالم در آزمایشاتی شرکت کردند که در آن محققان دستگاه پوشیدنی را ارزیابی کردند. با جمع آوری دادهها در مورد حرکت حنجره، آنها توانستند کلمات خاصی را با سیگنالهای تولید شده توسط یک الگوریتم یادگیری ماشینی مرتبط کنند. سپس از مؤلفه فعال سازی ابزار برای انتخاب سیگنال گفتار خروجی مناسب استفاده کردند.
از شرکت کنندگان خواسته شد که پنج جمله را بی صدا و با صدای بلند بگویند، از جمله «سلام راشل، امروز چطوری؟» و «دوستت دارم» تا درستی سیستم را نشان دهد.
فناوری پوشیدنی به گونهای طراحی شده است که به اندازه کافی انعطاف پذیر باشد تا بتواند با آن حرکت کند و فعالیت ماهیچههای حنجره زیر پوست را ثبت کند.
محققان ادعا میکنند که مولفه تحریک سیگنال صوتی شرکتکنندگان را تقویت میکند، که نشان میدهد مکانیسم حسی سیگنال حرکت حنجره آنها را تشخیص داده و با جمله مربوطه که شرکتکنندگان میخواهند تلفظ کنند مطابقت دارد. این منجر به دقت پیشبینی کلی ۹۴.۶۸ درصد برای مدل شد.
در آینده، محققان قصد دارد این گجت را روی افراد دارای اختلالات گفتاری آزمایش کند و دایره لغات آن را از طریق یادگیری ماشینی گسترش دهند.
انتهای پیام/