تبدیل افکار خاموش ذهن به گفتار| ابزاری که اندیشه را واژه میکند!
خبرگزاری علم و فناوی آنا- هدا عربشاهی: استفان هاوکینگ، اخترفیزیکدان و ریاضیدان انگلیسی که بیشاز هرچیز بهدلیل مطالعاتش درباره سیاهچالهها شناخته میشد، از اواخر میانسالی بهطرز روبهرشدی برای برقراری ارتباط با دیگران با مشکل مواجه شد. آتروفی عضلانی نخاعی پیشرونده، بیماری حادی که در سن ۲۱ سالگی به او حملهور شد علاوهبر فلجی ماهیچههای مورد نیاز برای راهرفتن و نوشتن بهتدریج عضلاتی را که در صحبتکردن نقش دارند درگیر کرد بهطوریکه او سالها فقط با انقباض ماهیچههای گونه و انتقال این حرکات ازطریق حسگرهای فروسرخ به رایانه، توان نوشتن و صحبتکردن داشت؛ اما زمانیکه او به سن ۷۱ سالگی رسید، قدرت ماهیچههای گونهاش هم به مرور تحلیل رفت و بهاینترتیب، یکی از پویاترین ذهنهای علم قادر بود فقط یک کلمه در دقیقه بنویسد. ازاینرو، سال ۲۰۱۳ شرکت آمریکایی اینتل، پیشگام در فناوریهای تراشه و سامانههای رابط کاربری، دستگاه جدیدی ساخت که به این دانشمند اجازه میداد هر ۶۰ ثانیه ۵ تا ۱۰ کلمه بنویسد و حرف بزند. این سامانه که برپایه فناوری تشخیص چهره بود نهفقط حرکات عضلات گونه، که حرکات دهان و ابروها را هم ثبت میکرد و بهاینترتیب، هاوکینگ میتوانست از آن برای انتخاب حروف روی صفحه نمایشگر رایانه، نوشتن واژهها و عبارات و تبدیل آنها به صدای الکترونیکی استفاده کند. اگر امروز این فیزیکدان انگلیسی زنده بود شاید میتوانست به استفاده از نمونههای اولیه دستگاههایی که به مدد هوشمصنوعی افکار را میخوانند و آنها را به کلمات تبدیل میکنند برای برقراری ارتباط با سرعتی بیشتر امیدوار باشد.
هوشمصنوعی سکوت ذهن را میشکند
از سال ۲۰۱۹ گروهی از دانشمندان دانشگاه کلمبیا در کانادا به سرپرستی پژوهشگر ایرانی، نیما مسگرانی، با کمک هوشمصنوعی گامهای رو به جلویی را برای تحقق رویای امکان تبدیل افکار خاموش ذهن به گفتار برمیدارند. به اعتقاد این دانشوران، آنچه که اکنون گامهای نخستین خودش را میپیماید ظرف یکدهه آینده به واقعیتی دردسترس تبدیل خواهد شد. تیم نیما مسگرانی مشغول توسعه الگوریتمی است که بااستفاده از هوشمصنوعی و استفاده از دستگاه الکتروانسفالوگرام قادر است سیگنالهای مغز را به کلمات گفتاری تبدیل کند.
همچنین یکسال پیشاز آغاز این پروژه، یعنی سال ۲۰۱۸، گروهی از دانشمندان علوم اعصاب دانشگاه تورنتو، سامانهای را توسعه دادند که امکان بازآفرینی تصویر ذهنی را روی صفحه نمایشگر میسر میکرد. این سامانه زمانی مفید است که شخصی بخواهد چهرهای را تشخیص دهد که در ذهنش واضح است، اما قادر به توصیف آن برای کارشناسان تشخیص چهره یا کشیدن آن روی کاغذ نیست و با کمک این سامانه و به لطف اسکن افکار، بازنمایی آن چهره امکانپذیر میشود. آزمایش این پژوهشگران، نمونهای از افرادی را شامل میشد که عکسی از صورت انسانی به آنها نشان داده شده بود و هنگام انجام الکتروآنسفالوگرام آنها باید درباره تکتک جزییات چهره فردی که تصویرش را دیده بودند فکر میکردند و همزمان، دستگاه ثمره آن افکار را روی صفحه نمایشگر میکشید و بازنمایی میکرد. درنهایت چهره شخص در عکس بهطور کامل روی نمایشگر ظاهر میشد.
اما نیما مسگرانی، سرپرست گروه پژوهشگران دانشگاه کلمبیا در این تحقیقات بر ابزار خاصی بهنام «ووُکدر» بهمعنی «رمزگذار صوت» تکیه کرد. این دستگاه قادر است هر سیگنال صوتی را بهصورت کدهایی رمزگذاری کند. الگوریتمهایی با قابلیت یادگیری جملات و داستانهای کوتاه و بازتولید کلمات و گفتارهای خاص در این دستگاه نصب شدهاند. این همان فناوری است که به سامانه دستیار صوتی الکسا محصول آمازون و سیری محصول اپل اجازه میدهد که به سوالهای کاربران پاسخ صحیح ارائه دهند. این مطالعه دادههایی را از پنج بیمار مبتلا به صرع درحالیکه تحت جراحی مغز و اعصاب بودند جمعآوری کرد. در مغز این بیماران یک سری الکترود کاشته شده بود که به دانشوران اجازه داد همانطورکه بیماران به داستانهایی که چهار نفر مختلف تعریف میکردند گوش میدادند اندازهگیریهای الکتروکورتیکوگرافی جامعی انجام دهند. هر ضبط عصبی حداکثر ۳۰ دقیقه طول کشید.
پساز جمعآوری دادهها، دستگاه رمزگذار صوتی امواج مغزی تولیدشده در قشر شنوایی را خواند و از آنها برای تبدیل آنچه که مغز شنیده بود به گفتار استفاده کرد. سپس صدای تولیدشده با سامانه هوشمصنوعی از هرگونه اصوات مزاحم پاک و درنهایت، دادهها برای شنوندگانی بیرون از این آزمایش پخش شد. بهگفته نیما مسگرانی، شنوندگان تا 75 درصد مواقع توانستند صداها را بفهمند و تکرار کنند که در مقایسه با تلاشهای قبلی بهطور متوسط بینظیر است. او همچنین پیشبینی میکند که این فناوری دستکم تا یک دهه آینده در سطح جهانی در دسترس خواهد بود و هرچند امکان انجام اندازهگیریهای الکتروکورتیکوگرافی (در تماس مستقیم با کورتکس مغز) محدود است، اما بههررو، این آزمایش میتواند پایه و اساس تبدیل افکار انسان به گفتار باشد. گام بعدی، اصلاح الگوریتمها است تا بتوانند کلمات و جملات پیچیده را رمزگشایی کنند، تاحدیکه این فناوری در آینده، واقعا بتواند به نقطه عطفی تبدیل شود که نهفقط در زندگی روزمره، که برای رفاه بیمارانی که بهدلیل بیماریهای تخریب نورونی و آسیبهای مغزی نمیتوانند صحبت کنند هم مفید باشد.
الگوریتمی برای تبدیل فعالیت مغزی به جملات
پساز مطالعات سال ۲۰۱۹ دانشمندان دانشگاه کلمبیا، گروهی از پژوهشگران دانشگاه کالیفرنیا در سال ۲۰۲۰ الگوریتمی را توسعه دادند که قادر است امواج مغزی را پردازش و آنها را به جملات معنادار تبدیل کند. براساس دادههای این محققان که در نشریه تخصصی نیچر نوروساینس منتشر شده است، میانگین میزان خطای این مدل برابر با ۳ درصد است. جوزف ماکین، متخصص یادگیری ماشین در این پژوهش میگوید: «واسطهای ذهن و ماشین موفقیت محدودی در رمزگذاری فعالیتهای عصبی نشان میدهند و قادر به رمزگشایی قطعات کلمات یا جملات خاص ساده هستند.» کار ماکین و گروهش با مشارکت چهار داوطلب شروع شد که در مغز آنها هم الکترودهایی برای نظارت بر تشنجهای صرع کاشته شده بود. از داوطلبان خواسته شد تا حدود ۵۰ جمله مختلف را چندبار با صدای بلند بخوانند: جملات سادهای چون «تینا ترنر یک خواننده پاپ است» یا «آن دزدها ۳۰ جواهر را دزدیدند» و همزمان دانشمندان فعالیت مغز آنها را ثبت کردند. سپس الگوریتم هوشمصنوعی که برای تبدیل سیگنالهای مغز به نمایشهای انتزاعی، در قالب رشتههای عددی طراحی شده بود، این دادههای جمعآوریشده را پردازش کرد.
در مرحله بعد، این رشتههای عددی را کلمه به کلمه رمزگشایی کرد تا جملات تولید شوند. درطول مرحله آزمایش، سامانه ابتدا جملات بیمعنی تولید میکرد؛ اما زمانیکه «یاد گرفت» کدام جملات به کدام رشتهها متصلاند و کدام کلمات بیشتر با هم ظاهر میشوند، نتایج بهبود یافت. هرچند دقت تشخیص از فردی به فرد دیگر متفاوت است اما بهطور متوسط فقط در ۳ درصد جملات خطا شناسایی شد.
انتهای پیام/