محققان بینایی محیطی هوش مصنوعی را تقویت میکنند
به گزارش خبرگزاری علم و فناوری آنا به نقل از امآیتی نیوز، دید محیطی انسانها را قادر میسازد تا اشکالی را ببینند که مستقیماً در خط دید ما نیستند، البته با جزئیات کم تر. این قابلیت میدان دید ما را گسترش میدهد و میتواند در بسیاری از موقعیتها مانند تشخیص خودرویی که از کنار به خودروی ما نزدیک میشود، مفید باشد.
برخلاف انسان، هوش مصنوعی دید محیطی ندارد. تجهیز مدلهای بینایی کامپیوتری به این قابلیت میتواند به آنها کمک کند تا خطرات نزدیک شدن را به طور موثرتری تشخیص دهند یا پیش بینی کنند که آیا یک راننده انسانی متوجه شی روبرو میشود یا خیر.
محققان ام آیتی با قدم گذاشتن در این مسیر، مجموعه دادههای تصویری را توسعه دادند که به آنها اجازه میدهد دید محیطی را در مدلهای یادگیری ماشین شبیه سازی کنند. آنها دریافتند که با این مجموعه داده توانایی مدلها در تشخیص اشیا در محیط بصری را بهبود میدهند، اگرچه مدلها همچنان بدتر از انسان عمل میکنند.
نتایج آنها همچنین نشان داد که برخلاف انسان ها، نه اندازه اشیا و نه میزان درهم ریختگی بصری در یک صحنه تاثیر زیادی بر عملکرد هوش مصنوعی ندارد.
واشا دوتل، یکی از نویسندگان این مقاله میگوید: اینجا یک اتفاق اساسی در جریان است. ما مدلهای مختلفی را آزمایش کردیم و حتی وقتی آنها را آموزش میدهیم، کمی بهتر میشوند، اما کاملا شبیه انسان نیستند. بنابراین، سوال این است: چه چیزی در این مدلها گم شده است؟
پاسخ به این سوال ممکن است به محققان در ساخت مدلهای یادگیری ماشین کمک کند تا بتوانند جهان را بیشتر شبیه به انسان ببینند. علاوه بر بهبود ایمنی راننده، میتوان از چنین مدلهایی برای توسعه نمایشگرهایی استفاده کرد که مشاهده آنها برای مردم آسانتر است.
به علاوه، درک عمیقتر بینایی محیطی در مدلهای هوش مصنوعی میتواند به پژوهشگران در پیش بینی بهتر رفتار انسان کمک کند.
او توضیح میدهد: مدل سازی بینایی محیطی، اگر ما واقعا بتوانیم ماهیت آنچه در محیط نشان داده میشود را درک کنیم، میتواند به ما در درک ویژگیهای یک صحنه بصری که باعث میشود چشمهای ما برای جمع آوری اطلاعات بیشتر حرکت کنند، کمک کند.
روت روزنهولتز، یکی از نویسندگان این مقاله میگوید: هر زمانی که شما یک انسان را در حال تعامل با یک ماشین دارید - یک ماشین، یک ربات، یک رابط کاربری - بسیار مهم است که بفهمید فرد چه چیزی را میتواند ببیند. بینایی محیطی نقش مهمی در این درک ایفا میکند.
محققان دریافتند که آموزش مدلها با مجموعه دادههای آنها از ابتدا منجر به بیشترین افزایش عملکرد و بهبود توانایی آنها در تشخیص اشیا میشود. تنظیم دقیق یک مدل با مجموعه دادههای آن ها، فرآیندی که شامل اصلاح یک مدل از پیش آموزش دیده است تا بتواند یک کار جدید را انجام دهد، منجر به دستاوردهای عملکردی کوچکتر میشود.
اما در هر صورت، ماشینها به خوبی انسانها نبودند و به خصوص در تشخیص اشیا در محیطهای دوردست بد عمل میکردند. عملکرد آنها نیز از الگوهای مشابه انسانها پیروی نمیکرد.
هرینگتون میگوید: این ممکن است نشان دهد که مدلها از همان روشی که انسانها برای انجام این وظایف تشخیص استفاده میکنند، استفاده نمیکنند. استراتژی مدلها ممکن است متفاوت باشد.
محققان قصد دارند با هدف یافتن مدلی که بتواند عملکرد انسان را در محیط بصری پیش بینی کند، به بررسی این تفاوتها ادامه دهند. این میتواند سیستمهای هوش مصنوعی را فعال کند که به عنوان مثال رانندگان را از خطراتی که ممکن است نبینند آگاه میکند. آنها همچنین امیدوارند که الهام بخش محققان دیگر برای انجام مطالعات بینایی کامپیوتری اضافی با مجموعه دادههای در دسترس عموم خود باشند.
جاستین گاردنر، استادیار گروه روانشناسی دانشگاه استنفورد که در این پژوهش مشارکت نداشته است، میگوید: این کار از این جهت اهمیت دارد که به درک ما کمک میکند که بینایی انسان در محیط را نباید تنها به دلیل محدودیت در تعداد گیرندههای نوری که داریم، ضعیف در نظر گرفت، بلکه باید نمایشی که برای ما بهینه شده است تا وظایف مربوط به دنیای واقعی را انجام دهیم. این پژوهش آینده به طور قابل توجهی توسط پایگاه داده تصاویر ارائه شده توسط نویسندگان برای تقلید بینایی محیطی انسان کمک خواهد شد.
انتهای پیام/