محققان بینایی محیطی هوش مصنوعی را تقویت می‌کنند

محققان بینایی محیطی را در مدل‌های هوش مصنوعی تقویت می‌کنند تا با اینکار به بهبود ایمنی راننده کمک کنند.

کد خبر : 900841

اشتراک گذاری

به گزارش خبرگزاری علم و فناوری آنا به نقل از ام‌آی‌تی نیوز، دید محیطی انسان‌ها را قادر می‌سازد تا اشکالی را ببینند که مستقیماً در خط دید ما نیستند، البته با جزئیات کم تر. این قابلیت میدان دید ما را گسترش می‌دهد و می‌تواند در بسیاری از موقعیت‌ها مانند تشخیص خودرویی که از کنار به خودروی ما نزدیک می‌شود، مفید باشد.

برخلاف انسان، هوش مصنوعی دید محیطی ندارد. تجهیز مدل‌های بینایی کامپیوتری به این قابلیت می‌تواند به آن‌ها کمک کند تا خطرات نزدیک شدن را به طور موثرتری تشخیص دهند یا پیش بینی کنند که آیا یک راننده انسانی متوجه شی روبرو می‌شود یا خیر.

محققان ام آی‌تی با قدم گذاشتن در این مسیر، مجموعه داده‌های تصویری را توسعه دادند که به آن‌ها اجازه می‌دهد دید محیطی را در مدل‌های یادگیری ماشین شبیه سازی کنند. آن‌ها دریافتند که با این مجموعه داده توانایی مدل‌ها در تشخیص اشیا در محیط بصری را بهبود می‌دهند، اگرچه مدل‌ها همچنان بدتر از انسان عمل می‌کنند.

نتایج آن‌ها همچنین نشان داد که برخلاف انسان ها، نه اندازه اشیا و نه میزان درهم ریختگی بصری در یک صحنه تاثیر زیادی بر عملکرد هوش مصنوعی ندارد.

واشا دوتل، یکی از نویسندگان این مقاله می‌گوید: اینجا یک اتفاق اساسی در جریان است. ما مدل‌های مختلفی را آزمایش کردیم و حتی وقتی آن‌ها را آموزش می‌دهیم، کمی بهتر می‌شوند، اما کاملا شبیه انسان نیستند. بنابراین، سوال این است: چه چیزی در این مدل‌ها گم شده است؟

پاسخ به این سوال ممکن است به محققان در ساخت مدل‌های یادگیری ماشین کمک کند تا بتوانند جهان را بیشتر شبیه به انسان ببینند. علاوه بر بهبود ایمنی راننده، می‌توان از چنین مدل‌هایی برای توسعه نمایشگر‌هایی استفاده کرد که مشاهده آن‌ها برای مردم آسان‌تر است.

به علاوه، درک عمیق‌تر بینایی محیطی در مدل‌های هوش مصنوعی می‌تواند به پژوهشگران در پیش بینی بهتر رفتار انسان کمک کند.

او توضیح می‌دهد: مدل سازی بینایی محیطی، اگر ما واقعا بتوانیم ماهیت آنچه در محیط نشان داده می‌شود را درک کنیم، می‌تواند به ما در درک ویژگی‌های یک صحنه بصری که باعث می‌شود چشم‌های ما برای جمع آوری اطلاعات بیشتر حرکت کنند، کمک کند.

روت روزنهولتز، یکی از نویسندگان این مقاله می‌گوید: هر زمانی که شما یک انسان را در حال تعامل با یک ماشین دارید - یک ماشین، یک ربات، یک رابط کاربری - بسیار مهم است که بفهمید فرد چه چیزی را می‌تواند ببیند. بینایی محیطی نقش مهمی در این درک ایفا می‌کند.

محققان دریافتند که آموزش مدل‌ها با مجموعه داده‌های آن‌ها از ابتدا منجر به بیش‌ترین افزایش عملکرد و بهبود توانایی آن‌ها در تشخیص اشیا می‌شود. تنظیم دقیق یک مدل با مجموعه داده‌های آن ها، فرآیندی که شامل اصلاح یک مدل از پیش آموزش دیده است تا بتواند یک کار جدید را انجام دهد، منجر به دستاورد‌های عملکردی کوچک‌تر می‌شود.

اما در هر صورت، ماشین‌ها به خوبی انسان‌ها نبودند و به خصوص در تشخیص اشیا در محیط‌های دوردست بد عمل می‌کردند. عملکرد آن‌ها نیز از الگو‌های مشابه انسان‌ها پیروی نمی‌کرد.

هرینگتون می‌گوید: این ممکن است نشان دهد که مدل‌ها از همان روشی که انسان‌ها برای انجام این وظایف تشخیص استفاده می‌کنند، استفاده نمی‌کنند. استراتژی مدل‌ها ممکن است متفاوت باشد.

محققان قصد دارند با هدف یافتن مدلی که بتواند عملکرد انسان را در محیط بصری پیش بینی کند، به بررسی این تفاوت‌ها ادامه دهند. این می‌تواند سیستم‌های هوش مصنوعی را فعال کند که به عنوان مثال رانندگان را از خطراتی که ممکن است نبینند آگاه می‌کند. آن‌ها همچنین امیدوارند که الهام بخش محققان دیگر برای انجام مطالعات بینایی کامپیوتری اضافی با مجموعه داده‌های در دسترس عموم خود باشند.

جاستین گاردنر، استادیار گروه روانشناسی دانشگاه استنفورد که در این پژوهش مشارکت نداشته است، می‌گوید: این کار از این جهت اهمیت دارد که به درک ما کمک می‌کند که بینایی انسان در محیط را نباید تنها به دلیل محدودیت در تعداد گیرنده‌های نوری که داریم، ضعیف در نظر گرفت، بلکه باید نمایشی که برای ما بهینه شده است تا وظایف مربوط به دنیای واقعی را انجام دهیم. این پژوهش آینده به طور قابل توجهی توسط پایگاه داده تصاویر ارائه شده توسط نویسندگان برای تقلید بینایی محیطی انسان کمک خواهد شد.

انتهای پیام/