هوش مصنوعی رباتها را بهتر از انسان آموزش میدهد
به گزارش خبرگزاری علم و فناوری آنا به نقل از نیواطلس، حرکت یک ربات چهارپا روی یک توپ یوگا یک آزمایش سرگرم کننده برای تماشاست؛ اما در واقعیت نشان میدهد که هوش مصنوعی مانند «جیپیتی-۴» (GPT-۴) میتواند رباتها را برای انجام کارهای پیچیده در دنیای واقعی بسیار موثرتر از ما انسانها آموزش دهد.
«دیآر یوریکا» (DrEureka) یک بسته نرمافزاری متنباز جدید است که هر کسی میتواند با آن بازی کند. از طریق این بسته نرمافزار، رباتها به کمک مدلهای زبان بزرگ مانند «چت جیپیتی ۴» (ChatGPT ۴) برای انجام وظایف واقعی آموزش داده میشوند. این سیستم «شبیهسازی به واقعیت» است، به این معنا که رباتها را در یک محیط مجازی با استفاده از فیزیک شبیهسازی شده آموزش میدهد و سپس آنها را در محیط واقعی پیادهسازی میکند.
جیم فن، یکی از توسعهدهندگان «دیآر یوریکا»، یک ربات چهارپا از نوع «یونیتیری گو ۱» (Unitree Go۱) را برای جلب توجه به حرکت درآورد. این یک ربات منبع باز «کم هزینه» و با پشتیبانی خوب است. با وجود هوش مصنوعی، رباتهای خانگی هنوز در معرض آسیب سقوط هستند.
تشویق یک مدل زبان طبیعی به نوشتن کد نیاز به دستورالعملهای ایمنی دارد؛ در غیر این صورت، مدل زبان طبیعی تلاش میکند بهترین عملکرد ممکن را داشته باشد و در واقع در شبیهسازی بدون راهنمایی «تقلب» میکند. این در یک شبیه سازی خوب است، اما در دنیای واقعی ممکن است موتورها را بیشاز حد گرم کند یا اندامها را بیشاز حد کشیده و به ربات آسیب بزند؛ محققان این پدیده را «رفتار تخریبی» مینامند.
در یک مثال از رفتارهای غیرطبیعی خودآموز، ربات مجازی کشف کرد که با فشار دادن باسن به زمین و استفاده از سه پا برای حرکت در طول زمین، میتواند سریعتر حرکت کند. این تصویری نسبتاً نگرانکننده در ذهن من ایجاد میکند، اگرچه این رفتار در شبیهسازی مزیت بود، در دنیای واقعی باعث آسیب دیدن ربات میشد.
بنابراین، محققان به جیپیتی دستور دادند که با در نظر گرفتن اینکه ربات در دنیای واقعی آزمایش میشود، بسیار مراقب باشد و در پاسخ، جیپیتی عملکردهای ایمنی را برای مواردی مانند حرکت صاف، جهتگیری بالاتنه، ارتفاع بالاتنه و اطمینان از اینکه موتورهای ربات وجود دارد ایجاد کرد. اگر ربات از این پارامترها فرار کند و آنها را نقض کند، عملکرد آن امتیاز پایینتری ارائه میدهد. درحالی که دستورالعملهای ایمنی رفتارهای تخریبی و غیرطبیعی را کاهش میدهند.
در این حالت مدل هوش مصنوعی «دیآر یوریکا» توانست انسانها را شکست دهد و مزیت ۳۴ درصد در سرعت رو به جلو و ۲۰ درصد در مسافت طی شده در زمینهای مختلط دنیای واقعی را از خود نشان دهد.
طبق گفته محققان، همه چیز به سبک آموزش بستگی دارد. انسانها به سمت یک محیط آموزشی برنامهریزی میروند؛ یعنی کارها را به قطعات کوچک تقسیم کرده و سعی میکنند آنها را به صورت جداگانه توضیح دهند، در حالی که جیپیتی این توانایی را دارد که به طور موثر همه چیز را به یکباره آموزش دهد. این چیزی است که ما انسانها قادر به انجام آن نیستیم. «دیآر یوریکا» نخستین نمونه از این نوع است. او قادر است از شبیهسازی به دنیای واقعی برود.
سازندگان «دیآر یوریکا» معتقدند که اگر بتوانند بازخورد دنیای واقعی را به جیپیتی ارائه دهند، میتوانند آموزش سیم به واقعیت را بیشتر بهبود بخشند. در حال حاضر، تمام آموزشهای شبیهسازی با استفاده از دادههایسیستمهای حس عمقی خود ربات انجام میشود، اما اگر جیپیتی بتواند خطاها را طریق ویدیویی واقعی ببیند به جای فقط خواندن خطاهای اجرایی در گزارشهای ربات، میتواند دستورات خود را به طور موثرتری اصلاح کند.
درحالی که انسان به صورت متوسط یک سال و نیم طول میکشد تا یاد بگیرد چگونه راه برود و تنها یک قسمت کوچک از ۱ درصد از انسانها میتوانند روی توپ یوگا راه بروند.
انتهای پیام/