آینده جهان با هوش مصنوعی (۱۶۰)؛

هوش مصنوعی ربات‌ها را بهتر از انسان‌ آموزش می‌دهد

هوش مصنوعی مانند «جی‌پی‌تی-۴» می‌تواند ربات‌ها را برای انجام کار‌های پیچیده در دنیای واقعی بسیار موثرتر از انسان‌ها آموزش دهد.

کد خبر : 909981

اشتراک گذاری

به گزارش خبرگزاری علم و فناوری آنا به نقل از نیواطلس، حرکت یک ربات چهارپا روی یک توپ یوگا یک آزمایش سرگرم کننده برای تماشاست؛ اما در واقعیت نشان می‌دهد که هوش مصنوعی مانند «جی‌پی‌تی-۴» (GPT-۴) می‌تواند ربات‌ها را برای انجام کار‌های پیچیده در دنیای واقعی بسیار موثرتر از ما انسان‌ها آموزش دهد.

«د‌ی‌آر یوریکا» (DrEureka) یک بسته نرم‌افزاری متن‌باز جدید است که هر کسی می‌تواند با آن بازی کند. از طریق این بسته نرم‌افزار، ربات‌ها به کمک مدل‌های زبان بزرگ مانند «چت جی‌پی‌تی ۴» (ChatGPT ۴) برای انجام وظایف واقعی آموزش داده می‌شوند. این سیستم «شبیه‌سازی به واقعیت» است، به این معنا که ربات‌ها را در یک محیط مجازی با استفاده از فیزیک شبیه‌سازی شده آموزش می‌دهد و سپس آنها را در محیط واقعی پیاده‌سازی می‌کند.

جیم فن، یکی از توسعه‌دهندگان «د‌ی‌آر یوریکا»، یک ربات چهارپا از نوع «یونیتیری گو ۱» (Unitree Go۱) را برای جلب توجه به حرکت درآورد. این یک ربات منبع باز «کم هزینه» و با پشتیبانی خوب است. با وجود هوش مصنوعی، ربات‌های خانگی هنوز در معرض آسیب سقوط هستند.

تشویق یک مدل زبان طبیعی به نوشتن کد نیاز به دستورالعمل‌های ایمنی دارد؛ در غیر این صورت، مدل زبان طبیعی تلاش می‌کند بهترین عملکرد ممکن را داشته باشد و در واقع در شبیه‌سازی بدون راهنمایی «تقلب» می‌کند. این در یک شبیه سازی خوب است، اما در دنیای واقعی ممکن است موتور‌ها را بیش‌از حد گرم کند یا اندام‌ها را بیش‌از حد کشیده و به ربات آسیب بزند؛ محققان این پدیده را «رفتار تخریبی» می‌نامند.

در یک مثال از رفتار‌های غیرطبیعی خودآموز، ربات مجازی کشف کرد که با فشار دادن باسن به زمین و استفاده از سه پا برای حرکت در طول زمین، می‌تواند سریع‌تر حرکت کند. این تصویری نسبتاً نگران‌کننده در ذهن من ایجاد می‌کند، اگرچه این رفتار در شبیه‌سازی مزیت بود، در دنیای واقعی باعث آسیب دیدن ربات می‌شد.

بنابراین، محققان به جی‌پی‌تی دستور دادند که با در نظر گرفتن اینکه ربات در دنیای واقعی آزمایش می‌شود، بسیار مراقب باشد و در پاسخ، جی‌پی‌تی عملکرد‌های ایمنی را برای مواردی مانند حرکت صاف، جهت‌گیری بالاتنه، ارتفاع بالاتنه و اطمینان از اینکه موتور‌های ربات وجود دارد ایجاد کرد. اگر ربات از این پارامتر‌ها فرار کند و آنها را نقض کند، عملکرد آن امتیاز پایین‌تری ارائه می‌دهد. درحالی که دستورالعمل‌های ایمنی رفتار‌های تخریبی و غیرطبیعی را کاهش می‌دهند.

در این حالت مدل هوش مصنوعی «د‌ی‌آر یوریکا» توانست انسان‌ها را شکست دهد و مزیت ۳۴ درصد در سرعت رو به جلو و ۲۰ درصد در مسافت طی شده در زمین‌های مختلط دنیای واقعی را از خود نشان دهد.

طبق گفته محققان، همه چیز به سبک آموزش بستگی دارد. انسان‌ها به سمت یک محیط آموزشی برنامه‌ریزی می‌روند؛ یعنی کار‌ها را به قطعات کوچک تقسیم کرده و سعی می‌کنند آنها را به صورت جداگانه توضیح دهند، در حالی که جی‌پی‌تی این توانایی را دارد که به طور موثر همه چیز را به یکباره آموزش دهد. این چیزی است که ما انسان‌ها قادر به انجام آن نیستیم. «د‌ی‌آر یوریکا» نخستین نمونه از این نوع است. او قادر است از شبیه‌سازی به دنیای واقعی برود.

سازندگان «د‌ی‌آر یوریکا» معتقدند که اگر بتوانند بازخورد دنیای واقعی را به جی‌پی‌تی ارائه دهند، می‌توانند آموزش سیم به واقعیت را بیشتر بهبود بخشند. در حال حاضر، تمام آموزش‌های شبیه‌سازی با استفاده از داده‌هایسیستم‌های حس عمقی خود ربات انجام می‌شود، اما اگر جی‌پی‌تی بتواند خطا‌ها را طریق ویدیویی واقعی ببیند به جای فقط خواندن خطا‌های اجرایی در گزارش‌های ربات، می‌تواند دستورات خود را به طور موثر‌تری اصلاح کند.

درحالی که انسان به صورت متوسط یک سال و نیم طول می‌کشد تا یاد بگیرد چگونه راه برود و تنها یک قسمت کوچک از ۱ درصد از انسان‌ها می‌توانند روی توپ یوگا راه بروند.

انتهای پیام/

گزارش خطا

پسندها : 0

اشتراک گذاری

ارسال نظر

پربازدید
آخرین اخبار
پربحث