تعبیه زبان طبیعی در مدل‌های بزرگ زبانی/ شیوه استدلال هوش مصنوعی متحول می‌شود

محققان ام آی تی به تکنیک جدیدی دست یافتند که قابلیت استدلال در مدل‌های بزرگ زبانی را در حد چشمگیری ارتقا می‌دهد.

کد خبر : 917474

اشتراک گذاری

خبرگزاری علم و فناوری آنا؛ محققان مؤسسه فناوری ماساچوست (ام آی تی) به تکنیک جدیدی دست پید کرده‌اند که به کمک آن مدل‌های بزرگ زبانی می‌توانند زبان طبیعی را بفهمند، مسائل ریاضی را حل کنند و به تجزیه‌وتحلیل داده‌ها بپردازند و با تولید برنامه، استدلال نمادین انجام دهند.

رویکرد این پژوهشگران که «برنامه‌های تعبیه زبان طبیعی» (NLEPs) نامیده می‌شود، شامل تحریک یک مدل زبان برای ایجاد و اجرای یک برنامه پایتون (Python) برای پاسخ به پرس و جوی کاربر و سپس ارائه راه حل به عنوان زبان طبیعی است.

این روش با ترکیب زبان طبیعی و برنامه‌نویسی، مدل‌های بزرگ زبانی را قادر می‌سازد تا وظایف عددی، تحلیلی و مبتنی بر زبان را بی‌واسطه و بدون اطلاع کاربر حل کنند.

مدل‌های بزرگ زبانی مانند مدل‌هایی که چت جی‎پی‌تی را تقویت می‌کنند، در کار‌هایی مانند تهیه پیش‌نویس‌های حقوقی، تجزیه و تحلیل نظرات مشتریان، یا ترجمه اسناد به زبان‌های مختلف عملکرد چشمگیری نشان داده‌اند.

این مدل‌های یادگیری ماشینی برای پردازش اطلاعات و پاسخ به سؤالات معمولاً فقط از زبان طبیعی استفاده می‌کنند که می‌تواند انجام کار‌هایی را که نیاز به استدلال عددی یا نمادین دارند، دشوار کند.

به عنوان مثال، یک مدل بزرگ زبانی ممکن است بتواند فهرستی از رؤسای جمهور اخیر در ایالات متحده و روز تولد آنها را به حافظه بسپارد و بخواند، اما اگر از همان مدل این سؤال پرسیده شود که «کدام رئیس‌جمهور سابق ایالات متحده که پس از سال ۱۹۵۰ انتخاب شده، در روز چهارشنبه به دنیا آمده است؟» شاید اشتباه کند. (پاسخ درست جیمی کارتر است.)

رویکرد جدید مدل‌ها، تعاملی است

آنها دریافتند که «برنامه‌های تعبیه زبان طبیعی» به مدل‌های بزرگ زبانی امکان می‌دهد که با دقت بیشتر و در یک طیف وسیع‌تر استدلال کنند. این رویکرد همچنین قابل تعمیم است، به این معنی که می‌توان از یک دستور «برنامه تعبیه زبان طبیعی» برای چندین کار استفاده مجدد کرد.

برنامه‌های تعبیه زبان طبیعی همچنین میزان شفافیت و تعامل را بالا می‌برند به این معنا که کاربر می‌تواند برنامه را بررسی کند تا ببیند مدل دقیقاً چگونه استدلال کرده است و اگر مدل پاسخ اشتباهی داد، کاربر می‌تواند آن را اصلاح کند.

هانگیین لو دارای مدرک پسادکتری از ام آی تی و نویسنده ارشد مقاله «برنامه‌های تعبیه زبان طبیعی» می‌گوید: «ما می‌خواهیم هوش مصنوعی، استدلال پیچیده را به روشی شفاف و قابل اعتماد انجام دهد. ترکیب قابلیت‌های برنامه‌نویسی و زبان طبیعی در مدل‌های بزرگ زبانی اولین گام مهم به سوی آینده‌ای است که در آن مردم می‌توانند به‌طور کامل به هوش مصنوعی اعتماد کنند.»

حل مسئله با برنامه‌ها

«برنامه تعبیه زبان طبیعی» یک الگوی حل مسئله با چهار مرحله است. این مدل، ابتدا ابزار‌های مورد نیاز برای انجام کار را جمع آوری می‌کند. مرحله دوم شامل گردآوری اطلاعات درباره این وظیفه است، مانند تهیه فهرستی از تاریخ تولد رؤسای جمهور ایالات متحده به گونه‌ای برای رایانه قابل درک باشد. در مرحله سوم، مدل با استفاده از یک روش خاص پاسخ می‌دهد و در مرحله آخر، مدل به‌گونه‌ای پاسخ می‌دهد که برای کاربر منطقی باشد، و همچنین ممکن است برای کمک به فهم بیشتر، تصویری را به پاسخ اضافه کند.

طرز کار بسیاری از مدل‌های بزرگ زبانی بر اساس پیش‌بینی کلمه یا نشانه بعدی با توجه به ورودی زبان طبیعی است. برای مثال، از مدل‌هایی مانند چت جی‎پی‌تی-۴ می‌توان برای برنامه‌نویسی استفاده کرد، اما ادغام چنین برنامه‌هایی با زبان طبیعی می‌تواند به ایجاد خطا در استدلال یا نتایج برنامه شود.

با دست یافتن به «برنامه‌های تعبیه زبان طبیعی» محققان ام آی تی رویکرد مخالف را در پیش گرفتند. آنها از مدل‌های می‌خواهند تا یک برنامه گام به گام را به طور کامل در کد پایتون تولید کند و سپس زبان طبیعی لازم را در داخل برنامه جاسازی کند.

هانگیین لو می‌گوید: «این مدل، مانند یک ماشین حساب دیجیتال است که تا زمانی که برنامه درست باشد، همیشه نتیجه محاسباتی صحیح را به شما می‌دهد.»

کاربر می‌تواند به راحتی برنامه را بررسی کند و هر گونه خطا در کد را مستقیماً برطرف کند و نیازی نیست که کل مدل عیب‌یابی مجدد شود. این رویکرد همچنین کارایی بیشتری را نسبت به سایر روش‌ها ارائه می‌دهد. اگر یک کاربر سؤالات مشابه زیادی داشته باشد، می‌تواند یک برنامه پایه و اصلی تولید کند و سپس بدون نیاز به اجرای مکرر مدل، متغیر‌های خاصی را جایگزین کند.

لئونید کارلینسکی (Leonid Karlinsky)، دانشمند ارشد در آزمایشگاه هوش مصنوعی ام آی تی می‌گوید: «درک اینکه چگونه مدل‌های زبان با کد کار می‌کنند، فرصت‌های زیادی را برای ایجاد ابزار‌های جدید، راستی‌آزمایی نتایج و درک بهتر از توانایی مدل‌ها ایجاد می‌کند.»

مزایا و محدودیت‌های تکنیک جدید

«برنامه‌های تعبیه زبان طبیعی» می‌توانند دقت مدل‌های بزرگ زبانی مانند جی‎پی‌تی-۴ را بالا ببرند تا کار‌های مختلفی مانند حل پازل، دنبال کردن دستورالعمل‌ها و طبقه‌بندی متن را با دقت بیش از ۹۰ درصد حل کنند.

یکی دیگر از مزایای برنامه‌های تعبیه زبان طبیعی این است که می‌توانند امنیت حریم خصوصی داده‌ها را افزایش دهند. دلیلش آن است که این برنامه‌ها می‌توانند مستقیم روی دستگاه شما اجرا شوند و بنابراین لازم نیست داده‌های حساس شما برای پردازش به شرکت‌های بزرگ ارسال شوند.

علاوه بر مزایای دقت و حفظ حریم خصوصی، «برنامه‌های تعبیه زبان طبیعی» همچنین می‌توانند به مدل‌های زبانی کوچک کمک کنند تا بدون نیاز به آموزش مجدد برای کار‌های خاص بهتر عمل کنند و بنابراین می‌توانند در منابع و زمان صرفه‌جویی کنند.

لو می‌گوید: «در این تکنیک هیچ جادویی وجود ندارد. ما مدل زبانی گران‌تر یا فانتزی نداریم. تنها کاری که انجام می‌دهیم این است که از تولید برنامه به جای تولید زبان طبیعی استفاده می‌کنیم و می‌توانیم عملکرد آن را به طور قابل توجهی بهتر کنیم.»

البته، اثربخشی «برنامه‌های تعبیه زبان طبیعی» به توانایی مدل برای تولید برنامه‌ها بستگی دارد و ممکن است در مدل‌های کوچکتر که با داده‌های محدودتر آموزش دیده‌اند کارایی مفیدی نداشته باشد.

این گزارش از ام ای تی نیوز به فارسی برگردان شده است.

انتهای پیام/