تعبیه زبان طبیعی در مدلهای بزرگ زبانی/ شیوه استدلال هوش مصنوعی متحول میشود
خبرگزاری علم و فناوری آنا؛ محققان مؤسسه فناوری ماساچوست (ام آی تی) به تکنیک جدیدی دست پید کردهاند که به کمک آن مدلهای بزرگ زبانی میتوانند زبان طبیعی را بفهمند، مسائل ریاضی را حل کنند و به تجزیهوتحلیل دادهها بپردازند و با تولید برنامه، استدلال نمادین انجام دهند.
رویکرد این پژوهشگران که «برنامههای تعبیه زبان طبیعی» (NLEPs) نامیده میشود، شامل تحریک یک مدل زبان برای ایجاد و اجرای یک برنامه پایتون (Python) برای پاسخ به پرس و جوی کاربر و سپس ارائه راه حل به عنوان زبان طبیعی است.
این روش با ترکیب زبان طبیعی و برنامهنویسی، مدلهای بزرگ زبانی را قادر میسازد تا وظایف عددی، تحلیلی و مبتنی بر زبان را بیواسطه و بدون اطلاع کاربر حل کنند.
مدلهای بزرگ زبانی مانند مدلهایی که چت جیپیتی را تقویت میکنند، در کارهایی مانند تهیه پیشنویسهای حقوقی، تجزیه و تحلیل نظرات مشتریان، یا ترجمه اسناد به زبانهای مختلف عملکرد چشمگیری نشان دادهاند.
این مدلهای یادگیری ماشینی برای پردازش اطلاعات و پاسخ به سؤالات معمولاً فقط از زبان طبیعی استفاده میکنند که میتواند انجام کارهایی را که نیاز به استدلال عددی یا نمادین دارند، دشوار کند.
به عنوان مثال، یک مدل بزرگ زبانی ممکن است بتواند فهرستی از رؤسای جمهور اخیر در ایالات متحده و روز تولد آنها را به حافظه بسپارد و بخواند، اما اگر از همان مدل این سؤال پرسیده شود که «کدام رئیسجمهور سابق ایالات متحده که پس از سال ۱۹۵۰ انتخاب شده، در روز چهارشنبه به دنیا آمده است؟» شاید اشتباه کند. (پاسخ درست جیمی کارتر است.)
رویکرد جدید مدلها، تعاملی است
آنها دریافتند که «برنامههای تعبیه زبان طبیعی» به مدلهای بزرگ زبانی امکان میدهد که با دقت بیشتر و در یک طیف وسیعتر استدلال کنند. این رویکرد همچنین قابل تعمیم است، به این معنی که میتوان از یک دستور «برنامه تعبیه زبان طبیعی» برای چندین کار استفاده مجدد کرد.
برنامههای تعبیه زبان طبیعی همچنین میزان شفافیت و تعامل را بالا میبرند به این معنا که کاربر میتواند برنامه را بررسی کند تا ببیند مدل دقیقاً چگونه استدلال کرده است و اگر مدل پاسخ اشتباهی داد، کاربر میتواند آن را اصلاح کند.
هانگیین لو دارای مدرک پسادکتری از ام آی تی و نویسنده ارشد مقاله «برنامههای تعبیه زبان طبیعی» میگوید: «ما میخواهیم هوش مصنوعی، استدلال پیچیده را به روشی شفاف و قابل اعتماد انجام دهد. ترکیب قابلیتهای برنامهنویسی و زبان طبیعی در مدلهای بزرگ زبانی اولین گام مهم به سوی آیندهای است که در آن مردم میتوانند بهطور کامل به هوش مصنوعی اعتماد کنند.»
حل مسئله با برنامهها
«برنامه تعبیه زبان طبیعی» یک الگوی حل مسئله با چهار مرحله است. این مدل، ابتدا ابزارهای مورد نیاز برای انجام کار را جمع آوری میکند. مرحله دوم شامل گردآوری اطلاعات درباره این وظیفه است، مانند تهیه فهرستی از تاریخ تولد رؤسای جمهور ایالات متحده به گونهای برای رایانه قابل درک باشد. در مرحله سوم، مدل با استفاده از یک روش خاص پاسخ میدهد و در مرحله آخر، مدل بهگونهای پاسخ میدهد که برای کاربر منطقی باشد، و همچنین ممکن است برای کمک به فهم بیشتر، تصویری را به پاسخ اضافه کند.
طرز کار بسیاری از مدلهای بزرگ زبانی بر اساس پیشبینی کلمه یا نشانه بعدی با توجه به ورودی زبان طبیعی است. برای مثال، از مدلهایی مانند چت جیپیتی-۴ میتوان برای برنامهنویسی استفاده کرد، اما ادغام چنین برنامههایی با زبان طبیعی میتواند به ایجاد خطا در استدلال یا نتایج برنامه شود.
با دست یافتن به «برنامههای تعبیه زبان طبیعی» محققان ام آی تی رویکرد مخالف را در پیش گرفتند. آنها از مدلهای میخواهند تا یک برنامه گام به گام را به طور کامل در کد پایتون تولید کند و سپس زبان طبیعی لازم را در داخل برنامه جاسازی کند.
هانگیین لو میگوید: «این مدل، مانند یک ماشین حساب دیجیتال است که تا زمانی که برنامه درست باشد، همیشه نتیجه محاسباتی صحیح را به شما میدهد.»
کاربر میتواند به راحتی برنامه را بررسی کند و هر گونه خطا در کد را مستقیماً برطرف کند و نیازی نیست که کل مدل عیبیابی مجدد شود. این رویکرد همچنین کارایی بیشتری را نسبت به سایر روشها ارائه میدهد. اگر یک کاربر سؤالات مشابه زیادی داشته باشد، میتواند یک برنامه پایه و اصلی تولید کند و سپس بدون نیاز به اجرای مکرر مدل، متغیرهای خاصی را جایگزین کند.
لئونید کارلینسکی (Leonid Karlinsky)، دانشمند ارشد در آزمایشگاه هوش مصنوعی ام آی تی میگوید: «درک اینکه چگونه مدلهای زبان با کد کار میکنند، فرصتهای زیادی را برای ایجاد ابزارهای جدید، راستیآزمایی نتایج و درک بهتر از توانایی مدلها ایجاد میکند.»
مزایا و محدودیتهای تکنیک جدید
«برنامههای تعبیه زبان طبیعی» میتوانند دقت مدلهای بزرگ زبانی مانند جیپیتی-۴ را بالا ببرند تا کارهای مختلفی مانند حل پازل، دنبال کردن دستورالعملها و طبقهبندی متن را با دقت بیش از ۹۰ درصد حل کنند.
یکی دیگر از مزایای برنامههای تعبیه زبان طبیعی این است که میتوانند امنیت حریم خصوصی دادهها را افزایش دهند. دلیلش آن است که این برنامهها میتوانند مستقیم روی دستگاه شما اجرا شوند و بنابراین لازم نیست دادههای حساس شما برای پردازش به شرکتهای بزرگ ارسال شوند.
علاوه بر مزایای دقت و حفظ حریم خصوصی، «برنامههای تعبیه زبان طبیعی» همچنین میتوانند به مدلهای زبانی کوچک کمک کنند تا بدون نیاز به آموزش مجدد برای کارهای خاص بهتر عمل کنند و بنابراین میتوانند در منابع و زمان صرفهجویی کنند.
لو میگوید: «در این تکنیک هیچ جادویی وجود ندارد. ما مدل زبانی گرانتر یا فانتزی نداریم. تنها کاری که انجام میدهیم این است که از تولید برنامه به جای تولید زبان طبیعی استفاده میکنیم و میتوانیم عملکرد آن را به طور قابل توجهی بهتر کنیم.»
البته، اثربخشی «برنامههای تعبیه زبان طبیعی» به توانایی مدل برای تولید برنامهها بستگی دارد و ممکن است در مدلهای کوچکتر که با دادههای محدودتر آموزش دیدهاند کارایی مفیدی نداشته باشد.
این گزارش از ام ای تی نیوز به فارسی برگردان شده است.
انتهای پیام/