کشف ویژگی جدید مدل‌های بزرگ زبانی/ الگو‌های غیرعادی شناسایی می‌شود

پژوهشگران مؤسسه فناوری ماساچوست (ام آی تی) پتانسیل بالایی در مدل‌های بزرگ زبانی کشف کرده‌اند که نشان می‌دهد این مدل‌ها می‌توانند در مجموعه داده‌هایی که در طول زمان تغییر می‌کنند، الگو‌های غیرعادی را به خوبی شناسایی کنند.

کد خبر : 927722

به گزارش خبرگزاری آنا؛ در یک مطالعه اخیر، محققان ام آی تی کشف کردند که مدل‌های بزرگ زبانی این پتانسیل را دارند که در تشخیص الگو‌های غیرعادی در مجموعه‌ای از داده‌های جمع‌آوری‌شده در طول زمان بسیار خوب عمل کنند. نکته جالب این است که این مدل‌ها نیازی به آموزش گسترده ندارند و بلافاصله پس از ساخته شدن آمادۀ استفاده هستند.

این کشف به طور بالقوه می‌تواند به تکنسین‌ها کمک کند تا مشکلات احتمالی در تجهیزاتی مانند ماشین‌آلات سنگین یا ماهواره‌ها را قبل از وقوع و بدون نیاز به مدل‌های یادگیری عمیق، که بسیار پرهزینه هستند، شناسایی کنند.

این تیم روشی به نام «سیگ ال ال ام» (SigLLM) ارائه کردند که شامل تبدیل داده‌های مبتنی بر زمان به متن است تا مدل زبانی بتواند آن را درک کند. سپس کاربران می‌توانند این داده‌های آماده را به مدل بدهند و از آن بخواهند که شروع به جستجوی چیز‌های عجیب و غریب یا غیرمنتظره کند. مدل زبانی حتی می‌تواند برای پیش‌بینی نقاط داده آینده به عنوان بخشی از یک سیستم برای یافتن الگو‌های غیرمعمول استفاده شود.

محققان خاطرنشان کردند که مدل‌های بزرگ زبانی خودارجاع هستند. در مدل‌های خودارجاع خروجی هر مرحله به ورودی آن مرحله و خروجی مرحله قبل وابسته است. این ویژگی باعث می‌شود که مدل‌های بزرگ زبانی برای تشخیص ناهنجاری‌ها در داده‌های سری زمانیِ متوالی مناسب باشند.

رویکردهای تحقیق

این تیم دو رویکرد تشخیص ناهنجاری را با استفاده از مدل‌های بزرگ زبانی توسعه دادند. اولین رویکرد، به نام پرامپتر: به معنای درخواست‌کننده (Prompter)، شامل تغذیه داده‌ها به یک مدل و درخواست از آن برای یافتن مقادیر غیرعادی است. محققان باید راه‌های مختلفی را برای درخواست از مدل برای انجام این کار امتحان می‌کردند تا زمانی که روش مناسبی برای مجموعه‌ای از داده‌ها پیدا کنند.

روش دوم دتکتور: به معنای کشف‌کننده (Detector) نام دارد و از مدل برای پیش بینی مقدار بعدی در دنباله‌ای از داده‌ها استفاده می‌کند. سپس محققین مقدار پیش بینی‌شده را با مقدار واقعی مقایسه می‌کنند. اگر تفاوت زیادی وجود داشته باشد، می‌تواند به این معنی باشد که ارزش واقعی، غیرعادی است.

مدل‌های هوش مصنوعیِ مبتنی بر ترانسفورماتور در هفت مجموعه از ۱۱ مجموعه داده‌ای که آنها ارزیابی کردند، عملکرد بهتری داشتتند، که نشان‌دهنده پتانسیل مدل‌های بزرگ زبانی برای تشخیص ناهنجاری است.
این تیم تحقیقاتی یافته‌های خود را نخستین بار در کنفرانس «مؤسسه مهندسان برق و الکترونیک» (IEEE) با موضوع علم داده و تجزیه و تحلیل پیشرفته ارائه کردند.

محققان خوش‌بین هستند که بهبود‌های بیشتر در عملکرد مدل بزرگ زبانی می‌تواند منجر به یک چارچوب تشخیص ناهنجاری عملی و مقرون‌به‌صرفه برای صنایع مختلف شود که از قابلیت‌های موجود در مدل‌های زبان بزرگ بهره می‌برد.

انتهای پیام/