نیمنگاهی به آخرین پیشرفتهای هوش مصنوعی در عصر تحول
به گزارش خبرنگار خبرگزاری علم و فناوری آنا، هوش مصنوعی در هر گوشهای از زندگی روزانه بشر خود را نشان میدهد، از موسیقی و رسانه گرفته تا کسب وکارها و... از این رو با گسترش هوش مصنوعی باید از آخرین پیشرفتها و تحولات این فناوری نوین و شرایط آن مطلع بود.
هوش مصنوعی که یادگیری ماشینی نیز نامیده میشود، نوعی سیستم نرمافزاری مبتنی بر شبکههای عصبی است، تکنیکی که در واقع دههها قبل پیشگام بود، اما اخیرا به لطف منابع محاسباتی جدید و قدرتمند شکوفا شده است. هوش مصنوعی تشخیص موثر صدا، تصویر و همچنین توانایی تولید تصاویر مصنوعی و گفتار را ممکن کرده است. محققان سخت در تلاش هستند تا امکان مرور وب، رزرو بلیط، تغییر دستورالعملها و ... را برای یک هوش مصنوعی فراهم کنند.
یکی از نکات جالب در مورد هوش مصنوعی این است که اگرچه مفاهیم اصلی به بیش از ۵۰ سال پیش باز میگردند، اما تعداد کمی از آنها حتی تا همین اواخر هم برای اهالی تکنولوژی آشنا بودند.
شباهت هوش مصنوعی با مغز انسان
مغز ما عمدتا از سلولهای به هم پیوستهای به نام نورون تشکیل شده که با یکدیگر شبکههای پیچیدهای را تشکیل میدهند که وظایف را انجام میدهند و اطلاعات را ذخیره میکنند. بازسازی این سیستم شگفتانگیز در نرمافزار از دهه ۶۰ میلادی آغاز شد، اما قدرت پردازشی مورد نیاز تا ۱۵ الی ۲۰ سال پیش که «جیپییو»ها (GPU) اجازه شکوفایی شبکههای عصبی تعریف شده دیجیتالی را میدادند، به طور گسترده در دسترس نبود.
در قلب آنها فقط تعداد زیادی نقطه و خط وجود دارد؛ نقطهها داده هستند و خطوط روابط آماری بین آن مقادیر هستند. مانند مغز، این میتواند یک سیستم همه کاره ایجاد کند که به سرعت یک ورودی میگیرد، آن را از شبکه عبور میدهد و یک خروجی تولید میکند. این سیستم یک مدل نامیده میشود. این مدل، مجموعه کدی است که ورودیها را میپذیرد و خروجیها را برمیگرداند. شباهت در اصطلاحات به یک مدل آماری یا یک سیستم مدل سازی که یک فرآیند طبیعی پیچیده را شبیه سازی میکند، تصادفی نیست.
در هوش مصنوعی، مدل میتواند به یک سیستم کامل مانند «چت جیپیتی» (ChatGPT) یا تولید هر ساختار هوش مصنوعی یا یادگیری ماشینی، اشاره کند. مدلها اندازههای مختلفی دارند، یعنی هم مقدار فضای ذخیره سازی را اشغال میکنند و هم اینکه چقدر قدرت محاسباتی برای اجرا نیاز دارند؛ اینها به نحوه آموزش مدل بستگی دارد.
برای ایجاد یک مدل هوش مصنوعی، شبکههای عصبی که پایه سیستم را تشکیل میدهند، در معرض مجموعهای از اطلاعات قرار میگیرند که مجموعه داده یا پیکره نامیده میشود. با انجام این کار، این شبکههای عظیم یک نمایش آماری از آن دادهها ایجاد میکنند. این فرآیند آموزشی، فشردهترین بخش محاسبات است، به این معنی که هفتهها یا ماهها طول میکشد تا پیش برود.
دلیل این امر این است که نه تنها شبکهها پیچیده هستند، بلکه مجموعه دادهها میتوانند بسیار بزرگ باشند. میلیاردها کلمه یا تصویر که باید تحلیل شوند و در مدل آماری بزرگ نمایش داده شوند.
از سوی دیگر هنگامی که مدل کار خود را انجام میدهد، به آن استنتاج میگویند. البته این دقیقا استدلال نیست، بلکه از نظر آماری نقاط موجود در دادههایی که بلعیده است را به هم متصل میکند و در واقع نقطه بعدی را پیشبینی میکند.
استنتاج به طور کلی از نظر محاسباتی بسیار کم هزینهتر از آموزش است. مدلهای بزرگ هنوز هم باید روی ابرکامپیوترها و جیپییوها اجرا شوند، اما مدلهای کوچکتر میتوانند روی گوشی هوشمند اجرا شوند.
هوش مصنوعی عمومی
همه در مورد هوش مصنوعی مولد صحبت میکنند و این اصطلاح گسترده فقط به معنای یک مدل هوش مصنوعی است که یک خروجی اصلی، مانند یک تصویر یا متن تولید میکند. برخی از هوشهای مصنوعی خلاصه، برخی سازماندهی مجدد و برخی شناسایی میشوند. اما یک هوش مصنوعی که تولید انجام میدهد در حال حاضر محبوب است. اینکه یک هوش مصنوعی خدمتی را ارائه میکند، به این معنی نیست که درست است یا واقعیت را منعکس میکند. فراتر از اصول اولیه، این اصطلاحات هوش مصنوعی هستند که در اواسط سال ۲۰۲۳ بیشترین ارتباط را دارند.
مدلهای زبانی بزرگ
تاثیرگذارترین و متنوعترین شکل هوش مصنوعی که امروزه در دسترس است، مدلهای زبانی بزرگ بر روی تمام متنهای تشکیل دهنده وب و بسیاری از متون انگلیسی آموزش داده میشوند. با در نظر گرفتن تمام این موارد، یک مدل پایه با ابعاد بزرگ به دست میآید. مدلها قادر به گفتوگو و پاسخ به سوالات به زبان طبیعی و تقلید از سبکها و انواع مختلف اسناد نوشتاری هستند. در حالی که این مدلها به طور غیرقابل انکاری تاثیرگذار هستند، باید در نظر داشت که آنها هنوز موتورهای تشخیص الگو هستند و وقتی پاسخ میدهند تلاشی برای تکمیل الگویی است که شناسایی کرده که آیا آن الگو واقعیت را منعکس میکند یا خیر. مدلهای زبانی اغلب در پاسخهای خود دچار توهم میشوند که به زودی به آنها خواهیم رسید.
مدل بنیاد
آموزش یک مدل بزرگ از ابتدا روی مجموعه دادههای عظیم پرهزینه و پیچیده است. مدلهای پایه، مدلهای بزرگی هستند که برای اجرا به ابرکامپیوتر نیاز دارند، اما میتوان آنها را طوری اصلاح کرد که در محفظههای کوچکتر جای بگیرند، معمولا با کاهش تعداد پارامترها شما میتوانید آنها را به عنوان کل نقاطی در نظر بگیرید که مدل باید با آنها کار کند و این روزها میتواند در قالب میلیونها، میلیاردها یا حتی تریلیونها مدل در دسترس باشد.
تنظیم هوش مصنوعی در تعامل با انسان
یک مدل پایه مانند «چت جیپیتی-۴» (GPT - ۴) هوشمند است، اما از نظر طراحی نیز یک تعمیمدهنده است. مدلها را میتوان با آموزش بیشتر و با استفاده از یک مجموعه داده تخصصی تنظیم کرد. یادگیری تقویتی از بازخورد انسانی یا RLHF، نوع خاصی از تنظیم دقیق است که از دادههای تعامل انسانها با مدلهای زبانی برای بهبود مهارتهای ارتباطی خود استفاده میکند.
فناوری پردازش تصویر
تولید تصویر را میتوان به روشهای متعددی انجام داد، اما تا به امروز موفقترین روش، انتشار است. مدلهای دیپ فیوژن یا فناوری پردازش تصویر با نشان دادن تصاویری آموزش داده میشوند که به تدریج با اضافه کردن نویز دیجیتال تخریب میشوند تا زمانی که از اصل آن موردی باقی نماند. با مشاهده این موضوع، مدلهای انتشار یاد میگیرند که این فرآیند را به صورت معکوس نیز انجام دهند و به تدریج جزئیات را به نویز خالص اضافه کنند تا یک تصویر دلخواه ایجاد شود.
هوش مصنوعی متوهم
یک هوش مصنوعی زمانی دچار توهم میشود که دادههای ناکافی یا متناقضی در مجموعه آموزشی خود داشته باشد و دادهای را بسازد. این میتواند یک دارایی یا یک مسئولیت باشد. یک هوش مصنوعی که از او خواسته میشود یک اثر هنری اصیل یا حتی مشتق شده خلق کند، خروجی آن را دچار توهم میکند.
انتهای پیام/