قد هوش مصنوعی کی به قامت دانایی انسان میرسد؟
خبرگزاری علم و فناوری آنا؛ نگاهی به کارنامه پیشرفت هوش مصنوعی در دو سال گذشته نشان میدهد که هوش مصنوعی در بسیاری از زمینهها بهسرعت به انسانها نزدیک شده است و همین دلیل ضرورت انجام آزمایشهای جدید و تعیین معیارهای جدید را به ما گوشزد میکند.
موسسه هوش مصنوعی انسانمحور (HAI) در دانشگاه استنفورد بهتازگی هفتمین گزارش جامع سالانه خود را درباره شاخص هوش مصنوعی منتشر کرده که حاصل کار یک تیم بینرشتهای از کارشناسان دانشگاهی و صنعتی است. این نسخه دارای محتوای بیشتری نسبت به نسخههای قبلی است که منعکسکننده تکامل سریع هوش مصنوعی و اهمیت رو به رشد آن در زندگی روزمره ما است. این شاخص به بررسی همه چیز میپردازد: از بخشهایی که هوش مصنوعی در آنها بیشتر کاربرد دارد گرفته تا اینکه جایگاه مشاغل در کدام کشورها به دلیل هوش مصنوعی به خطر افتاده است.
باریک شدن مرز رقابت انسان با هوش مصنوعی
یکی از برجستهترین نکات این گزارش، عملکرد هوش مصنوعی در مقابل انسان است. هوش مصنوعی در حال حاضر ما را در بسیاری از معیارهای مهم شکست داده که آمار آن تکاندهنده است. هوش مصنوعی در سال ۲۰۱۵، در طبقهبندی تصویر، سپس درک مطلب پایه (۲۰۱۷)، استدلال بصری (۲۰۲۰) و استنباط زبان طبیعی (۲۰۲۱) از ما پیشی گرفت.
هوش مصنوعی بهقدری سرعت گرفته است که بسیاری از معیارهای پیشین، در این مرحله دیگر کاربردی ندارند. در واقع، محققان در تلاش هستند معیارهای جدید و چالش برانگیزتری پیدا کنند. به بیان ساده، هوش مصنوعی در گذراندن آزمونها آنقدر خوب کار کرده است که اکنون ما به آزمایشهای جدیدی نیاز داریم، نه برای سنجش شایستگی بیشتر، بلکه برای برجسته کردن حوزههایی که انسانها و مدلهای هوش مصنوعی هنوز متفاوت هستند و پیدا کردن تواناییهایی که هنوز انسان در آنها برتر است.
نتایجی که در نمودار زیر آمده بر اساس معیارهای قدیمی و احتمالاً منسوخ است. اما روند کلی همچنان واضح است:
به خط سیرها نگاه کنید، بهخصوص اینکه چگونه حتی جدیدترین آزمایشها به خط عمودی (انسانی) نزدیک شدهاند. ضمن آنکه باید حواسمان باشد این ماشینها هنوز کودکان نوپای مجازی هستند. گزارش جدید شاخص هوش مصنوعی (اِی آی ایندکس) اشاره میکند که در سال ۲۰۲۳، هوش مصنوعی همچنان در انجام وظایف شناختی پیچیده مانند حل مسائل ریاضیِ پیشرفته و استدلال عقلانی با چالش روبهرو بوده است، اما به این معنی نیست که هوش مصنوعی بد عمل کرده است.
پیشرفت ریاضیاتی و استدلال بصری
عملکرد مجموعه دادههای مَس (MATH)، شامل ۱۲۵۰۰ مسئله چالشبرانگیز ریاضی در سطح رقابتی، ظرف دو سال پس از معرفی بهطور چشمگیری بهبود یافته است. در سال ۲۰۲۱ سیستمهای هوش مصنوعی میتوانستند تنها ۶.۹ درصد از مسئلهها را حل کنند ولی در سال ۲۰۲۳ یک مدل مبتنی بر جیپیتی -۴ توانست ۸۴.۳ درصد از مسئلهها را حل کند. حد پایه انسانی ۹۰ درصد است. ما در اینجا درباره انسان معمولی صحبت نمیکنیم. از انسانهایی حرف میزنیم که میتوانند معادلات سخت را حل کنند و به سؤالات چهارگزینهای پیچیده پاسخ درست بدهند.
ریاضیات پیشرفته و هوش مصنوعی بهسرعت در حال تکامل هستند و جهان ما را به روشهای بیسابقهای تحت تأثیر قرار میدهند. یکی از حوزههای تحقیقات هوش مصنوعی، استدلال عقلانی بصری است که فراتر از تشخیص اصلی اشیاء است و به تجزیهوتحلیل این موضوع میپردازد که هوش مصنوعی چگونه اطلاعات بصری را درک میکند و بر اساس زمینه پیشبینی میکند. بهعنوان مثال، هنگامیکه هوش مصنوعی تصویر یک گربه را روی میز میبیند، بر اساس استدلال عقلانی بصری پیشبینی میکند که آیا گربه ممکن است از روی میز بپرد یا اینکه آیا میز میتواند وزن او را تحمل کند؟ گزارش اخیر نشان میدهد که استدلال عقلانی بصری در هوش مصنوعی بین سالهای ۲۰۲۲ و ۲۰۲۳ بهطور قابلتوجهی بهبود یافته است، این دقت با افزایش ۷.۹۳ درصدی به ۸۱.۶۰ درصد رسیده است. حد پایه انسانی برای استدلال عقلانی بصری ۸۵ است یعنی هنوز جای پیشرفت دارد.
تولید عکس بر اساس توضیحات متن
تا همین چند سال پیش، تصور اینکه رایانه بتواند متن یک عکس را بفهمد و به سؤالات مربوط به آن پاسخ دهد، سخت بود. اما اکنون با کمک هوش مصنوعی رایانهها میتوانند محتوای نوشتاری برای حرفههای مختلف تولید کنند. با این حال، هنوز راه زیادی در پیش است تا بتوانیم به اطلاعات ارائهشده توسط هوش مصنوعی کاملاً اعتماد کنیم. گاهی اوقات، محتوای تولید شده توسط هوش مصنوعی میتواند گمراهکننده باشد و اطلاعات نادرست را بهعنوان واقعیت ارائه دهد. این یک چالش بزرگ است که باید برطرف شود تا مطمئن شویم که میتوانیم به محتوای تولیدشده توسط هوش مصنوعی تکیه کنیم.
مشکل «توهم» هوش مصنوعی
امروزه هوش مصنوعی برای بسیاری از حرفهها محتوا میکنند. اما، با وجود پیشرفت بسیار زیاد، مدلهای زبانی بزرگ هنوز مستعد «توهم» هستند، از اصطلاح توهم زمانی استفاده میشود که هوش مصنوعی اطلاعات نادرست یا گمراهکنندهای را بهعنوان واقعیت ارائه میدهد. سال گذشته، تمایل هوش مصنوعی به «توهم» رسوایی بزرگی برای استیون شوارتز (Steven Schwartz)، وکیل اهل نیویورک به بار آورد. او برای تحقیقات حقوقی خود از چتجیپیتی استفاده کرده و بدون بررسی نتایج، آنها را به دادگاه ارائه داد که رسوایی بزرگی برای او به بار آورد. قاضی پرونده بهسرعت پروندههای حقوقی ساختهشده با هوش مصنوعی را بررسی و شوارتز را به دلیل اشتباه سهلانگارانهاش ۵ هزار دلار جریمه کرد. داستان او در سراسر جهان خبرساز شد.
راستی آزمایی هوش مصنوعی
شاخص هالو ایوَل (HaluEval) که بهعنوان معیاری برای سنجش توهمات استفاده میشود تا کنون نشان داده که در بسیاری از مدلهای بزرگ زبانی، توهم هنوز یک مشکل مهم است. در گزارش اخیر شاخص هوش مصنوعی از ۸۱۷ نفر در مورد موضوعات مختلف مانند سلامت، قانون، امور مالی و سیاست سؤالاتی پرسیده شد تا میزان واقعی بودن پاسخهای هوش مصنوعی مورد آزمایش قرار بگیرد. این پرسشها برای به چالش کشیدن تصورات غلط رایجی بود که حتی اغلب انسانها هم درباره آنها اشتباه میکنند. جیپیتی-۴ که در اوایل سال ۲۰۲۴ منتشر شد، با امتیاز ۰.۵۹ بالاترین امتیاز را به لحاظ عملکرد گرفت، یعنی سه برابر بیشتر از مدل مبتنی بر جیپیتی-۲ که در سال ۲۰۲۱ آزمایش شد. چنین پیشرفتی نشان میدهد که مدلهای بزرگ زبانی بهتدریج بهتر میشوند و پاسخهای واقعیتری ارائه میدهند.
مدلهای برتر در تولید تصویر
حال این پرسش پیش میآید که مدلهای هوش مصنوعی در تولید تصاویر چطور عمل کردهاند؟ برای درک پیشرفت تصاعدی در تولید متن از تصویر، به تلاش هوش مصنوعی میدجِرنی (Midjourney) برای ترسیم چهره «هری پاتر» از سال ۲۰۲۲ تا ۲۰۲۳ توجه کنید:
پیشرفت هوش مصنوعی میدجرنی (Midjourney): «تصویر فراواقعی هری پاتر» منبع: اِی آی ایندکس ۲۰۲۴
این نمودار نشان میدهد که پیشرفت هوش مصنوعی میدجرنی ۲۲ ماه زمان برده است. فکر میکنید اگر یک انسان هنرمند میخواست به چنین سطحی از پیشرفت برسد، چه مقدار زمان نیاز داشت؟ محققان بر اساس ۱۲ معیار مهم، تواناییهای برنامههای رایانهای تولید تصویر از متن را بررسی کردند و دریافتند که هیچ برنامهای در همه چیز بهترین نیست، اما در این میان، مدل هوش مصنوعی دال-ای ۲ (DALL-E ۲) که بر اساس متن تصویر میسازد، بالاترین امتیاز را به دست آورد. مدل دریملایک فوتوریل (Dreamlike Photoreal) نیز از نظر زیباییشناسی بصری و اصالت در بالاترین رتبه قرار گرفت.
گزارش شگفتانگیز سال ۲۰۲۴
گزارشدهی شاخص هوش مصنوعی در سال ۲۰۲۳ پایان یافت، سالی با پیشرفت و هیجانی عظیم در دنیای هوش مصنوعی همراه بود. اما سال ۲۰۲۴، حیرتآورتر شروع شده است. از ابتدای سال تا کنون، چندین محصول تحولآفرین هوش مصنوعی مانند سانو (Suno)، سورا (Sora)، گوگل جنی (Google Genie)، کلود ۳ (Claude ۳)، چنل ۱ (Channel ۱) و دوین (Devin) عرضه شدهاند که هرکدام پتانسیل ایجاد انقلابی بزرگ در کل صنایع را دارند. در این میان، شبح اسرارآمیز جیپیتی-۵، که ممکن است بهزودی عرضه شود، بر همه مدلها سایه انداخته و شاید بهقدری کامل و فراگیر باشد که تمام مدلهای دیگر را از میدان به در کند.
این گزارش از پایگاه اینترنتی نیواطلس به فارسی برگردان شده است.
انتهای پیام/