قد هوش مصنوعی کی به قامت دانایی انسان می‌رسد؟

مرز رقابت هوش مصنوعی با انسان بسیار باریک شده و دیگر کمتر چیزی است که هوش مصنوعی نتواند در آن به خوبی انسان عمل کند، چنین پیشرفتی ممکن است باعث شود به‌زودی به یک مدل واحد هوش مصنوعی برسیم.

کد خبر : 907184

اشتراک گذاری

خبرگزاری علم و فناوری آنا؛ نگاهی به کارنامه پیشرفت هوش مصنوعی در دو سال گذشته نشان می‌دهد که هوش مصنوعی در بسیاری از زمینه‌ها به‌سرعت به انسان‌ها نزدیک شده است و همین دلیل ضرورت انجام آزمایش‌های جدید و تعیین معیار‌های جدید را به ما گوشزد می‌کند.

موسسه هوش مصنوعی انسان‌محور (HAI) در دانشگاه استنفورد به‌تازگی هفتمین گزارش جامع سالانه خود را درباره شاخص هوش مصنوعی منتشر کرده که حاصل کار یک تیم بین‌رشته‌ای از کارشناسان دانشگاهی و صنعتی است. این نسخه دارای محتوای بیشتری نسبت به نسخه‌های قبلی است که منعکس‌کننده تکامل سریع هوش مصنوعی و اهمیت رو به رشد آن در زندگی روزمره ما است. این شاخص به بررسی همه چیز می‌پردازد: از بخش‌هایی که هوش مصنوعی در آنها بیشتر کاربرد دارد گرفته تا اینکه جایگاه مشاغل در کدام کشور‌ها به دلیل هوش مصنوعی به خطر افتاده است.

باریک شدن مرز رقابت انسان با هوش مصنوعی

یکی از برجسته‌ترین نکات این گزارش، عملکرد هوش مصنوعی در مقابل انسان است. هوش مصنوعی در حال حاضر ما را در بسیاری از معیار‌های مهم شکست داده که آمار آن تکان‌دهنده است. هوش مصنوعی در سال ۲۰۱۵، در طبقه‌بندی تصویر، سپس درک مطلب پایه (۲۰۱۷)، استدلال بصری (۲۰۲۰) و استنباط زبان طبیعی (۲۰۲۱) از ما پیشی گرفت.

هوش مصنوعی به‌قدری سرعت گرفته است که بسیاری از معیار‌های پیشین، در این مرحله دیگر کاربردی ندارند. در واقع، محققان در تلاش هستند معیار‌های جدید و چالش برانگیزتری پیدا کنند. به بیان ساده، هوش مصنوعی در گذراندن آزمون‌ها آنقدر خوب کار کرده است که اکنون ما به آزمایش‌های جدیدی نیاز داریم، نه برای سنجش شایستگی بیشتر، بلکه برای برجسته کردن حوزه‌هایی که انسان‌ها و مدل‌های هوش مصنوعی هنوز متفاوت هستند و پیدا کردن توانایی‌هایی که هنوز انسان در آنها برتر است.

نتایجی که در نمودار زیر آمده بر اساس معیار‌های قدیمی و احتمالاً منسوخ است. اما روند کلی همچنان واضح است:

به خط سیر‌ها نگاه کنید، به‌خصوص اینکه چگونه حتی جدیدترین آزمایش‌ها به خط عمودی (انسانی) نزدیک شده‌اند. ضمن آنکه باید حواسمان باشد این ماشین‌ها هنوز کودکان نوپای مجازی هستند. گزارش جدید شاخص هوش مصنوعی (اِی آی ایندکس) اشاره می‌کند که در سال ۲۰۲۳، هوش مصنوعی همچنان در انجام وظایف شناختی پیچیده مانند حل مسائل ریاضیِ پیشرفته و استدلال عقلانی با چالش روبه‌رو بوده است، اما به این معنی نیست که هوش مصنوعی بد عمل کرده است.

پیشرفت ریاضیاتی و استدلال بصری

عملکرد مجموعه داده‌های مَس (MATH)، شامل ۱۲۵۰۰ مسئله چالش‌برانگیز ریاضی در سطح رقابتی، ظرف دو سال پس از معرفی به‌طور چشمگیری بهبود یافته است. در سال ۲۰۲۱ سیستم‌های هوش مصنوعی می‌توانستند تنها ۶.۹ درصد از مسئله‌ها را حل کنند ولی در سال ۲۰۲۳ یک مدل مبتنی بر جی‌پی‌تی -۴ توانست ۸۴.۳ درصد از مسئله‌ها را حل کند. حد پایه انسانی ۹۰ درصد است. ما در اینجا درباره انسان معمولی صحبت نمی‌کنیم. از انسان‌هایی حرف می‌زنیم که می‌توانند معادلات سخت را حل کنند و به سؤالات چهارگزینه‌ای پیچیده پاسخ درست بدهند.

ریاضیات پیشرفته و هوش مصنوعی به‌سرعت در حال تکامل هستند و جهان ما را به روش‌های بی‌سابقه‌ای تحت تأثیر قرار می‌دهند. یکی از حوزه‌های تحقیقات هوش مصنوعی، استدلال عقلانی بصری است که فراتر از تشخیص اصلی اشیاء است و به تجزیه‌وتحلیل این موضوع می‌پردازد که هوش مصنوعی چگونه اطلاعات بصری را درک می‌کند و بر اساس زمینه پیش‌بینی می‌کند. به‌عنوان مثال، هنگامی‌که هوش مصنوعی تصویر یک گربه را روی میز می‌بیند، بر اساس استدلال عقلانی بصری پیش‌بینی می‌کند که آیا گربه ممکن است از روی میز بپرد یا اینکه آیا میز می‌تواند وزن او را تحمل کند؟ گزارش اخیر نشان می‌دهد که استدلال عقلانی بصری در هوش مصنوعی بین سال‌های ۲۰۲۲ و ۲۰۲۳ به‌طور قابل‌توجهی بهبود یافته است، این دقت با افزایش ۷.۹۳ درصدی به ۸۱.۶۰ درصد رسیده است. حد پایه انسانی برای استدلال عقلانی بصری ۸۵ است یعنی هنوز جای پیشرفت دارد.

تولید عکس بر اساس توضیحات متن

تا همین چند سال پیش، تصور اینکه رایانه بتواند متن یک عکس را بفهمد و به سؤالات مربوط به آن پاسخ دهد، سخت بود. اما اکنون با کمک هوش مصنوعی رایانه‌ها می‌توانند محتوای نوشتاری برای حرفه‌های مختلف تولید کنند. با این حال، هنوز راه زیادی در پیش است تا بتوانیم به اطلاعات ارائه‌شده توسط هوش مصنوعی کاملاً اعتماد کنیم. گاهی اوقات، محتوای تولید شده توسط هوش مصنوعی می‌تواند گمراه‌کننده باشد و اطلاعات نادرست را به‌عنوان واقعیت ارائه دهد. این یک چالش بزرگ است که باید برطرف شود تا مطمئن شویم که می‌توانیم به محتوای تولیدشده توسط هوش مصنوعی تکیه کنیم.

مشکل «توهم» هوش مصنوعی

امروزه هوش مصنوعی برای بسیاری از حرفه‌ها محتوا می‌کنند. اما، با وجود پیشرفت بسیار زیاد، مدل‌های زبانی بزرگ هنوز مستعد «توهم» هستند، از اصطلاح توهم زمانی استفاده می‌شود که هوش مصنوعی اطلاعات نادرست یا گمراه‌کننده‌ای را به‌عنوان واقعیت ارائه می‌دهد. سال گذشته، تمایل هوش مصنوعی به «توهم» رسوایی بزرگی برای استیون شوارتز (Steven Schwartz)، وکیل اهل نیویورک به بار آورد. او برای تحقیقات حقوقی خود از چت‌جی‌پی‌تی استفاده کرده و بدون بررسی نتایج، آنها را به دادگاه ارائه داد که رسوایی بزرگی برای او به بار آورد. قاضی پرونده به‌سرعت پرونده‌های حقوقی ساخته‌شده با هوش مصنوعی را بررسی و شوارتز را به دلیل اشتباه سهل‌انگارانه‌اش ۵ هزار دلار جریمه کرد. داستان او در سراسر جهان خبرساز شد.

راستی آزمایی هوش مصنوعی

شاخص هالو ایوَل (HaluEval) که به‌عنوان معیاری برای سنجش توهمات استفاده می‌شود تا کنون نشان داده که در بسیاری از مدل‌های بزرگ زبانی، توهم هنوز یک مشکل مهم است. در گزارش اخیر شاخص هوش مصنوعی از ۸۱۷ نفر در مورد موضوعات مختلف مانند سلامت، قانون، امور مالی و سیاست سؤالاتی پرسیده شد تا میزان واقعی بودن پاسخ‌های هوش مصنوعی مورد آزمایش قرار بگیرد. این پرسش‌ها برای به چالش کشیدن تصورات غلط رایجی بود که حتی اغلب انسان‌ها هم درباره آنها اشتباه می‌کنند. جی‌پی‌تی-۴ که در اوایل سال ۲۰۲۴ منتشر شد، با امتیاز ۰.۵۹ بالاترین امتیاز را به لحاظ عملکرد گرفت، یعنی سه برابر بیشتر از مدل مبتنی بر جی‌پی‌تی-۲ که در سال ۲۰۲۱ آزمایش شد. چنین پیشرفتی نشان می‌دهد که مدل‌های بزرگ زبانی به‌تدریج بهتر می‌شوند و پاسخ‌های واقعی‌تری ارائه می‌دهند.

مدل‌های برتر در تولید تصویر

حال این پرسش پیش می‌آید که مدل‌های هوش مصنوعی در تولید تصاویر چطور عمل کرده‌اند؟ برای درک پیشرفت تصاعدی در تولید متن از تصویر، به تلاش هوش مصنوعی میدجِرنی (Midjourney) برای ترسیم چهره «هری پاتر» از سال ۲۰۲۲ تا ۲۰۲۳ توجه کنید:

پیشرفت هوش مصنوعی میدجرنی (Midjourney): «تصویر فراواقعی هری پاتر» منبع: اِی آی ایندکس ۲۰۲۴

این نمودار نشان می‌دهد که پیشرفت هوش مصنوعی میدجرنی ۲۲ ماه زمان برده است. فکر می‌کنید اگر یک انسان هنرمند می‌خواست به چنین سطحی از پیشرفت برسد، چه مقدار زمان نیاز داشت؟ محققان بر اساس ۱۲ معیار مهم، توانایی‌های برنامه‌های رایانه‌ای تولید تصویر از متن را بررسی کردند و دریافتند که هیچ برنامه‌ای در همه چیز بهترین نیست، اما در این میان، مدل هوش مصنوعی دال-ای ۲ (DALL-E ۲) که بر اساس متن تصویر می‌سازد، بالاترین امتیاز را به دست آورد. مدل دریم‌لایک فوتوریل (Dreamlike Photoreal) نیز از نظر زیبایی‌شناسی بصری و اصالت در بالاترین رتبه قرار گرفت.

گزارش شگفت‌انگیز سال ۲۰۲۴

گزارش‌دهی شاخص هوش مصنوعی در سال ۲۰۲۳ پایان یافت، سالی با پیشرفت و هیجانی عظیم در دنیای هوش مصنوعی همراه بود. اما سال ۲۰۲۴، حیرت‌آورتر شروع شده است. از ابتدای سال تا کنون، چندین محصول تحول‌آفرین هوش مصنوعی مانند سانو (Suno)، سورا (Sora)، گوگل جنی (Google Genie)، کلود ۳ (Claude ۳)، چنل ۱ (Channel ۱) و دوین (Devin) عرضه شده‌اند که هرکدام پتانسیل ایجاد انقلابی بزرگ در کل صنایع را دارند. در این میان، شبح اسرارآمیز جی‌پی‌تی-۵، که ممکن است به‌زودی عرضه شود، بر همه مدل‌ها سایه انداخته و شاید به‌قدری کامل و فراگیر باشد که تمام مدل‌های دیگر را از میدان به در کند.

این گزارش از پایگاه اینترنتی نیواطلس به فارسی برگردان شده است.

انتهای پیام/