تمرکزگرایی در هوش مصنوعی به بنبست نوآوری ختم میشود
رضا نورمحمدی، محقق دانشگاه بریتیش کلمبیا در سخنرانی خود در رویداد ایفتکس به بررسی وضعیت کنونی دادهها و تسلط شرکتهای محدود بر مدلهای زبانی بزرگ پرداخت و هشدار داد که ادامه روند فعلی و تمرکز قدرت پردازشی و اطلاعاتی در دست چند شرکت خاص، منجر به ایجاد سوگیریهای غیرقابلکنترل و توقف نوآوری خواهد شد. نورمحمدی با اشاره به حجم عظیم تولید داده در جهان، ادغام فناوری بلاکچین با هوش مصنوعی را نه یک انتخاب، بلکه یک ضرورت فنی برای تأمین قدرت پردازشی آینده و دموکراتیزه کردن دسترسی به اطلاعات معرفی کرد.
انحصار دادهها و چالشهای مدلهای متمرکز
نورمحمدی در ابتدای سخنان خود با ترسیم شمایی از وضعیت فعلی دنیای فناوری، شرکتهای آمازون، مایکروسافت و گوگل را به چاههای نفت مدرن تشبیه کرد که ارزش افزوده اصلی آنها ناشی از مالکیت حجم انبوهی از دادههاست.
وی گفت: «امروزه هر نهادی که داده بیشتری در اختیار داشته باشد، دقت مدلهایش افزایش مییابد و دقت بیشتر مستقیماً به درآمد بالاتر منجر میشود. مدلهایی مانند GPT-۳ با استفاده از صدها میلیارد توکن آموزش دیدهاند که بخش عمده آن از طریق خزندههای وب جمعآوری شده است. با این حال، آنچه ما در ابزارهایی مانند چتجیپیتی میبینیم، بخش عظیمی از دادهها به دلایل محرمانگی یا فقدان قدرت پردازشی، خارج از دسترس باقی ماندهاند.»
این پژوهشگر هوش مصنوعی با انتقاد از انحصار موجود اظهار داشت: «در حال حاضر تنها حدود ۱۰ شرکت در جهان توانایی توسعه مدلهای زبانی بزرگ را دارند. این انحصار باعث بازتولید مشکلات گذشته شده است. سیستمهای فعلی همگی متمرکز هستند و ما دقیقاً نمیدانیم اطلاعات کاربران کجا ذخیره میشود یا چگونه پردازش میگردد. این عدم شفافیت منجر به بروز سوگیری در مدلها میشود. به عنوان مثال، مدلهایی وجود دارند که به دلیل آموزش با دادههای جهتدار، در تشخیص هویت افراد رنگینپوست دچار خطا میشوند، در حالی که برای افراد سفیدپوست عملکرد صحیحی دارند.»
انتقال به معماری ماژولار و یادگیری فدرال
نورمحمدی در ادامه به تشریح راهکارهای فنی برای عبور از این بحران پرداخت و از مفهوم یادگیری فدرال به عنوان جایگزینی برای پردازش متمرکز یاد کرد.
این کارشناس بلاکچین توضیح داد: «ما نیاز داریم معماری هوش مصنوعی را تغییر دهیم. در یادگیری فدرال، به جای اینکه دادههای کاربر به سرور مرکزی ارسال شود، مدل هوش مصنوعی به سمت دستگاه کاربر مانند گوشی موبایل فرستاده میشود. پردازش روی دستگاه کاربر انجام میشود و تنها نتایج یادگیری بدون انتقال اصل دادهها به سرور بازمیگردد تا مدل جهانی بهروزرسانی شود. این روش، امنیت دادههای شخصی را تضمین میکند و نمونه بارز آن سیستمهای تکمیل خودکار کلمات در گوشیهای هوشمند است.»
وی با مقایسه معماریهای یکپارچه و ماژولار افزود: «مسیر توسعه نرمافزار به سمت ماژولار شدن پیش میرود. همانطور که اتریوم در نسخه دوم خود لایههای اجرا، تصفیه و دسترسی به داده را تفکیک کرد، هوش مصنوعی نیز باید از حالت یکپارچه خارج شود. این تغییر معماری امکان مقیاسپذیری را فراهم میکند و اجازه میدهد پردازشها در لبه شبکه و روی دستگاههای توزیعشده انجام شود.»
انقلاب سختافزاری با RISC-V و نقش بلاکچین
بخش دیگری از سخنان نورمحمدی به چالش تأمین قدرت پردازشی اختصاص داشت. وی با اشاره به رقابت جهانی بر سر چیپهای پردازشی گفت: «تقاضا برای قدرت محاسباتی به شدت در حال افزایش است و سختافزارهای فعلی پاسخگو نیستند. در اینجا ما شاهد ظهور معماری سختافزاری متنباز RISC-V هستیم. این فناوری انحصار شرکتهایی مانند انویدیا را به چالش میکشد و اجازه میدهد سختافزارها با دستورالعملهای سفارشی و باز طراحی شوند.»
نورمحمدی تصریح کرد: «ادغام بلاکچین و هوش مصنوعی در اینجا معنا پیدا میکند. پروژههایی مانند پولکادات با معرفی ماشینهایی نظیر JAM به دنبال ایجاد بستری هستند که در آن مدل، داده و فرایند آموزش همگی متنباز و توزیعشده باشند. این ساختارها میتوانند قدرت پردازشی لازم برای نسل بعدی هوش مصنوعی را از طریق شبکهای از منابع خرد تأمین کنند.»
الهام از طبیعت و شبکه درختان
این محقق حوزه فناوری با استفاده از تمثیل Wood Wide Web یا شبکه ارتباطی درختان در طبیعت، الگوی مطلوب برای آینده اینترنت را توصیف کرد.
وی بیان کرد: «طبیعت میلیونها سال پیش مشکل حکمرانی و توزیع منابع را حل کرده است. در جنگل، درختان قدیمیتر به عنوان هاب عمل میکنند و از طریق شبکههای قارچی، منابع را مدیریت و توزیع میکنند. ما نیز در حال حرکت از سیستمهای متمرکز به غیرمتمرکز و در نهایت به سمت سیستمهای باز-متمرکز هستیم که در آن نودهای قدرتمندتر به شبکه کمک میکنند، اما ساختار کلی همچنان توزیعشده باقی میماند.»
تشخیص سرطان با حفظ محرمانگی
نورمحمدی در بخش پایانی صحبتهای خود به پیادهسازی عملی این مفاهیم در حوزه سلامت اشاره کرد و از توسعه پروژهای برای تشخیص زودهنگام سرطان خبر داد.
وی در این خصوص گفت: «ما برای حل چالش تشخیص بیماریهای ژنتیکی و سرطان، با مشکل محرمانگی دادههای پزشکی روبهرو بودیم. بیمارستانها و بیماران حاضر به اشتراکگذاری دادههای حساس خود نیستند. برای حل این مشکل، ما یک ساختار مبتنی بر یادگیری فدرال و بلاکچین طراحی کردیم. در این سیستم، دادههای ژنتیکی و تصاویر پزشکی مانند ماموگرافی در اختیار ما قرار نمیگیرد، بلکه مدل ما روی سیستمهای محلی بیمارستانها اجرا میشود و آموزش میبیند.»
نورمحمدی خاطرنشان کرد: «این پروژه که با انگیزه شخصی و پس از مواجهه با بیماری سرطان در خانواده شکل گرفت، اکنون عملیاتی شده است و میتواند بدون نقض حریم خصوصی افراد، احتمال ابتلا به سرطان و گرید بیماری را تشخیص دهد. این نمونهای موفق از کاربرد هوش مصنوعی غیرمتمرکز است که نشان میدهد چگونه میتوان با عبور از موانع انحصار داده، به راهکارهای حیاتی در علوم پزشکی دست یافت.»
انتهای پیام/