مزارع پردازشی هوش مصنوعی تا پایان سال در اختیار بخش خصوصی قرار میگیرد
محمدهادی زاهدی، رئیس انجمن ملی هوش مصنوعی ایران در حاشیه کنفرانس هوش مصنوعی رویداد ایفتکس در گفتوگو با خبرنگار آناتک، ضمن تشریح وضعیت فعلی زیستبوم فناوری کشور، از سرمایهگذاریهای کلان دولتی برای رفع موانع سختافزاری خبر داد و اعلام کرد که نگرانی استارتاپها بابت زیرساختها با ورود تجهیزات جدید مرتفع خواهد شد. توسعهدهندگان و شرکتهای نوپا در ایران همواره با چالشهای ناشی از تحریمهای بینالمللی و هزینههای سرسامآور تامین واحدهای پردازش گرافیکی مواجه بودهاند که این امر روند توسعه هوش مصنوعی را کند کرده است. راهکارهای جدید حاکمیتی با هدف تغییر این معادله و توانمندسازی بخش خصوصی طراحی شدهاند تا تمرکز از تامین سختافزار به توسعه محصول تغییر یابد.
با وجود تحریمها و هزینه بالای GPU، چه راهکاری برای شرکتهای توسعهدهنده هوش مصنوعی وجود دارد؟
کشورهای پیشرو در حوزه فناوری اطلاعات پس از آزمون و خطاهای بسیار، به الگوی مشخص و کارآمدی برای پیشبرد اهداف هوش مصنوعی دست یافتهاند. بررسی مدلهای جهانی نشان میدهد که در اکوسیستمهای توسعهیافته، ریسک سرمایهگذاری در زیرساختهای سنگین، دیربازده و هزینهبر را دولتها و بخشهای عمومی میپذیرند تا بستر لازم فراهم شود. وظیفه چابکسازی، خلاقیت، تبدیل ایده به محصول نهایی و تجاریسازی بر عهده بخش خصوصی گذاشته میشود. ایران نیز با درک این ضرورت، تصمیم به پیادهسازی همین الگو گرفته است. بر این اساس، شرکتهای استارتاپی و شرکتهای دانشبنیان نباید دغدغه و استرس تامین سرورها و پردازندههای قدرتمند را داشته باشند، بلکه باید تمام تمرکز، سرمایه انسانی و توان مهندسی خود را صرف توسعه نرمافزار، بهینهسازی الگوریتمها و پاسخ به نیازهای واقعی بازار کنند.
شرکتهای خصوصی که تاکنون مجبور بودند بخش قابلتوجهی از سرمایه محدود خود را صرف خرید تجهیزات یا اجاره سرورهای خارجی با هزینههای دلاری کنند، اکنون میتوانند این منابع مالی را به جذب نخبگان، تقویت تیمهای تحقیق و توسعه و بازاریابی اختصاص دهند.
سرمایهگذاریهای متمرکز انجام شده در طول یک سال گذشته، علیرغم فشارهای ناشی از محدودیتهای ارزی و موانع تحریمی، منجر به ایجاد ظرفیتهای پردازشی قابلتوجهی در کشور شده است. معاونت علمی ریاست جمهوری به عنوان بازوی نوآوری، سازمان برنامه و بودجه به عنوان تامینکننده مالی و وزارت ارتباطات و فناوری اطلاعات به عنوان متولی زیرساخت شبکه، با همکاری یکدیگر و در قالب یک تصمیم حاکمیتی واحد، اقدام به راهاندازی مزارع پردازشی کردهاند. احتمالا تا بهمنماه سال جاری، دسترسی به این مزارع برای دانشگاهها جهت امور پژوهشی، پژوهشگاهها برای توسعه لبه دانش و بخش خصوصی برای تجاریسازی محصولات فراهم خواهد شد. این اقدام نقطه عطفی در شتابدهی به پروژههای هوش مصنوعی کشور محسوب میشود و هزینه ورود به این صنعت را برای تیمهای جوان و خلاق به شدت کاهش میدهد.
تغییر پارادایم از مالکیت زیرساخت به استفاده از زیرساخت اشتراکی، مدلی است که شرکتهای فناوری دنیا نیز آن را تجربه کردهاند و اکنون به عنوان راهکاری عملیاتی برای برونرفت از بنبستهای سختافزاری در ایران اجرا میشود. این رویکرد، ریسک شکست استارتاپها را کاهش داده و امکان آزمایش ایدههای نوآورانه را بدون نیاز به سرمایه اولیه کلان فراهم میکند.
اگر هوش مصنوعی محتوای نامناسب یا غیراخلاقی را آموزش ببیند، چه تبعاتی خواهد داشت؟
ماهیت یادگیرنده سیستمهای هوش مصنوعی که بخش عمدهای از دانش خود را بر پایه دادههای حجیم موجود در اینترنت کسب میکنند، چالشهایی جدی در خصوص بازتولید محتوای نامناسب ایجاد کرده است. هوش مصنوعی شبیه به کودکی است که در بستر جامعه در حال تربیت است؛ خروجی و رفتار نهایی این سیستمها مستقیماً به کیفیت دادههای ورودی و نحوه نظارت بر فرآیند یادگیری بستگی دارد. همانطور که یک کودک در محیط اجتماع ممکن است با ناهنجاریهای رفتاری یا محتوای غیراخلاقی مواجه شود و تاثیر بپذیرد، هوش مصنوعی نیز در فضای وب با انبوهی از دادههای آلوده و مسموم روبهرو میشود. اگر دادههای ورودی کنترل نشوند، خروجی سیستم میتواند بازتابدهنده همان ناهنجاریها باشد.
معماری الگوریتمها در نسل جدید هوش مصنوعی باید به گونهای طراحی شود که صرفاً مصرفکننده داده نباشند، بلکه قابلیت تشخیص، غربالگری و پالایش خودکار را داشته باشند. هدف نهایی در جامعه متخصصین، گذر از هوش مصنوعی صرفاً هوشمند به سمت هوش مصنوعی اخلاقمدار است. سیستمهای نوین باید به سطحی از درک معنایی برسند که قادر باشند اخبار جعلی، محتوای دارای سوگیری سیاسی یا نژادی، و دادههایی را که حریم خصوصی افراد را نقض کردهاند، شناسایی کرده و به صورت خودکار از چرخه یادگیری خود حذف کنند. این فرآیند مشابه تربیت انسانی است که یاد میگیرد از رفتارهای ناپسند دوری کند، حتی اگر آنها را در محیط ببیند.
نظارت دقیق توسعهدهندگان بر منابع داده و پیادهسازی فیلترهای هوشمند در لایههای زیرین مدلهای زبانی امری ضروری است تا محصول نهایی با هنجارهای اجتماعی و قوانین کشور سازگاری داشته باشد. تربیت این کودک دیجیتال نیازمند مهندسی دقیق و برنامهریزی شدهای است که در آن تمایز میان داده سالم و ناسالم توسط خودِ ماشین درک و اعمال شود. الگوریتمها باید توانایی تفکیک دادههای قانونی از غیرقانونی را داشته باشند و اطمینان حاصل کنند که حریم خصوصی افراد در طول فرآیند آموزش نقض نمیشود. تنها در این صورت است که میتوان به توسعه پایدار و اعتماد عمومی به فناوریهای نوین امیدوار بود.
چند درصد از مدلهای زبانی داخلی مستقل از نمونههای خارجی هستند؟
وضعیت مدلهای زبانی بزرگ در ایران و میزان وابستگی فنی آنها به نمونههای خارجی، موضوعی است که نیاز به کالبدشکافی دقیق دارد. واقعیت این است که تا کنون هیچ مدل زبانی که پایه و اساس آن کاملاً فارسی باشد و از صفر در داخل کشور توسعه یافته باشد، تولید نشده است. اکثر فعالیتهای انجام شده در کشور تا به امروز، معطوف به استفاده از مدلهای متنباز موجود در دنیا و بومیسازی سطحی یا فاینتیونینگ آنها برای زبان فارسی بوده است. عدم توسعه مدل پایه ریشه در نیاز به پردازشهای سنگین و طولانیمدت و دسترسی به حجم عظیمی از دادههای پالایش شده دارد که تا پیش از تامین زیرساختهای جدید پردازشی، برای بسیاری از شرکتهای داخلی امکانپذیر نبود.
زبان فارسی فقط مجموعهای از واژگان و دستور زبان نیست، بلکه بستری است که هزاران سال فرهنگ، باورها، ضربالمثلها و الگوهای رفتاری ایرانیان را در خود جای داده است. انتقال صرف کلمات به ماشین و ترجمه ماشینی متون، منجر به تولید مدلی کارآمد و دارای درک عمیق نخواهد شد. مدلهای زبانی بومی زمانی ارزشمند و قابل اتکا هستند که بتوانند مفاهیم عمیق فرهنگی و ریشههای فکری مستتر در ادبیات و تاریخ ایران را درک کنند؛ موضوعی که مدلهای توسعهیافته در غرب که با دادههای انگلیسی و فرهنگ غربی آموزش دیدهاند، معمولاً از درک ظرافتهای آن عاجزند.
توسعه واقعی مدلهای هوش مصنوعی بومی نیازمند گذار از مرحله ترجمه به مرحله درک فرهنگی است. توسعهدهندگان ایرانی اکنون با دسترسی قریبالوقوع به زیرساختهای پردازشی جدید، این فرصت تاریخی را خواهند داشت تا به جای تکیه صرف بر مدلهای غربی، به سمت خلق مدلهای پایهای حرکت کنند که زیستبوم فکری، فرهنگی و اجتماعی ایران را در هسته محاسبات خود لحاظ میکنند. این امر مستلزم تعریف پروژههای کلان ملی برای جمعآوری و پالایش دادههای بومی و آموزش مدلهایی است که زبان، منطق و فرهنگ ایرانی را بشناسند. تنها در این شرایط است که میتوان از استقلال فناوری در حوزه هوش مصنوعی سخن گفت.
انتهای پیام/