برچسب ها - مدل زبانی
استارتاپ چینی دیپسیک ۲ مدل زبانی جدید و متنباز را در دسترس عموم قرار داد که طبق ادعای سازندگان، عملکردی همتراز یا فراتر از سامانههای پیشرفته اوپنایآی و گوگل دارند و این اقدام توانایی چین در عبور از محدودیتهای سختافزاری را نشان میدهد.
کد خبر: ۱۰۱۵۹۴۷ تاریخ انتشار : ۱۴۰۴/۰۹/۱۲
شرکت آنتروپیک جدیدترین و پیشرفتهترین مدل زبانی خود را با نام کلود اوپوس ۴.۵ با تمرکز ویژه بر قابلیتهای برنامهنویسی، عاملهای هوشمند و تحلیلهای عمیق پژوهشی معرفی کرد که طبق مستندات فنی منتشرشده، در آزمونهای مهندسی نرمافزار عملکردی بالاتر از متخصصان انسانی ثبت کرده است.
کد خبر: ۱۰۱۴۳۸۶ تاریخ انتشار : ۱۴۰۴/۰۹/۰۵
عرضه مدل زبانی Kimi K۲ Thinking توسط استارتاپ چینی Moonshot AI، با ادعای عملکرد بهتر نسبت به رقبای آمریکایی در آزمونهای استنتاجی و جستجوی عاملمحور، توجه محافل فناوری را به خود جلب کرده است.
کد خبر: ۱۰۱۴۱۴۴ تاریخ انتشار : ۱۴۰۴/۰۹/۰۴
با افزایش وابستگی کاربران به دستیارهای هوش مصنوعی، کارشناسان هشدار میدهند که این ابزارها بدون شناخت دقیق کاربران کارایی واقعی ندارند. در حالی که (ChatGPT) به یک میلیارد کاربر رسیده، گزارش جدید نشان میدهد تنها زمانی میتوان از هوش مصنوعی بهعنوان شریک فکری استفاده کرد که مسیر کامل زندگی دیجیتال افراد در یک سیستم یکپارچه ذخیره و قابل تحلیل باشد. اکنون هفت ابزار اصلی برای ایجاد چنین حافظهای معرفی شده است.
کد خبر: ۱۰۱۳۱۷۹ تاریخ انتشار : ۱۴۰۴/۰۹/۰۱
شرکت اوپنایآی در واکنش به بازخوردهای کاربران نسبت به مدل GPT-۵، نسخه جدیدی با عنوان GPT-۵.۱ را معرفی و در دسترس کاربران چتجیپیتی قرار داد. این بهروزرسانی شامل دو مدل جدید به نامهای Instant و Thinking است که با هدف افزایش سرعت، بهبود تواناییهای محاورهای و استدلال پیشرفته توسعه یافتهاند.
کد خبر: ۱۰۱۱۶۱۴ تاریخ انتشار : ۱۴۰۴/۰۸/۲۲
شرکت دیپسیک از یک فناوری مبتنی بر هوش مصنوعی به نام DeepSeek-OCR رونمایی کرد که با استفاده از نگاشت نوری دوبعدی، حجم اطلاعات متنی طولانی را به میزان چشمگیری کاهش میدهد. این دستاورد میتواند شیوه پردازش اسناد حجیم توسط مدلهای زبان بزرگ را متحول کند.
کد خبر: ۱۰۰۶۴۵۱ تاریخ انتشار : ۱۴۰۴/۰۸/۰۱
شرکت xAI از جدیدترین مدل هوش مصنوعی خود با نام Grok ۴ Fast رونمایی کرد که با هدف ارائه عملکرد سطح بالا و کاهش هزینهها برای کاربران و توسعهدهندگان طراحی شده است.
کد خبر: ۹۹۹۰۷۱ تاریخ انتشار : ۱۴۰۴/۰۷/۰۱
عضو هیات علمی دانشگاه صنعتی شریف در گفتوگو با آناتک:
مسیر موفقیت هوش مصنوعی بومی از تمرکز بر کاربردهای تخصصی میگذرد
عضو هیات علمی دانشگاه صنعتی شریف با تحلیل فرصتها و تهدیدهای پیش روی ایران در عرصه فناوریهای هوش مصنوعی، تاکید کرد مسیر موفقیت و ایجاد یک زیستبوم پایدار بومی، نه از طریق رقابت مستقیم با غولهای فناوری جهانی، بلکه با تمرکز بر مدلهای متنباز و توسعه کاربردهای تخصصی برای صنایع داخلی میگذرد. به گفته وی، شرکتهای ایرانی باید با پرهیز از تقلید صرف و ایجاد ارزش افزوده واقعی، به نیازهای مشخص سازمانهایی پاسخ دهند که حفظ حریم خصوصی دادهها برایشان یک اولویت استراتژیک است.
کد خبر: ۹۹۶۶۷۰ تاریخ انتشار : ۱۴۰۴/۰۶/۲۴
موج ایرادهای مدل جدید اوپنایآی پس از معرفی رسمی
وقتی GPT-۵ فرق بزرگتر و کوچکتر را هم اشتباه میگیرد
کمتر از ۴۸ ساعت پس از معرفی GPT-۵ که قرار بود قویترین مدل تاریخ اوپنایآی باشد، موجی از نارضایتی و اعتراض در شبکههای اجتماعی به راه افتاد. سم آلتمن، مدیرعامل این شرکت، در یک گفتوگوی آنلاین، نه تنها به ضعفهای مدل جدید اذعان کرد بلکه وعده داد نسخه محبوب GPT-۴o دوباره برای کاربران پلاس برگردد و محدودیتهای استفاده دو برابر شود.
کد خبر: ۹۸۹۹۷۰ تاریخ انتشار : ۱۴۰۴/۰۵/۱۸
شرکت اوپنایآی با معرفی GPT-۵ هوش مصنوعی پیشرفتهتری را در دسترس عموم قرار داد. این مدل با قدرت استدلال بهبودیافته و عملکرد یکپارچه در زمینههایی مانند برنامهنویسی، ریاضیات، نگارش، سلامت و درک بصری، نسل جدیدی از هوش مصنوعیهای عاملمحور را رقم زده است.
کد خبر: ۹۸۹۷۴۰ تاریخ انتشار : ۱۴۰۴/۰۵/۱۷
شرکت اوپنایآی پس از سالها تمرکز بر مدلهای بسته، ۲ مدل زبانی متنباز با قابلیت استدلال پیشرفته را معرفی کرد. این مدلها با نامهای gpt-oss-۱۲۰b و gpt-oss-۲۰b عرضه شده و برای استفاده تجاری رایگان و اجرای محلی بهینه شدهاند.
کد خبر: ۹۸۹۴۱۱ تاریخ انتشار : ۱۴۰۴/۰۵/۱۵
مدلهای زبانی پیشرفته در رقابتهای اخیر المپیاد جهانی ریاضی حتی موفق به کسب مدال برنز نشدند، درحالیکه نخبگان ایرانی دو طلا، سه نقره و یک برنز به دست آوردند.
کد خبر: ۹۸۵۴۰۶ تاریخ انتشار : ۱۴۰۴/۰۴/۲۸
گوگل با انتشار مدلهای زبانی جدید تحت عنوان T۵Gemma، امکان استفاده از معماری رمزگذار-رمزگشا را برای توسعهدهندگان فراهم کرده است؛ این مدلها با تغییر رویکرد نسبت به نسلهای قبلی و ارائه قابلیتهای تازه، در سکو HuggingFace برای استفاده در دسترس قرار گرفتهاند.
کد خبر: ۹۸۴۱۲۰ تاریخ انتشار : ۱۴۰۴/۰۴/۲۲
مسابقه برای گسترش مدلهای زبانی بزرگ (LLMs) فراتر از آستانه میلیونتوکنی، بحثی شدید را در جامعه هوش مصنوعی آغاز کرده است. مدلهایی مانند MiniMax-Text-۰۱ با ظرفیت ۴ میلیون توکن و Gemini ۱.۵ Pro که میتواند تا ۲ میلیون توکن را به طور همزمان پردازش کند، حالا ادعا میکنند که کاربردهای تغییردهنده بازی ارائه میدهند و میتوانند کل پایگاههای کد، قراردادهای حقوقی یا مقالات تحقیقاتی را در یک استنتاج واحد تحلیل کنند.
کد خبر: ۹۶۷۱۹۹ تاریخ انتشار : ۱۴۰۴/۰۱/۲۴
مدلهای زبانی بزرگ (LLM) که در حال حاضر به عنوان یکی از پیشرفتهترین دستاوردهای هوش مصنوعی شناخته میشوند، به رغم قابلیتهای شگفتانگیزشان، حتی برای طراحان و برنامهنویسانشان نیز همچنان رازآلود باقی ماندهاند. برای روشنسازی این موضوع، گرانت ساندرسون، تحلیلگر ویدئویی معروف با نام مستعار ۳Blue۱Brown، در فیلمی کوتاه که به مناسبت نمایشگاهی در موزه تاریخ کامپیوتر کالیفرنیا تهیه شده است، به بررسی نحوه عملکرد این مدلها پرداخته است.
کد خبر: ۹۶۳۴۸۱ تاریخ انتشار : ۱۴۰۳/۱۲/۲۵
کشف انقلابی در هوش مصنوعی
مدلهای زبانی بزرگ بجای دادههای حجیم میتوانند از دادههای با کیفیت استفاده کنند
محققان دانشگاه جیاوتونگ شانگهای به کشفی هیجانانگیز در حوزه هوش مصنوعی دست یافتهاند که میتواند قوانین بازی در توسعه مدلهای زبانی بزرگ (LLMs) را تغییر دهد. بر اساس این تحقیق، مدلهای زبانی بزرگ میتوانند وظایف پیچیده استدلالی را با استفاده از مجموعهای کوچک، اما باکیفیت بالا از دادهها یاد بگیرند و نیازی به دادههای حجیم ندارند.
کد خبر: ۹۵۸۹۸۴ تاریخ انتشار : ۱۴۰۳/۱۱/۳۰
در دنیای امروز، حجم عظیمی از دادهها هر لحظه تولید میشود که به آنها بیگ دیتا (Big Data) میگویند. این دادهها به تنهایی کاربردی ندارند و نیاز به یک ذهن هوشمند دارند که بتواند آنها را تحلیل کند و از آنها استفاده کند. اینجاست که هوشمصنوعی وارد صحنه میشود.
کد خبر: ۹۵۸۳۷۰ تاریخ انتشار : ۱۴۰۳/۱۱/۲۸
امروزه هوش مصنوعی (AI) به اندازهای پیشرفت کرده که میتواند مثل انسان حرف بزند، سؤالات را جواب دهد و حتی شعر یا داستان بنویسد. مسئله اینجاست که هوشمصنوعی چگونه میتواند زبان انسانی را درک کرده و صحبت کند؟ هوش مصنوعی با استفاده از دادههای عظیم و الگوریتمهای پیشرفته یاد گرفته است که مثل انسانها حرف بزند و متون را درک کند، اما این عمل را با کمک دو مدل زبانی مهم انجام میدهد، BERT برای درک کردن و GPT برای نوشتن است. این موفقیت نتیجه سالها تحقیق و توسعه توسط دو غول فناوری، گوگل و OpenAI، است که هر کدام با رویکردی منحصربهفرد به این حوزه پرداختهاند.
کد خبر: ۹۵۸۱۷۰ تاریخ انتشار : ۱۴۰۳/۱۱/۲۷
متا یک مدل هوش مصنوعی جدید منتشر کرده است که میتواند کار سایر مدلهای هوش مصنوعی را بررسی کند.
کد خبر: ۹۳۶۵۳۷ تاریخ انتشار : ۱۴۰۳/۰۷/۲۸
به گفته کارشناسان، چین در حوزه مدلهای بزرگ زبانی (LLMs) حدود یک سال از ایالات متحده عقبتر است.
کد خبر: ۹۳۳۶۹۷ تاریخ انتشار : ۱۴۰۳/۰۷/۰۸
موضوعات داغ