هوشمصنوعی آنتروپیک به ماوس و کیبورد شما دسترسی پیدا کرد
دسترسی به این مدل هماکنون برای تمامی کاربران طرحهای رایگان و تجاری فعال شده است. آنتروپیک در این بهروزرسانی با حفظ نرخ ۳ دلار برای هر میلیون توکن ورودی و ۱۵ دلار برای خروجی، مدلی را عرضه کرده که طبق دادههای فنی، شکاف میان ابزارهای هوشمند و کاربران متخصص را به حداقل میرساند. سونت ۴.۶ نهتنها در پردازش متن و کد، بلکه در درک و اجرای فرآیندهای چندمرحلهای اداری و تحلیلهای مالی، سطحی از توانمندی را ارائه میدهد که پیش از این تنها در مدلهای گرانقیمت سری اوپوس قابل مشاهده بود.
پایان عصر کدهای تکراری و خطاهای سیستمی
توسعهدهندگان نرمافزار که در فاز آزمایشی با سونت ۴.۶ کار کردهاند، گزارش دادهاند که این مدل درک عمیقتری از منطق برنامهنویسی پیدا کرده است. برخلاف نسخههای قبل که گاهی در جلسات طولانی کدنویسی دچار افت عملکرد یا تکرار بیهوده کدها میشدند، نسخه جدید با خوانش دقیق بستر پروژه، منطقهای مشترک را شناسایی و ادغام میکند.
آمارها نشان میدهد کاربران در ۷۰ درصد از موارد، خروجی سونت ۴.۶ را به نسخه ۴.۵ ترجیح دادهاند. نکته قابل تأمل این است که حتی در مقایسه با مدل قدرتمند «اوپوس ۴.۵» که آبان عرضه شد، سونت ۴.۶ به دلیل کاهش چشمگیر تنبلی مدل، پیروی دقیقتر از دستورالعملها و کاهش توهمات، توانسته نظر ۵۹ درصد کاربران را جلب کند. این بهبودها بهویژه در پروژههایی که نیازمند اصلاح کدهای قدیمی و یا پیادهسازی معماریهای پیچیده فرانتاند هستند، نمود بیشتری دارد.
تعامل انسانگونه با سیستمعامل
برجستهترین ویژگی فنی سونت ۴.۶، جهش در قابلیت استفاده از رایانه است. بسیاری از سازمانها همچنان وابسته به نرمافزارهای تخصصی قدیمی هستند که فاقد API برای اتصال به هوش مصنوعیاند. سونت ۴.۶ این مانع را با روشی متفاوت برطرف کرده است؛ این مدل محیط دسکتاپ را میبیند و همانند یک کاربر انسانی، با حرکت دادن نشانگر ماوس، کلیک کردن و تایپ در فیلدهای مختلف، با نرمافزار تعامل میکند.
نتایج بنچمارک استاندارد OSWorld که وظایف واقعی در محیطهایی نظیر مرورگر کروم، لیبرآفیس و ویژوال استودیو کد را شبیهسازی میکند، نشاندهنده پیشرفت محسوس این مدل طی ۱۶ ماه گذشته است. کاربران اکنون میتوانند فرآیندهای پیچیدهای مانند استخراج داده از یک فایل اکسل حجیم، ورود اطلاعات به یک سامانه تحت وب چندمرحلهای و مدیریت همزمان چندین تب مرورگر را به این هوش مصنوعی واگذار کنند. اگرچه آنتروپیک اعلام کرده که سرعت و دقت مدل هنوز با ماهرترین کاربران انسانی فاصله دارد، اما برای انجام خودکار وظایف اداری و تکراری به سطح قابل قبولی از پایداری رسیده است.
استراتژی اقتصادی و ایمنی تضمینشده
قدرت استدلال سونت ۴.۶ فراتر از کدنویسی است و در شبیهسازیهای استراتژیک نیز خود را نشان داده است. در آزمون Vending-Bench Arena که هوش مصنوعی باید مدیریت یک کسبوکار را در طول زمان بر عهده بگیرد، سونت ۴.۶ رفتاری متفاوت از رقبا بروز داد. این مدل در ۱۰ ماه ابتدایی شبیهسازی، به جای تمرکز بر سود کوتاه مدت، سرمایه را صرف افزایش ظرفیت تولید کرد و سپس با تغییر استراتژی در ماههای پایانی، توانست به سودآوری نهایی بالاتری نسبت به سایر مدلها دست یابد. این رفتار نشاندهنده درک مدل از برنامهریزی بلندمدت و مدیریت منابع است.
پژوهشگران ایمنی نیز تأیید کردهاند که با وجود افزایش تواناییها، سونت ۴.۶ در برابر حملات سایبری از جمله تزریق پرامپت مقاومتر شده است. این موضوع برای مدلی که توانایی کنترل رایانه را دارد حیاتی است، زیرا احتمال دارد مهاجمان دستورات مخرب را در لایههای پنهان وبسایتها قرار دهند تا کنترل سیستم کاربر را در دست بگیرند. ارزیابیها حاکی از آن است که لایههای دفاعی این مدل نسبت به نسل قبل تقویت شده و ریسکهای امنیتی را به حداقل رسانده است.
دسترسی فراگیر و ابزارهای نوین مالی
کاربران حوزه مالی و اداری نیز در این بهروزرسانی ابزارهای جدیدی دریافت کردهاند. افزونه اکسل کلود اکنون از پروتکل MCP پشتیبانی میکند که امکان اتصال مستقیم به پایگاههای داده معتبر مانند S&P Global ،Moody’s و FactSet را بدون خروج از محیط اکسل فراهم میسازد. این قابلیت به تحلیلگران اجازه میدهد دادههای خارجی را مستقیماً وارد محاسبات خود کنند.
پلتفرم توسعهدهندگان آنتروپیک نیز قابلیتهایی نظیر فشردهسازی محتوا را در اختیار برنامهنویسان قرار داده است که با خلاصهسازی خودکار بخشهای قدیمی مکالمه، حافظه موثر مدل را افزایش میدهد. هماکنون سونت ۴.۶ در تمامی پلتفرمهای کلود و همچنین API برای توسعهدهندگان در دسترس است و جایگزین مدلهای قبلی شده است.
انتهای پیام/