آمار مقالات تولیدشده با هوش مصنوعی از محتوای انسانی فراتر رفته است

نتایج یک مطالعه جدید نشان می‌دهد حجم مقالات تولیدشده توسط هوش مصنوعی در فضای وب، برای نخستین بار از مقالات نوشته‌شده توسط انسان بیشتر شده است. این در حالی است که داده‌ها حاکی از توقف روند رشد پرشتاب این نوع محتوا از اواسط سال ۱۴۰۳ دارد.

نویسنده : اشکان حاسبی

کد خبر : 1007316

اشتراک گذاری

بر اساس یک پژوهش که بر روی داده‌های عمومی وب انجام شده، در آبان‌ماه ۱۴۰۳، تعداد مقالاتی که توسط سیستم‌های هوش مصنوعی مانند چت‌جی‌پی‌تی، کلود و جمنای تولید و منتشر شده‌اند، از تعداد مقالات نوشته‌شده توسط نویسندگان انسانی فراتر رفته است. این رویداد دو سال پس از عرضه عمومی چت‌جی‌پی‌تی در آبان ۱۴۰۱ ثبت شده است؛ ابزاری که استفاده از هوش مصنوعی برای تولید محتوای متنی را به شکل گسترده‌ای فراگیر کرد.

این مطالعه نشان می‌دهد که تنها یک سال پس از معرفی چت‌جی‌پی‌تی، حدود ۳۹ درصد از کل مقالات منتشرشده در اینترنت توسط هوش مصنوعی تولید می‌شد. با این حال، تحلیل داده‌ها از اواسط ۱۴۰۲ تا اواسط ۱۴۰۳ نشانگر تغییر این روند است. بر اساس این تحلیل، شتاب رشد استفاده از این ابزار‌ها متوقف شده و نسبت مقالات تولیدشده با هوش مصنوعی در این دوره به یک ثبات نسبی رسیده است.

آمار مقالات تولیدشده با هوش مصنوعی از محتوای انسانی فراتر رفت

پژوهشگران این فرضیه را مطرح می‌کنند که یکی از دلایل احتمالی این توقف، عملکرد ضعیف‌تر این مقالات در جذب ترافیک از موتور‌های جست‌و‌جو است. یافته‌های یک مطالعه دیگر نیز نشان می‌دهد که محتوای تولیدشده با هوش مصنوعی، اغلب در نتایج اصلی جستجوی گوگل و پاسخ‌های تولیدی چت‌جی‌پی‌تی ظاهر نمی‌شود. این موضوع می‌تواند به دلیل توانایی الگوریتم‌های موتور‌های جست‌و‌جو در شناسایی و رتبه‌بندی متفاوت این نوع محتوا باشد.

جزئیات روش تحقیق

برای انجام این پژوهش، از یک الگوریتم تشخیص محتوای هوش مصنوعی استفاده شد. دقت این الگوریتم از طریق دو آزمون ارزیابی گردید. در آزمون نخست، برای سنجش نرخ مثبت کاذب برای تشخیص اشتباه محتوای انسانی به عنوان ماشینی، الگوریتم بر روی مقالات منتشرشده پیش از عرضه چت‌جی‌پی‌تی اجرا شد و نرخ خطای ۴.۲ درصدی را ثبت کرد. در آزمون دوم، برای ارزیابی نرخ منفی کاذب برای تشخیص اشتباه محتوای ماشینی به عنوان انسانی، الگوریتم توانست ۹۹.۴ درصد از مقالات تولیدشده توسط مدل GPT-۴o را به درستی شناسایی کند.

سپس، پژوهشگران به سراغ یک پایگاه داده عظیم به نام CommonCrawl رفتند که مانند یک آرشیو بزرگ از صفحات اینترنت عمل می‌کند. از این بایگانی، آن‌ها یک نمونه تصادفی شامل ۶۵ هزار مقاله انگلیسی‌زبان را که بین دی‌ماه ۱۳۹۸ تا اردیبهشت ۱۴۰۴ منتشر شده بودند، انتخاب کردند. در مرحله نهایی، الگوریتم تشخیص بر روی تک‌تک این ۶۵ هزار مقاله اجرا شد و اگر بیش از نیمی از محتوای یک مقاله را ماشینی تشخیص می‌داد، آن مقاله در دسته «تولیدشده با هوش مصنوعی» طبقه‌بندی می‌شد. گفتنی است این پژوهش، مقالاتی را که توسط هوش مصنوعی تولید و سپس توسط انسان ویرایش شده‌اند، ارزیابی نکرده است.

انتهای پیام/