آمار مقالات تولیدشده با هوش مصنوعی از محتوای انسانی فراتر رفته است
بر اساس یک پژوهش که بر روی دادههای عمومی وب انجام شده، در آبانماه ۱۴۰۳، تعداد مقالاتی که توسط سیستمهای هوش مصنوعی مانند چتجیپیتی، کلود و جمنای تولید و منتشر شدهاند، از تعداد مقالات نوشتهشده توسط نویسندگان انسانی فراتر رفته است. این رویداد دو سال پس از عرضه عمومی چتجیپیتی در آبان ۱۴۰۱ ثبت شده است؛ ابزاری که استفاده از هوش مصنوعی برای تولید محتوای متنی را به شکل گستردهای فراگیر کرد.
این مطالعه نشان میدهد که تنها یک سال پس از معرفی چتجیپیتی، حدود ۳۹ درصد از کل مقالات منتشرشده در اینترنت توسط هوش مصنوعی تولید میشد. با این حال، تحلیل دادهها از اواسط ۱۴۰۲ تا اواسط ۱۴۰۳ نشانگر تغییر این روند است. بر اساس این تحلیل، شتاب رشد استفاده از این ابزارها متوقف شده و نسبت مقالات تولیدشده با هوش مصنوعی در این دوره به یک ثبات نسبی رسیده است.

پژوهشگران این فرضیه را مطرح میکنند که یکی از دلایل احتمالی این توقف، عملکرد ضعیفتر این مقالات در جذب ترافیک از موتورهای جستوجو است. یافتههای یک مطالعه دیگر نیز نشان میدهد که محتوای تولیدشده با هوش مصنوعی، اغلب در نتایج اصلی جستجوی گوگل و پاسخهای تولیدی چتجیپیتی ظاهر نمیشود. این موضوع میتواند به دلیل توانایی الگوریتمهای موتورهای جستوجو در شناسایی و رتبهبندی متفاوت این نوع محتوا باشد.
جزئیات روش تحقیق
برای انجام این پژوهش، از یک الگوریتم تشخیص محتوای هوش مصنوعی استفاده شد. دقت این الگوریتم از طریق دو آزمون ارزیابی گردید. در آزمون نخست، برای سنجش نرخ مثبت کاذب برای تشخیص اشتباه محتوای انسانی به عنوان ماشینی، الگوریتم بر روی مقالات منتشرشده پیش از عرضه چتجیپیتی اجرا شد و نرخ خطای ۴.۲ درصدی را ثبت کرد. در آزمون دوم، برای ارزیابی نرخ منفی کاذب برای تشخیص اشتباه محتوای ماشینی به عنوان انسانی، الگوریتم توانست ۹۹.۴ درصد از مقالات تولیدشده توسط مدل GPT-۴o را به درستی شناسایی کند.
سپس، پژوهشگران به سراغ یک پایگاه داده عظیم به نام CommonCrawl رفتند که مانند یک آرشیو بزرگ از صفحات اینترنت عمل میکند. از این بایگانی، آنها یک نمونه تصادفی شامل ۶۵ هزار مقاله انگلیسیزبان را که بین دیماه ۱۳۹۸ تا اردیبهشت ۱۴۰۴ منتشر شده بودند، انتخاب کردند. در مرحله نهایی، الگوریتم تشخیص بر روی تکتک این ۶۵ هزار مقاله اجرا شد و اگر بیش از نیمی از محتوای یک مقاله را ماشینی تشخیص میداد، آن مقاله در دسته «تولیدشده با هوش مصنوعی» طبقهبندی میشد. گفتنی است این پژوهش، مقالاتی را که توسط هوش مصنوعی تولید و سپس توسط انسان ویرایش شدهاند، ارزیابی نکرده است.
انتهای پیام/


