مدلهای زبانی پایش انبوه شهروندان را با کمترین هزینه ممکن کردند
واسطههای اطلاعاتی سوابق جستوجوهای اینترنتی، تراکنشهای مالی و موقعیتهای مکانی کاربران را جمعآوری کرده و در اختیار خریداران دولتی و تجاری قرار میدهند. پیش از این، اتصال بخشهای پراکنده دادهها نیازمند زمان و نیروی انسانی فراوان بود، اما مدلهای زبانی اکنون نقش تحلیلگران اطلاعاتی را بر عهده گرفتهاند. کاهش چشمگیر زمان و هزینه پردازش اطلاعات موجب شده است تا امکان پایش افراد عادی نیز در کنار اهداف مشخص امنیتی فراهم شود.
دور زدن محدودیتهای قانونی
قانون اساسی آمریکا جستجوی دولتی را بدون دلیل مشخص منع میکند و نهادهای پلیسی برای بررسی تلفن همراه شهروندان ملزم به دریافت حکم قضایی هستند. دولت با خرید دادههای انبوه از شرکتهای تجاری، نیاز به طی کردن روند پیچیده قضایی را برطرف میکند. اگرچه مجموعههای فروخته شده معمولاً فاقد نام یا شماره تلفن هستند، ابزارهای پردازش زبان با بررسی الگوهای رفتاری مشخص مانند مسیر روزانه خانه تا محل کار، مالکان واقعی دادهها را به سادگی شناسایی میکنند. سازمانهای اطلاعاتی پیشتر برای اثبات حضور افراد در صحنه جرم از دادههای مکانی استفاده میکردند که بررسی آنها نیازمند لشکری از تحلیلگران انسانی بود؛ وظیفهای که اکنون عوامل هوش مصنوعی با سرعتی بینظیر انجام میدهند.
توقف قراردادهای دفاعی
مذاکرات شرکت آنتروپیک با وزارت دفاع آمریکا پس از آن متوقف شد که مقامات دولتی خواستار استفاده از مدلهای این شرکت برای تحلیل دادههای شهروندان شدند. در پی رد این درخواست از سوی مدیران آنتروپیک، شرکت اوپنایآی ساعاتی بعد قرارداد مشابهی را امضا کرد که البته واکنشهای عمومی، مدیران این شرکت را وادار به تغییر شرایط قرارداد ساخت. این رویدادها در حالی رخ میدهد که مدیرعامل آنتروپیک پیشتر استفاده از هوش مصنوعی برای نظارت انبوه را در دسته جرایم طبقهبندی کرده بود.
آزمایشهای دانشگاهی و اثبات کارایی
محققان دانشگاه نورثایسترن در آزمایشی برای سنجش توانایی مدلهای زبانی در افشای هویت افراد، مجموعهای از مصاحبههای بدون نام را در اختیار یک عامل هوش مصنوعی قرار دادند. سیستم رایانهای موفق شد با تطبیق موضوعات تحقیقاتی و الگوهای متنی، هویت تعدادی از دانشمندان را کشف کند. فرآیند شناسایی برای هر فرد تنها چهار دقیقه زمان برد و هزینهای کمتر از ۰.۵ دلار در پی داشت. سیستمهای مشابه همچنین قادرند حسابهای کاربری ناشناس در انجمنها را به نمایههای لینکدین متصل کنند و ضمن تشخیص زبان مادری نویسندگان، مشخصات روانی، سطح درآمد و جنسیت کاربران را نیز استخراج نمایند.
تجمیع دادهها و پیامدهای بینالمللی
آغاز پروژه وزارت بهرهوری دولتی آمریکا برای متمرکزسازی دادههای پراکنده سازمانهایی مانند اداره مالیات و مراکز خدمات درمانی، مسیر نظارت را هموارتر کرده است. ترکیب این دادههای متمرکز با ابزارهای پیشرفته هوش مصنوعی، تشکیل پروندههای جامع برای تکتک شهروندان را به شدت تسهیل میکند. دولتهای دیگر نیز رویکردهای مشابهی را دنبال میکنند؛ مقامات چین از مدلهای زبانی برای بررسی پستهای اینترنتی و ردیابی اقلیتهای قومی از طریق دادههای نظارتی بهره میبرند.
شرکتهای تجاری نیز با خرید این مجموعههای داده و استفاده از ابزارهای هوش مصنوعی، سوابق پنهان متقاضیان کار را بررسی میکنند و نهادهای بیمهگر قابلیت ارزیابی دقیق وضعیت مشتریان خود را به دست میآورند. پنهان ماندن در فضای مجازی در چنین شرایطی نیازمند تلاشی مضاعف است، زیرا سیستمهای جدید اصطکاک و موانع سنتی استخراج اطلاعات را به طور کامل از بین بردهاند تا پروندهسازی برای میلیونها نفر تنها با چند دستور متنی ساده امکانپذیر شود.
انتهای پیام/