پشتپردۀ بزرگترین بهرهکشی پنهان از کاربران در تاریخ اینترنت
به گزارش خبرگزاری آنا؛ چالشهای تصویری سادهای که روزانه میلیونها کاربر اینترنت برای ورود به حسابهای کاربری خود با آن مواجه میشوند، فراتر از یک سد امنیتی عمل میکنند. زمانی که کاربر برای اثبات هویت خود، تصاویر حاوی خطکشی عابر پیاده، چراغ راهنمایی یا شیر آتشنشانی را در یک شبکه تصویری انتخاب میکند، در حال انجام یک کار دقیق مهندسی داده است. تحقیقات آماری نشان میدهد که مجموع زمانهای ۳۰ ثانیهای که کاربران جهان طی بیش از ۱۵ سال صرف حل این معماها کردهاند، به رقم خیرهکننده ۸۱۹ میلیون ساعت میرسد. اگر این حجم عظیم از زمان با میانگین دستمزد جهانی (حدود ۷.۴۵ دلار در ساعت) محاسبه شود، ارزش اقتصادی این کار اجباری دیجیتال بالغ بر ۶.۱ میلیارد دلار خواهد بود. این رقم نشاندهنده سودی است که شرکتهای فناوری از طریق تبدیل یک پروتکل امنیتی به یک ابزار تولید ارزش، به دست آوردهاند.
مغز انسان، پردازندهای ارزان برای گوگل
ایده اصلی پشت این فناوری، حاصل تفکر لوئیس فون آن، دانشمند علوم کامپیوتر بود. او دریافت که مسدود کردن رباتهای اسپم، میلیونها ساعت از توان پردازشی مغز انسان را به هدر میدهد. فون آن به این نتیجه رسید که مغز انسان تواناییهای پردازشی خاصی دارد که هنوز کامپیوترها فاقد آن هستند، مانند تشخیص متون کج و معوج یا درک مفاهیم بصری پیچیده در تصاویر بیکیفیت. راهکار او تغییر ماهیت کپچا بود؛ به جای تولید متون تصادفی بیمعنی، سیستم باید مسائلی را به کاربر ارائه میداد که کامپیوترها در حل آن ناتوان بودند، اما برای انسان بدیهی به نظر میرسیدند. بدین ترتیب، هر بار که کاربری یک کپچا را حل میکرد، در واقع بخشی از یک پروژه عظیم محاسباتی را پیش میبرد که هزینه انجام آن با روشهای سنتی سرسامآور بود.
نجات تاریخ با تایپ کلمات ناخوانا
در سال ۲۰۰۷ میلادی، پروژه دیجیتالسازی کتابها و روزنامههای قدیمی با بنبست فنی مواجه شده بود. نرمافزارهای تبدیل عکس به متن در برخورد با روزنامههایی مانند نیویورک تایمز که قدمت برخی شمارههای آن به سال ۱۸۵۱ میرسید، دچار خطا میشدند. لکههای جوهر، کاغذهای زرد شده و فونتهای قدیمی باعث میشد کامپیوتر کلمات را اشتباه تشخیص دهد. گوگل با خرید ریکپچا، نسخه اول این سیستم را برای حل این مشکل به کار گرفت. سیستم به هر کاربر دو کلمه نمایش میداد: کلمه اول کنترلی بود که سیستم جواب آن را میدانست و برای احراز هویت استفاده میشد. کلمه دوم، برشی واقعی از یک روزنامه قدیمی بود که نرمافزار نتوانسته بود آن را بخواند. وقتی کاربر کلمه اول را درست تایپ میکرد، سیستم فرض را بر این میگذاشت که کلمه دوم که ناخوانا بود را نیز درست تشخیص داده است.
مکانیزم اجماع برای تضمین واقعیت
گوگل برای اطمینان از اینکه کاربران کلمات ناخوانا را درست تایپ میکنند و صرفاً دکمهها را فشار نمیدهند، از یک سیستم امتیازدهی دقیق استفاده کرد. هر کلمه جدیدی که توسط سیستم تبدیل عکس به متن غیرقابل خواندن تشخیص داده میشد، به چندین کاربر مختلف در سراسر جهان نمایش داده میشد. حدس اولیه کامپیوتر ارزش نیم امتیاز داشت، اما تشخیص انسان یک امتیاز کامل محسوب میشد. تنها زمانی یک کلمه پذیرفته میشد که مجموع امتیازاتش به ۲.۵ میرسید؛ یعنی حداقل سه انسان مختلف باید آن کلمه را به یک شکل واحد تایپ میکردند. با این روش هوشمندانه، آرشیو عظیم بشری که شامل میلیونها صفحه بود، کلمه به کلمه توسط کسانی بازنویسی شد که فکر میکردند تنها در حال ورود به ایمیل خود هستند.
آموزش رانندگی به خودروها با شناسایی چراغ قرمز
بین سالهای ۲۰۱۴ تا ۲۰۱۷، رباتها هوشمندتر شدند و توانستند متون کج و معوج را بخوانند. همزمان، نیازهای گوگل نیز تغییر کرد. این شرکت سرمایهگذاری سنگینی روی خودروهای خودران، پروژه ویمو و نقشههای گوگل انجام داده بود. خودروهای خودران برای حرکت ایمن در خیابانها نیاز داشتند تا تفاوت میان یک کودک، یک تیر چراغ برق و یک خطکشی عابر پیاده را در کسری از ثانیه تشخیص دهند. برای آموزش این هوش مصنوعی، به میلیاردها تصویر برچسبگذاری شده نیاز بود. گوگل نسخه دوم ریکپچا را معرفی کرد. این بار کاربران با شبکهای از تصاویر روبهرو شدند و دستوراتی مانند «تمام تصاویر دارای دوچرخه را انتخاب کنید» دریافت کردند. هر کلیک صحیح کاربر، مستقیماً به الگوریتمهای بینایی ماشین گوگل میآموخت که دوچرخه در زوایای مختلف، نورهای متفاوت و پشت موانع چگونه به نظر میرسد.
نبرد نابرابر توسعهدهندگان مستقل با غول فناوری
تفاوت قدرت میان گوگل و سایر توسعهدهندگان هوش مصنوعی در دسترسی به این نیروی کار رایگان نهفته است. برای درک بهتر این موضوع، میتوان به پروژه مستقل GAI اشاره کرد که هدفش آموزش هوش مصنوعی برای خواندن نسخ خطی زبان ارمنی کلاسیک (گرابار) بود. توسعهدهنده این پروژه مجبور شد برای جمعآوری دادههای اولیه، از دوستان و خانواده خود بخواهد تا ۱۵ هزار نمونه متن را به صورت دستی بازنویسی و ترجمه کنند. این فرآیند ماهها زمان برد و تنها به دقت ۸۹ درصد رسید. در مقابل، گوگل با در اختیار داشتن زیرساخت کپچا، به میلیونها کاربر در هر لحظه دسترسی دارد که بدون هیچ دستمزدی، پیچیدهترین دادهها را با دقت بالا و در حجم میلیاردی برچسبگذاری میکنند. این انحصار در داده، سدی بزرگ برای رقبای کوچک ایجاد کرده است.
لرزش دست شما سند انسان بودن است
با پیشرفت بیشتر رباتهای تصویری، گوگل روش خود را به تحلیل رفتاری تغییر داد که در نسخه سوم ریکپچا دیده میشود. در این نسخه که معمولاً با یک تیک ساده «من ربات نیستم» همراه است، سیستم دیگر نیازی به حل پازل ندارد، بلکه نحوه حرکت ماوس کاربر را بررسی میکند. وقتی یک انسان ماوس را حرکت میدهد، مسیر حرکت هرگز یک خط صاف ریاضی نیست. دست انسان دارای لرزشهای خفیف میکروسکوپی است که ناشی از نویز سیستم عصبی و انقباضات عضلانی ناخودآگاه است. علاوه بر این، سرعت حرکت ماوس توسط انسان در نقاط مختلف صفحه تغییر میکند. این نقصهای انسانی دقیقاً همان چیزی است که هوش مصنوعی گوگل به دنبال آن میگردد.
شکست رباتها در شبیهسازی نقص انسان
رباتها ذاتاً تمایل دارند بهینهترین مسیر را بین دو نقطه طی کنند که معمولاً خطی صاف و بدون لرزش است. حتی رباتهای پیشرفتهای که سعی میکنند با الگوریتمهایی نظیر WindMouse لرزشهای انسانی را تقلید کنند، در برابر تحلیلگرهای گوگل شکست میخورند. سیستم گوگل جریان حرکت ماوس را صدها بار در ثانیه نمونهبرداری میکند و متغیرهایی مانند مکثهای قبل از کلیک، سرعت واکنش به بارگذاری صفحه و حتی نحوه اسکرول کردن را میسنجد. اگر الگوی حرکت بیش از حد تمیز یا مصنوعی باشد، سیستم به کاربر مشکوک میشود. در واقع، گوگل توانسته است بیولوژیکیترین ویژگیهای حرکتی انسان را به یک امضای دیجیتال برای احراز هویت تبدیل کند. این تحول نشان میدهد که چگونه تعاملات روزمره ما، بدون آنکه بدانیم، سوخت اصلی موتورهای هوش مصنوعی را تأمین میکنند.
انتهای پیام/