یادگیری ماشینی با سرعت انسانی به کمک الگوریتم جدید
به گزارش گروه علم و فناوری آنا به نقل از GizMag، پیشرفت و موفقیت هوش مصنوعی در دانشگاههای نیویورک، تورنتو و MIT نمایانگر توانایی قابل توجه هوش مصنوعی در زمینه یادگیری مفاهیم بصری در یک عکس و دستکاری کردن آنها مشابه روشهای انسانی است. این پیشرفت میتواند منجر به ساخت تلفنهای هوشمندتر از نمونههای فعلی و کامپیوترهایی شود که درک بهتری از دنیای اطراف خود دارند.
تاثیر شوباک
نسل انسان توانایی قابل توجهی در یادگیری اشیای در حال حرکت نشان میدهد. برای مثال کودکان، تنها کافی است نمونهای از یک شی جدید مانند سگ یا اتوبوس مدرسه را به آنها، قبل از این که خود قادر به تشخیص دیگر نمونهها باشند، نشان دهید. محققان باور دارند یکی دیگر از دلایل سرعت ما این است که معمولا درک بهتری از مفاهیم جدید در شرایطی داریم که بخشهای آشنا در کنار یکدیگر در قالب یک سیستم کل کار میکنند. وقتی برای اولین بار یک سگوی (رانک یا دوچرخه الکتریکی) دیدیم، سریعا چرخها و یک دسته را شناسایی کردیم و با نتیجه گیری تا حدی به این اطمینان رسیدیم که این وسیله برای حمل و نقل شخصی مورد استفاده قرار میگیرد.
وقتی صحبت از زبان به میان میآید، دیدگاه عملی مشابهای از واقعیت در این باره نیز صدق میکند. وقتی که میبینیم مشخصههایی روی کاغذ نوشته شده است، حتی اگر زبانهای ناآشنا باشند، فقط جوهر روی کاغذ را نمیبینیم بلکه مجموعهای از حرکات قلم را میبینیم که این مشخصهها را کشیده است.
حتی خودمان میتوانیم مشخصههای روی کاغذ را بار دیگر رسم کنیم و وقتی به یک اصطلاح ناآشنا میرسیم، مانند نام شوباک، حتی با
وجود اینکه درکی از معنای آن نداریم ولی قادر به تکرار آن هستیم چراکه ما قادر به تجزیه صداها بر حسب حرکات عضلاتی هستیم که آنها را تولید میکنند.
متاسفانه، ترجمه و انتقال این تواناییهای قابل توجه یادگیری یک طرفه به قلمرو هوش مصنوعی وظیفه بسیار سخت و دشواری است. مطابق آخرین پیشرفتهای علمی اکثر الگوریتمهای «یادگیری ژرف» روی تشخیص الگو متمرکز هستند که با این شرایط تنها پس از تمرین دقیق روی هزاران نمونه قادر به اجرا هستند. حتی پس از آن هم، این نرم افزار تنها قادر به درک اشیا در روش انفعالی است که در این روش به جای استفاده از مفاهیم در جهت ساخت چیزی جدید از الگویی از عناصر تصویری بهره گرفته میشود.
هوش مصنوعی و تمامی زمینههایش تنها چند دهه عمر دارند اما موضوع ریشه یادگیری انسانی مسئلهای است که برای هزاران سال فلاسفه را متحیر ساخته است. این مشکل استنتاج استقرایی است. چگونه مغز انسان با فراگیری مفاهیم از تعداد محدودی از نمونهها قادر است به طور موثری مفاهیم انتزاعی را تعمیم دهد؟
امیدی جدید
در حال حاضر گروهی از محققین شامل جاشوا تننبام، برندن لیک و راشن سالاخوتدینو گام مهمی در جایگزین کردن این نوع یادگیری یک طرف در دنیای کامپیوتر برداشتهاند. سامانه احتمال گرایی این گروه که نام آن را برنامه یادگیری بیزین (BPL) گذاشتهاند، نوید پیمودن گام مهمی را در زمینههایی مانند شناسایی صدا و ترکیب، شناسایی تصویر و پردازش طبیعی زبان را داده است. اما به طور کلی، پیشرفت آنها میتواند منجر به ساخت کامپیوترهایی شود که درک بهتری از دنیای اطرافشان دارند و با افزایش چیزهایی که یاد میگیرند، به طور تصاعدی قادر به انجام وظایف پیچیدهتر شوند.
این نرمافزار بر اساس اصول سهگانه همنهشی (ساخت نمونههای انتزاعی از بخشهای ابتدایی)، علیت (استفاده از بخشهای ابتدایی برای خلق ساختارهای پیچیده) و آموزش یادگیری (اصلی که میگوید دانش مفاهیم پیشین میتواند باعث آسانتر شدن یادگیری مفاهیم جدید شود) ساخته شده است.
در سطح عملی، تکنیک احتمال گرایی منطق بیزین در مرکز الگوریتم قرار دارد و از آن، بر اساس اطلاعات محدود درباره اینکه کدام بخشهای ساده قادر به تشکیل شی پیچیدهتر بصری هستند، برای رسیدن به نتیجه استفاده میشود.
لیک میگوید: «کار ما بر اساس در نظر گرفتن مدلهای ذهنی انسان همراه با انواع ساده برنامههای کامپیوتری است که گمان میکنیم ذهنمان میسازد و دستکاری میکند. برای اولین بار اینگونه فکر میکنیم که سیستم ماشینی در اختیار داریم که میتواند بخش بزرگی از مفاهیم تصویری را از روشهایی بیاموزد که تشخیص آن از نوع انسانی بسیار سخت است».
نرمافزار این گروه با 1600 مشخصه و علامت ناآشنا از زبانهای سراسر دنیا، چه از نوع واقعی و چه از نوع تخیلی، مورد آزمایش قرار گرفت. به عنوان نقطه شروع، ورژنی از یک مشخصه به نرمافزار داده شده که الگوریتم موفق به شناسایی آن در میان تمامی علامتهای دیگر شد. همچنین با تجزیه کردن یک سری حرکت قلم، موفق به کشیدن دوباره آن تنها با چند تفاوت کوچک شد البته مشخصه هنوز به چشم انسان قابل تشخیص بود.
این روش منحصر بهفرد در تجزیه یک تصویر پیچیده و تلاش برای درک چگونگی کارکرد بخشها در کنار هم به نرمافزار اجازه میدهد تا وظایف خلاقانه انجام دهد که بر اساس الگوی شناسایی بدون چون و چرا متعلق به الگوریتم هستند. برای مثال، این نرمافزار در هنگام مواجه با یک حرف الفبای ناآشنا خصوصیات کلی را از حرکاتی که یک مشخصه را میسازد، استخراج میکند و قادر به تولید مشخصهای جدید شامل آن دسته از خصوصیات میشود.
نرمافزار چنان کار فوقالعادهای با این وظایف خلاقانه سخت انجام داد که عملکرد آن عملا غیرقابل تشخیص از عملکرد یک انسان است که حتی توسط آزمون تورینگ نیز تصدیق شد. در این آزمایش، 147 قاضی در 49 امتحان حضور یافتند که در هر کدام از آنها مجموعهای از نمادهای الفبایی برای نرمافزار به نمایش درآمد. هر کدام از این نمادهای الفبایی همراه با دو مشخصه اضافه الهام گرفته شده از آنها، که یکی توسط انسان اختراع شده و دیگری توسط ماشین، بود. در مجموع، قضات قادر به شناسایی 52 درصد از مشخصات تولید شده توسط کامپیوتر بودند که بهتر از نتیجه تصادفی 50-50 نیست.
آزمون تورینگ روشی برای سنجش میزان هوشمندی ماشین است. آزمون به این صورت انجام میگیرد که یک شخص به عنوان قاضی، با یک ماشین و یک انسان به گفتگو مینشیند، و سعی در تشخیص ماشین از انسان دارد.
ترفندهای ذهنی
لیک میگوید: «در حال حاضر این الگوریتم تنها روی مشخصههای دست نویس کار میکند اما معتقدیم رویکرد گستردهتر بر اساس برنامه
احتمال گرایی استنتاجی میتواند منجر به پیشرفت در شناسایی گفتاری و شناسایی اشیا شود».
یکی از راههایی که میتواند باعث بهبودسازی شناسایی گفتاری شود، میتواند از طریق انتخاب دستیارهای شخصی گوشیهای هوشمند باشد. درست مانند دستکاری یک مشخصه ناآشنا، میتوان نرمافزار را برای «خواندن ذهن کاربر» ساخت و بر اساس آنچه فرض گرفته میشود که حرکات دهان کاربر در هنگام تولید صدا بوده است، یک کلمه ناآشنا نوشته میشود. سپس حتی میتواند پیشرفت کرده و کلمه جدید را طوطیوارانه از کاربر تقلید کند و خواستار یک تعریف از آن شود. پس از آن نرمافزار قادر خواهد بود کلمه جدید را به دایره لغات خود اضافه کرده و در آینده به صورت صحیح و مطابق با پیش زمینه بحث از آن استفاده کند.
از دیگر وظایف احتمالی میتوان تشخیص سبک یک نقاشی از مجموع بخشهای آن، حدس کارکردهای یک شیء ناآشنا از اجزای آن و دستیابی به درک بهتر از طبیعت زبان انسان را نام برد. طبق پژوهش جدید، در حالی که سرعت و پیچیدگی یک مغز مصنوعی موظف است عاملی در دستیابی به پیچیدگی بالای افکار باشد بنابراین یک الگوریتم یادگیری مناسب میتواند به همان اندازه در دستیابی به هوشی در سطح انسان که قادر به استخراج و دستکاری اطلاعات مفید از هر مقدار اطلاعات محدود است، حساس و مهم باشد.
با این حال محققان هشدار دادند که عملکرد این فناوری تا حدی زیادی به دقت در انتخاب بخشهای ابتدایی بستگی دارد که شامل حرکات قلم، واج و غیره میشود. در واقع بخشهای ابتدایی جایی است که ایدههای بسیار پیچیدهتر در یک دامنه معین خلق میشوند.
گزارش: هانا حیدری
انتهای پیام/