دیده بان پیشرفت علم، فناوری و نوآوری

یادگیری ماشینی با سرعت انسانی به کمک الگوریتم جدید

دانشمندان موفق به ساخت نرم‌افزاری شدند که به کمک یک الگوریتم جدید قادر به یادگیری با سرعت انسانی است.
کد خبر : 63590

به گزارش گروه علم و فناوری آنا به نقل از GizMag، پیشرفت و موفقیت هوش مصنوعی در دانشگاه‌های نیویورک، تورنتو و MIT نمایانگر توانایی قابل توجه هوش مصنوعی در زمینه یادگیری مفاهیم بصری در یک عکس و دستکاری کردن آنها مشابه روشهای انسانی است. این پیشرفت می‌تواند منجر به ساخت تلفن‌های هوشمندتر از نمونه‌های فعلی و کامپیوترهایی شود که درک بهتری از دنیای اطراف خود دارند.


تاثیر شوباک


نسل انسان توانایی قابل توجهی در یادگیری اشیای در حال حرکت نشان می‌دهد. برای مثال کودکان، تنها کافی است نمونه‌ای از یک شی جدید مانند سگ یا اتوبوس مدرسه را به آنها، قبل از این که خود قادر به تشخیص دیگر نمونه‌ها باشند، نشان دهید. محققان باور دارند یکی دیگر از دلایل سرعت ما این است که معمولا درک بهتری از مفاهیم جدید در شرایطی داریم که بخش‌های آشنا در کنار یکدیگر در قالب یک سیستم کل کار می‌کنند. وقتی برای اولین بار یک سگ‌وی (رانک یا دوچرخه الکتریکی) دیدیم، سریعا چرخ‌ها و یک دسته را شناسایی کردیم و با نتیجه گیری تا حدی به این اطمینان رسیدیم که این وسیله برای حمل و نقل شخصی مورد استفاده قرار می‌گیرد.


وقتی صحبت از زبان به میان می‌آید، دیدگاه عملی مشابه‌ای از واقعیت در این باره نیز صدق می‌کند. وقتی که می‌بینیم مشخصه‌هایی روی کاغذ نوشته شده است، حتی اگر زبان‌های ناآشنا باشند، فقط جوهر روی کاغذ را نمی‌بینیم بلکه مجموعه‌ای از حرکات قلم را می‌بینیم که این مشخصه‌ها را کشیده است.


حتی خودمان می‌توانیم مشخصه‌های روی کاغذ را بار دیگر رسم کنیم و وقتی به یک اصطلاح ناآشنا می‌رسیم، مانند نام شوباک، حتی با


مطابق آخرین پیشرفت‌های علمی اکثر الگوریتم‌های «یادگیری ژرف» روی تشخیص الگو متمرکز هستند که با این شرایط تنها پس از تمرین دقیق روی هزاران نمونه قادر به اجرا هستند. حتی پس از آن هم، این نرم افزار تنها قادر به درک اشیا در روش انفعالی است که در این روش به جای استفاده از مفاهیم در جهت ساخت چیزی جدید از الگویی از عناصر تصویری بهره گرفته می‌شود

وجود اینکه درکی از معنای آن نداریم ولی قادر به تکرار آن هستیم چراکه ما قادر به تجزیه صداها بر حسب حرکات عضلاتی هستیم که آنها را تولید می‌کنند.


متاسفانه، ترجمه و انتقال این توانایی‌های قابل توجه یادگیری یک طرفه به قلمرو هوش مصنوعی وظیفه بسیار سخت و دشواری است. مطابق آخرین پیشرفت‌های علمی اکثر الگوریتم‌های «یادگیری ژرف» روی تشخیص الگو متمرکز هستند که با این شرایط تنها پس از تمرین دقیق روی هزاران نمونه قادر به اجرا هستند. حتی پس از آن هم، این نرم افزار تنها قادر به درک اشیا در روش انفعالی است که در این روش به جای استفاده از مفاهیم در جهت ساخت چیزی جدید از الگویی از عناصر تصویری بهره گرفته می‌شود.


هوش مصنوعی و تمامی زمینه‌هایش تنها چند دهه عمر دارند اما موضوع ریشه یادگیری انسانی مسئله‌ای است که برای هزاران سال فلاسفه را متحیر ساخته است. این مشکل استنتاج استقرایی است. چگونه مغز انسان با فراگیری مفاهیم از تعداد محدودی از نمونه‌ها قادر است به طور موثری مفاهیم انتزاعی را تعمیم دهد؟


امیدی جدید


در حال حاضر گروهی از محققین شامل جاشوا تننبام، برندن لیک و راشن سالاخوتدینو گام مهمی در جایگزین کردن این نوع یادگیری یک طرف در دنیای کامپیوتر برداشته‌اند. سامانه احتمال گرایی این گروه که نام آن را برنامه یادگیری بیزین (BPL) گذاشته‌اند، نوید پیمودن گام مهمی را در زمینه‌هایی مانند شناسایی صدا و ترکیب، شناسایی تصویر و پردازش طبیعی زبان را داده است. اما به طور کلی، پیشرفت آنها می‌تواند منجر به ساخت کامپیوترهایی شود که درک بهتری از دنیای اطرافشان دارند و با افزایش چیزهایی که یاد می‌گیرند، به طور تصاعدی قادر به انجام وظایف پیچیده‌تر شوند.


این نرم‌افزار بر اساس اصول سه‌گانه همنهشی (ساخت نمونه‌های انتزاعی از بخش‌های ابتدایی)، علیت (استفاده از بخش‌های ابتدایی برای خلق ساختارهای پیچیده) و آموزش یادگیری (اصلی که می‌گوید دانش مفاهیم پیشین می‌تواند باعث آسان‌تر شدن یادگیری مفاهیم جدید شود) ساخته شده است.


در سطح عملی، تکنیک احتمال گرایی منطق بیزین در مرکز الگوریتم قرار دارد و از آن، بر اساس اطلاعات محدود درباره اینکه کدام بخش‌های ساده قادر به تشکیل شی پیچیده‌تر بصری هستند، برای رسیدن به نتیجه استفاده می‌شود.


لیک می‌گوید: «کار ما بر اساس در نظر گرفتن مدل‌های ذهنی انسان همراه با انواع ساده برنامه‌های کامپیوتری است که گمان می‌کنیم ذهنمان می‌سازد و دستکاری می‌کند. برای اولین بار اینگونه فکر می‌کنیم که سیستم ماشینی در اختیار داریم که می‌تواند بخش بزرگی از مفاهیم تصویری را از روش‌هایی بیاموزد که تشخیص آن از نوع انسانی بسیار سخت است».


نرم‌افزار این گروه با 1600 مشخصه و علامت ناآشنا از زبان‌های سراسر دنیا، چه از نوع واقعی و چه از نوع تخیلی، مورد آزمایش قرار گرفت. به عنوان نقطه شروع، ورژنی از یک مشخصه به نرم‌افزار داده شده که الگوریتم موفق به شناسایی آن در میان تمامی علامت‌های دیگر شد. همچنین با تجزیه کردن یک سری حرکت قلم، موفق به کشیدن دوباره آن تنها با چند تفاوت کوچک شد البته مشخصه هنوز به چشم انسان قابل تشخیص بود.



این روش منحصر به‌فرد در تجزیه یک تصویر پیچیده و تلاش برای درک چگونگی کارکرد بخش‌ها در کنار هم به نرم‌افزار اجازه می‌دهد تا وظایف خلاقانه انجام دهد که بر اساس الگوی شناسایی بدون چون و چرا متعلق به الگوریتم هستند. برای مثال، این نرم‌افزار در هنگام مواجه با یک حرف الفبای ناآشنا خصوصیات کلی را از حرکاتی که یک مشخصه را می‌سازد، استخراج می‌کند و قادر به تولید مشخصه‌ای جدید شامل آن دسته از خصوصیات می‌شود.


نرم‌افزار چنان کار فوق‌العاده‌ای با این وظایف خلاقانه سخت انجام داد که عملکرد آن عملا غیرقابل تشخیص از عملکرد یک انسان است که حتی توسط آزمون تورینگ نیز تصدیق شد. در این آزمایش، 147 قاضی در 49 امتحان حضور یافتند که در هر کدام از آنها مجموعه‌ای از نمادهای الفبایی برای نرم‌افزار به نمایش درآمد. هر کدام از این نمادهای الفبایی همراه با دو مشخصه اضافه الهام گرفته شده از آنها، که یکی توسط انسان اختراع شده و دیگری توسط ماشین، بود. در مجموع، قضات قادر به شناسایی 52 درصد از مشخصات تولید شده توسط کامپیوتر بودند که بهتر از نتیجه تصادفی 50-50 نیست.


آزمون تورینگ روشی برای سنجش میزان هوشمندی ماشین است. آزمون به این صورت انجام می‌گیرد که یک شخص به عنوان قاضی، با یک ماشین و یک انسان به گفتگو می‌نشیند، و سعی در تشخیص ماشین از انسان دارد.


ترفندهای ذهنی


لیک می‌گوید: «در حال حاضر این الگوریتم تنها روی مشخصه‌های دست نویس کار می‌کند اما معتقدیم رویکرد گسترده‌تر بر اساس برنامه


یکی از راه‌هایی که می‌تواند باعث بهبودسازی شناسایی گفتاری شود، می‌تواند از طریق انتخاب دستیارهای شخصی گوشی‌های هوشمند باشد. درست مانند دستکاری یک مشخصه ناآشنا، می‌توان نرم‌افزار را برای «خواندن ذهن کاربر» ساخت و بر اساس آنچه فرض گرفته می‌شود که حرکات دهان کاربر در هنگام تولید صدا بوده است، یک کلمه ناآشنا نوشته می‌شود

احتمال گرایی استنتاجی می‌تواند منجر به پیشرفت در شناسایی گفتاری و شناسایی اشیا شود».


یکی از راه‌هایی که می‌تواند باعث بهبودسازی شناسایی گفتاری شود، می‌تواند از طریق انتخاب دستیارهای شخصی گوشی‌های هوشمند باشد. درست مانند دستکاری یک مشخصه ناآشنا، می‌توان نرم‌افزار را برای «خواندن ذهن کاربر» ساخت و بر اساس آنچه فرض گرفته می‌شود که حرکات دهان کاربر در هنگام تولید صدا بوده است، یک کلمه ناآشنا نوشته می‌شود. سپس حتی می‌تواند پیشرفت کرده و کلمه جدید را طوطی‌وارانه از کاربر تقلید کند و خواستار یک تعریف از آن شود. پس از آن نرم‌افزار قادر خواهد بود کلمه جدید را به دایره لغات خود اضافه کرده و در آینده به صورت صحیح و مطابق با پیش زمینه بحث از آن استفاده کند.


از دیگر وظایف احتمالی می‌توان تشخیص سبک یک نقاشی از مجموع بخش‌های آن، حدس کارکردهای یک شیء ناآشنا از اجزای آن و دستیابی به درک بهتر از طبیعت زبان انسان را نام برد. طبق پژوهش جدید، در حالی که سرعت و پیچیدگی یک مغز مصنوعی موظف است عاملی در دستیابی به پیچیدگی بالای افکار باشد بنابراین یک الگوریتم یادگیری مناسب می‌تواند به همان اندازه در دستیابی به هوشی در سطح انسان که قادر به استخراج و دستکاری اطلاعات مفید از هر مقدار اطلاعات محدود است، حساس و مهم باشد.


با این حال محققان هشدار دادند که عملکرد این فناوری تا حدی زیادی به دقت در انتخاب بخش‌های ابتدایی بستگی دارد که شامل حرکات قلم، واج و غیره می‌شود. در واقع بخش‌های ابتدایی جایی است که ایده‌های بسیار پیچیده‌تر در یک دامنه معین خلق می‌شوند.


گزارش: هانا حیدری


انتهای پیام/

ارسال نظر
قالیشویی ادیب