هوش مصنوعی اسرار متون قدیمی را فاش کرد/ با فناوری هیچ رازی پنهان نمی‌ماند

محققان دانشگاه نوتردام در حال توسعه یک شبکه عصبی مصنوعی برای خواندن دست‌نوشته‌های پیچیده باستانی مبتنی بر قابلیت یادگیری عمیق هستند.

کد خبر : 603100

اشتراک گذاری

به گزارش خبرنگار گروه علم و فناوری خبرگزاری آنا، کتابخانه کلیسای سنت گال در سوئیس دارای ۱۶۰ هزار جلد نسخه خطی ادبی و تاریخی است که به قرن هشتم میلادی باز می‌گردد. تمام این آثار با دست، روی پوست به زبان‌هایی که در دوران معاصر به‌ندرت صحبت می‌شود نوشته شده‌اند.

برای حفظ این روایت‌های مهم تاریخی معمولاً چنین متونی که شمار آنها در اقصی‌نقاط جهان به میلیون‌ها نسخه می‌رسد، در موزه‌ها، کتابخانه‌ها و صومعه‌های سراسر جهان نگهداری می‌شوند. امروزه بخش قابل توجهی از این مجموعه‌ها از طریق تصاویر دیجیتال در دسترس عموم قرار گرفته است.

بیشتر بخوانید:

خواندن کتاب‌های آسیب‌پذیر و بسیار قدیمی بدون نیاز به ورق زدن + ویدئو

بررسی وضعیت کتاب الکترونیک در دنیای امروزی/ مزایا و معایب کتاب‌خوانی به سبک الکترونیک چیست؟

سایت‌هایی وجود دارد که می‌توانید به آن مراجعه کنید، کتاب مورد نظر خود را انتخاب کنید و صفحاتش را ورق بزنید، اما کارشناسان می‌گویند بخش قابل توجهی از مطالب این کتب هرگز خوانده نشده است و به عبارت دیگر گنجینه‌ای از تاریخ جهان در این متون پنهان مانده است.

توسعه یک شبکه عصبی مصنوعی برای حل مسئله

در حال حاضر محققان دانشگاه نوتردام در حال توسعه یک شبکه عصبی مصنوعی مبتنی بر یادگیری عمیق برای خواندن کتب باستانی هستند.

والتر شایرر(Walter Scheirer)، دانشیار دانشکده علوم و مهندسی کامپیوتر در نوتردام می‌گوید: «ما با متون تاریخی سروکار داریم که زبان مورد استفاده از آنها قرن‌هاست منسوخ شده است(یا زبان‌هایی مثل لاتین که به‌ندرت استفاده می‌شوند). ممکن است یافتن تصاویر زیبایی از آنها در فضای وب مقدور باشد اما آنچه ما قصد انجام آن را داریم، این است که هوش مصنوعی درک صفحه را از منظر یک متخصص تقلید کرده و خواندن سریع و قابل جست‌وجو را در متن فراهم کند.»

هوش مصنوعی اسرار متون قدیمی را فاش کرد/ با فناوری هیچ رازی پنهان نمی‌ماند — تعداد زیادی آثار خطی در جهان وجود دارد که هنوز به طور دیجیتالی در نیامده و ترجمه نشده‌اند

شایرر در مقاله ترانزکشن(مقاله‌هایی با جزئیات کامل) خود که در ژورنال Pattern Analysis and Machine Intelligence در انستیتوی مهندسی برق و الکترونیک منتشر شده است، توضیح می‌دهد که چگونه گروه او روش‌های سنتی یادگیری ماشین را با روان‌فیزیک بصری(visual psychophysics) تلفیق کرده است؛ روشی برای اندازه‌گیری ارتباط بین محرک‌های فیزیکی و پدیده‌های روانی، مانند زمانی که متخصص برای تشخیص یک کاراکتر خاص به بررسی کیفیت دست‌خط یا استفاده از اختصارات خاص متوسل می‌شود.

بیشتر بخوانید:

یار مهربان را همیشه در گوشی خود به همراه داشته باشید

گروه همکاران شایرر برخی از نسخه‌های خطی دیجیتالی لاتین را که توسط کاتبان در صومعه سنت گال در قرن نهم نوشته شده بود، مطالعه کردند. خوانندگان رونویسی‌های دستی خود را در یک رابط نرم‌افزاری که برای این کار طراحی شده بود وارد کردند. سپس گروه زمان بررسی کامپیوتری را اندازه‌گیری کرد.

تلفیق یادگیری ماشینِ معمول و یک روش مبتنی روان‌فیزیک بصری

در این مرحله مشخص شد که کدام کلمات، کاراکترها و قطعات آسان یا دشوار هستند. شایرر در مقاله توضیح داده است که این نوع داده‌ها، شبکه‌ای سازگارتر با رفتار انسان ایجاد می‌کند، خطاها را کاهش می‌دهد و خوانایی دقیق‌تر و واقعی‌تری از متن ارائه می‌دهد.

وقتی از قرون وسطی و گذشته‌های دور صحبت می‌کنید، برای درک جزئیات و پیامدهای رویدادهای تاریخی باید نوشته‌ها و مطالب را بررسی کنید وگرنه شناختتان ناقص خواهد بود.

شایرر می‌گوید: «این راهبرد معمولاً در یادگیری ماشین استفاده نمی‌شود. ما داده‌ها را از طریق این اندازه‌گیری‌های روان‌فیزیکی که مستقیماً مبتنی بر مطالعات روان‌شناختی ادراک با اندازه‌گیری‌های رفتاری هستند تگ‌گذاری می‌کنیم. سپس شبکه را از مشکلات رایج در درک این کاراکترها از طریق برخی از ورودی‌های دیگر مطلع می‌کنیم و می‌توانیم بر اساس آن اندازه‌گیری‌ها اصلاحاتی انجام دهیم.»

یادگیری عمیق مورد توجه محققان علوم انسانی قرار گرفته است

هیلدگوند مولر(Hildegund Müller)، دانشیار گروه ادبیات کلاسیک در نوتردام می‌گوید: «بین گرفتن عکس از صفحات و قابلیت خواندن آنها و داشتن برنامه‌ای برای ایجاد قابلیت جست‌وجو تفاوت وجود دارد. اگر متون مورد استفاده در این تحقیق(یعنی نسخ خطی قرن نهم) را در نظر بگیرید متوجه می‌شوید که از دوران اولیه قرون وسطی حرف می‌زنیم. زمان زیادی تا تولید دستگاه چاپ باقی مانده است. بنابراین در این برهه شمار قابل توجهی کتب خطی تولید شده است.»

انواع اطلاعات پنهان در این نسخه‌های خطی و متون ناشناس وجود دارد که هیچ‌کس قبلاً ندیده است و بی‌تردید به دانش ما از تاریخ کمک می‌کند. شایرر معتقد است با وجود اینکه هوش مصنوعی کمک زیادی کرده است اما چالش‌ها همچنان وجود دارد. در حال حاضر تیم او روی بهبود دقت رونوشت‌ها، به‌ویژه در مورد اسناد آسیب‌دیده یا ناقص و همچنین نحوه توضیح تصاویر یا جنبه‌های دیگری که می‌تواند برای شبکه گیج‌کننده باشد کار می‌کند.

با این حال این گروه تحقیقاتی توانسته است برنامه فعلی را برای رونوشت برداشتن از متون حبشی تنظیم کند و آن را با زبانی با مجموعه کاراکترهای کاملاً متفاوت تطبیق دهد که این را می‌توان اولین گام در جهت توسعه یک برنامه با قابلیت رونویسی و ترجمه اطلاعات برای کاربران قلمداد کرد.

بیشتر بخوانید:

بهترین اسکنر کتاب و جزوه

مولر می‌گوید: «این برنامه در زمینه ادبی واقعاً می‌تواند مفید باشد. هوش مصنوعی در تحقیقات بایگانی تاریخی ارزشمند است. با این وجود پیشرفت علوم انسانی دیجیتال همچنان در مراحل اولیه خود قرار دارد. وقتی از قرون وسطی و گذشته‌های دور صحبت می‌کنید، برای درک جزئیات و پیامدهای رویدادهای تاریخی باید نوشته‌ها و مطالب را بررسی کنید وگرنه شناختتان ناقص خواهد بود و این متون تنها چیزی است که ما داریم. ممکن است مشکل در خارج از دنیای غرب حتی بیشتر باشد. به زبان‌هایی فکر کنید که در فرهنگ‌های در معرض تهدید منسوخ می‌شوند. ما باید قبل از هر چیز این آثار را حفظ کرده در دسترس عموم قرار دهیم و سپس کارهای مرتبط با زبان‌شناسی آنها را تکمیل کنیم. اگر گرامر آنها را ندانیم کار دشواری در پیش خواهیم داشت. ما در حال رقابت با زمان هستیم.»

انتهای پیام/۴۱۶۰/پ

انتهای پیام/