هوش مصنوعی اسرار متون قدیمی را فاش کرد/ با فناوری هیچ رازی پنهان نمیماند
به گزارش خبرنگار گروه علم و فناوری خبرگزاری آنا، کتابخانه کلیسای سنت گال در سوئیس دارای ۱۶۰ هزار جلد نسخه خطی ادبی و تاریخی است که به قرن هشتم میلادی باز میگردد. تمام این آثار با دست، روی پوست به زبانهایی که در دوران معاصر بهندرت صحبت میشود نوشته شدهاند.
برای حفظ این روایتهای مهم تاریخی معمولاً چنین متونی که شمار آنها در اقصینقاط جهان به میلیونها نسخه میرسد، در موزهها، کتابخانهها و صومعههای سراسر جهان نگهداری میشوند. امروزه بخش قابل توجهی از این مجموعهها از طریق تصاویر دیجیتال در دسترس عموم قرار گرفته است.
بیشتر بخوانید:
خواندن کتابهای آسیبپذیر و بسیار قدیمی بدون نیاز به ورق زدن + ویدئو
بررسی وضعیت کتاب الکترونیک در دنیای امروزی/ مزایا و معایب کتابخوانی به سبک الکترونیک چیست؟
سایتهایی وجود دارد که میتوانید به آن مراجعه کنید، کتاب مورد نظر خود را انتخاب کنید و صفحاتش را ورق بزنید، اما کارشناسان میگویند بخش قابل توجهی از مطالب این کتب هرگز خوانده نشده است و به عبارت دیگر گنجینهای از تاریخ جهان در این متون پنهان مانده است.
توسعه یک شبکه عصبی مصنوعی برای حل مسئله
در حال حاضر محققان دانشگاه نوتردام در حال توسعه یک شبکه عصبی مصنوعی مبتنی بر یادگیری عمیق برای خواندن کتب باستانی هستند.
والتر شایرر(Walter Scheirer)، دانشیار دانشکده علوم و مهندسی کامپیوتر در نوتردام میگوید: «ما با متون تاریخی سروکار داریم که زبان مورد استفاده از آنها قرنهاست منسوخ شده است(یا زبانهایی مثل لاتین که بهندرت استفاده میشوند). ممکن است یافتن تصاویر زیبایی از آنها در فضای وب مقدور باشد اما آنچه ما قصد انجام آن را داریم، این است که هوش مصنوعی درک صفحه را از منظر یک متخصص تقلید کرده و خواندن سریع و قابل جستوجو را در متن فراهم کند.»
شایرر در مقاله ترانزکشن(مقالههایی با جزئیات کامل) خود که در ژورنال Pattern Analysis and Machine Intelligence در انستیتوی مهندسی برق و الکترونیک منتشر شده است، توضیح میدهد که چگونه گروه او روشهای سنتی یادگیری ماشین را با روانفیزیک بصری(visual psychophysics) تلفیق کرده است؛ روشی برای اندازهگیری ارتباط بین محرکهای فیزیکی و پدیدههای روانی، مانند زمانی که متخصص برای تشخیص یک کاراکتر خاص به بررسی کیفیت دستخط یا استفاده از اختصارات خاص متوسل میشود.
بیشتر بخوانید:
یار مهربان را همیشه در گوشی خود به همراه داشته باشید
گروه همکاران شایرر برخی از نسخههای خطی دیجیتالی لاتین را که توسط کاتبان در صومعه سنت گال در قرن نهم نوشته شده بود، مطالعه کردند. خوانندگان رونویسیهای دستی خود را در یک رابط نرمافزاری که برای این کار طراحی شده بود وارد کردند. سپس گروه زمان بررسی کامپیوتری را اندازهگیری کرد.
تلفیق یادگیری ماشینِ معمول و یک روش مبتنی روانفیزیک بصری
در این مرحله مشخص شد که کدام کلمات، کاراکترها و قطعات آسان یا دشوار هستند. شایرر در مقاله توضیح داده است که این نوع دادهها، شبکهای سازگارتر با رفتار انسان ایجاد میکند، خطاها را کاهش میدهد و خوانایی دقیقتر و واقعیتری از متن ارائه میدهد.
وقتی از قرون وسطی و گذشتههای دور صحبت میکنید، برای درک جزئیات و پیامدهای رویدادهای تاریخی باید نوشتهها و مطالب را بررسی کنید وگرنه شناختتان ناقص خواهد بود.
شایرر میگوید: «این راهبرد معمولاً در یادگیری ماشین استفاده نمیشود. ما دادهها را از طریق این اندازهگیریهای روانفیزیکی که مستقیماً مبتنی بر مطالعات روانشناختی ادراک با اندازهگیریهای رفتاری هستند تگگذاری میکنیم. سپس شبکه را از مشکلات رایج در درک این کاراکترها از طریق برخی از ورودیهای دیگر مطلع میکنیم و میتوانیم بر اساس آن اندازهگیریها اصلاحاتی انجام دهیم.»
یادگیری عمیق مورد توجه محققان علوم انسانی قرار گرفته است
هیلدگوند مولر(Hildegund Müller)، دانشیار گروه ادبیات کلاسیک در نوتردام میگوید: «بین گرفتن عکس از صفحات و قابلیت خواندن آنها و داشتن برنامهای برای ایجاد قابلیت جستوجو تفاوت وجود دارد. اگر متون مورد استفاده در این تحقیق(یعنی نسخ خطی قرن نهم) را در نظر بگیرید متوجه میشوید که از دوران اولیه قرون وسطی حرف میزنیم. زمان زیادی تا تولید دستگاه چاپ باقی مانده است. بنابراین در این برهه شمار قابل توجهی کتب خطی تولید شده است.»
انواع اطلاعات پنهان در این نسخههای خطی و متون ناشناس وجود دارد که هیچکس قبلاً ندیده است و بیتردید به دانش ما از تاریخ کمک میکند. شایرر معتقد است با وجود اینکه هوش مصنوعی کمک زیادی کرده است اما چالشها همچنان وجود دارد. در حال حاضر تیم او روی بهبود دقت رونوشتها، بهویژه در مورد اسناد آسیبدیده یا ناقص و همچنین نحوه توضیح تصاویر یا جنبههای دیگری که میتواند برای شبکه گیجکننده باشد کار میکند.
با این حال این گروه تحقیقاتی توانسته است برنامه فعلی را برای رونوشت برداشتن از متون حبشی تنظیم کند و آن را با زبانی با مجموعه کاراکترهای کاملاً متفاوت تطبیق دهد که این را میتوان اولین گام در جهت توسعه یک برنامه با قابلیت رونویسی و ترجمه اطلاعات برای کاربران قلمداد کرد.
بیشتر بخوانید:
مولر میگوید: «این برنامه در زمینه ادبی واقعاً میتواند مفید باشد. هوش مصنوعی در تحقیقات بایگانی تاریخی ارزشمند است. با این وجود پیشرفت علوم انسانی دیجیتال همچنان در مراحل اولیه خود قرار دارد. وقتی از قرون وسطی و گذشتههای دور صحبت میکنید، برای درک جزئیات و پیامدهای رویدادهای تاریخی باید نوشتهها و مطالب را بررسی کنید وگرنه شناختتان ناقص خواهد بود و این متون تنها چیزی است که ما داریم. ممکن است مشکل در خارج از دنیای غرب حتی بیشتر باشد. به زبانهایی فکر کنید که در فرهنگهای در معرض تهدید منسوخ میشوند. ما باید قبل از هر چیز این آثار را حفظ کرده در دسترس عموم قرار دهیم و سپس کارهای مرتبط با زبانشناسی آنها را تکمیل کنیم. اگر گرامر آنها را ندانیم کار دشواری در پیش خواهیم داشت. ما در حال رقابت با زمان هستیم.»
انتهای پیام/۴۱۶۰/پ
انتهای پیام/