ترجمه لوحهای هخامنشی به کمک هوش مصنوعی
به گزارش خبرنگار حوزه علم، فناوری و دانش بنیان گروه دانشگاه خبرگزاری آنا، یادگیری عمیق (Deep learning) به مقابله با مشکلات فراوان در دنیای مدرن کمک میکند. اما همچنین نقش خود را در کمک به حل برخی مشکلات کهن نیز ایفاء میکند؛ از جمله کمک به ترجمه اسناد لوح سفالی 2500 ساله از امپراتوری هخامنشیان ایران.
این لوحها که سال 1933 در ایران کشف شد، دهها سال است که توسط محققان مورد مطالعه قرار گرفته است. با این حال، آنها فرایند ترجمه برای این لوحها (که تعدادشان دهها هزار عدد است) را خستهکننده و مستعد خطا دانستهاند. اما فناوری هوش مصنوعی میتواند کمک کند.
سانجی کریشنان، استادیار گروه علوم کامپیوتر دانشگاه شیکاگو، گفت: ما آزمایشهای اولیهای داریم که از یادگیری ماشین استفاده میکنند تا مشخص شود کدام نمادهای خط میخی در تصاویر یک لوح وجود دارد.
یادگیری ماشینی با برونیابی الگوها از نمونههای دارای برچسب انسان انجام میشود و این به ما امکان میدهد تا یادداشتها و خطوط را در آینده به صورت خودکار انجام دهیم. پیشبینی میکنیم که این گامی به سوی اتوماسیون قابل توجه در تجزیه و تحلیل و مطالعه این لوحها است.
در این مورد، نمونههای دارای برچسب انسانی از لوحهای حاشیهنویسی شده از مجموعه تخت جمشید و دادههای آنلاین پژوهشهای فرهنگی و تاریخی (OCHRE) است.
طی یک همکاری بین محققان موسسه دانشگاه شیکاگو و گروه علوم کامپیوتر آن، در شرکت هوش مصنوعی DeepScribe، آنها از یک مجموعه آموزشی با بیش از 6000 تصویر حاشیهنویسی شده برای ساختن یک شبکه عصبی استفاده کردند که قادر است لوحهای غیرآنالیز شده را بخواند.
هنگامی که الگوریتم روی سایر لوحها مورد آزمایش قرار گرفت، توانست علائم میخی را با سطح دقت حدود 80٪ ترجمه کند. امید این است که این معیار در آینده افزایش یابد. حتی اگر این اتفاق نیفتد، میتوان از این سیستم برای ترجمه مقادیر زیادی از الواح استفاده کرد، و دانشمندان علوم انسانی را ترغیب کرد که تلاشهای خود را بر روی قطعات واقعاً دشوار متمرکز کنند.
خط میخی مجموعهای از چالشهای خاص را برای ترجمه ماشینی ایجاد میکند. اولاً، با فشاردادن قلم نی در خشتهای مرطوب نوشته شده است. که این خط میخی را به یکی از سیستمهای متون سهبعدی نادر تبدیل میکند. ثانیاً، خط میخی یک سیستم متنی پیچیده است که در آن از صدها نشانه استفاده میشود. هر علامت بسته به متن آن دارای معانی مختلفی است. سوماً، لوحهای خط میخی غالباً شکسته بوده و به سختی رمزگشایی میشوند، به این معنی که خواندن یک لوح میتواند روزها طول بکشد.
قدم بعدی این محققان ایجاد مدلهای قویتر است که زمینه و کیفیت دادهها را به خود اختصاص میدهد.
انتهای پیام/4112/
انتهای پیام/