توسعه یک مدل زبانی هوش مصنوعی توسط محققان چینی
به گزارش خبرنگار خبرگزاری علم و فناوری آنا به نقل از رویترز، طبق گزارشهای بینالمللی، سازمانهای چینی ۷۹ مدل زبان بزرگ (LLM) را در سه سال گذشته در این کشور راهاندازی کردهاند و تلاشها برای توسعه الگوریتمهای هوش مصنوعی را دو برابر کردهاند.
بر اساس گزارشی که توسط مؤسسات تحقیقاتی وزارت علوم و فناوری چین تهیه شده، توسعه مدل زبان بزرگ که با استفاده از تکنیکهای یادگیری عمیق روی مقادیر انبوه دادههای متنی آموزش داده شدهاند، در سال ۲۰۲۰ وارد فاز شتابیافته شد. با بررسی توزیع مدلهای زبان بزرگ منتشر شده در سراسر جهان، چین و آمریکا با اختلاف زیادی پیشتاز هستند و بیش از ۸۰ درصد از تعداد کل جهان را تشکیل میدهند.
حال «گروه آنت» (Ant Group) یک شرکت وابسته به گروه چینی «علیبابا» (Alibaba Group) و مالک بزرگترین پلتفرم پرداخت از طریق گوشی تلفن همراه در جهان اعلام کرده که در حال کار روی مدل بزرگ هوش مصنوعی خود است. علاقهمندان از اول سپتامبر ۲۰۲۲ از غرفه گروه آنت در نمایشگاه بینالمللی تجارت خدمات چین (CIFTIS) در پکن بازدید کردهاند.
یکی از سخنگویان با تائید گزارش رسانههای چینی گفته است که «یک تیم تحقیق و توسعه فناوری در گروه آنت چین در حال توسعه مدل زبانی بزرگی «ال ال ام» (LLM) با نام ژنی است.»
با این حال، اطلاعات بیشتری در مورد رونمایی عمومی از این مدل زبانی بزرگ فعلاً در دست نیست.
گفتنی است؛ «الالام» یک مدل زبانی بزرگ متشکل از یک شبکه عصبی با پارامترهای بسیاری است که بر روی مقادیر متنی با استفاده از یادگیری خود نظارتی یا نیمه نظارتی آموزش داده میشود. درواقع، یک پایگاه داده عظیم از دادههای متنی است که میتواند برای ایجاد پاسخهایی شبیه به انسان به درخواستهای شما ارجاع داده شود. متن از طیف وسیعی از منابع میآید و میتواند به میلیاردها کلمه برسد.
لازم به یادآوری است؛ گروه آنت دارای ۱۰ شعبه در کشور چین بوده و علاوه بر آن، در کشورهای دیگری همچون ژاپن، تایلند، سنگاپور، کره، انگلستان، فرانسه، آلمان، هلند، ایتالیا، استرالیا و نیوزیلند نیز شعبه دارد.
انتهای پیام/