توسعه یک مدل زبانی هوش مصنوعی توسط محققان چینی

یک تیم تحقیق و توسعه فناوری در چین در حال توسعه مدل زبانی بزرگی «ال ال ام» (LLM) است.

کد خبر : 853854

اشتراک گذاری

به گزارش خبرنگار خبرگزاری علم و فناوری آنا به نقل از رویترز، طبق گزارش‌های بین‌المللی، سازمان‌های چینی ۷۹ مدل زبان بزرگ (LLM) را در سه سال گذشته در این کشور راه‌اندازی کرده‌اند و تلاش‌ها برای توسعه الگوریتم‌های هوش مصنوعی را دو برابر کرده‌اند.

بر اساس گزارشی که توسط مؤسسات تحقیقاتی وزارت علوم و فناوری چین تهیه شده، توسعه مدل زبان بزرگ که با استفاده از تکنیک‌های یادگیری عمیق روی مقادیر انبوه داده‌های متنی آموزش داده شده‌اند، در سال ۲۰۲۰ وارد فاز شتاب‌یافته شد. با بررسی توزیع مدل‌های زبان بزرگ منتشر شده در سراسر جهان، چین و آمریکا با اختلاف زیادی پیشتاز هستند و بیش از ۸۰ درصد از تعداد کل جهان را تشکیل می‌دهند.

حال «گروه آنت» (Ant Group) یک شرکت وابسته به گروه چینی «علی‌بابا» (Alibaba Group) و مالک بزرگ‌ترین پلتفرم پرداخت از طریق گوشی تلفن همراه در جهان اعلام کرده که در حال کار روی مدل بزرگ هوش مصنوعی خود است. علاقه‌مندان از اول سپتامبر ۲۰۲۲ از غرفه گروه آنت در نمایشگاه بین‌المللی تجارت خدمات چین (CIFTIS) در پکن بازدید کرده‌اند.

یکی از سخنگویان با تائید گزارش‌ رسانه‌های چینی گفته است که «یک تیم تحقیق و توسعه فناوری در گروه آنت چین در حال توسعه مدل زبانی بزرگی «ال ال ام» (LLM) با نام ژنی است.»

با این حال، اطلاعات بیشتری در مورد رونمایی عمومی از این مدل زبانی بزرگ فعلاً در دست نیست.

گفتنی است؛ «ال‌ال‌ام» یک مدل زبانی بزرگ متشکل از یک شبکه عصبی با پارامتر‌های بسیاری است که بر روی مقادیر متنی با استفاده از یادگیری خود نظارتی یا نیمه نظارتی آموزش داده می‌شود. درواقع، یک پایگاه داده عظیم از داده‌های متنی است که می‌تواند برای ایجاد پاسخ‌هایی شبیه به انسان به درخواست‌های شما ارجاع داده شود. متن از طیف وسیعی از منابع می‌آید و می‌تواند به میلیاردها کلمه برسد.

لازم به یادآوری است؛ گروه آنت دارای ۱۰ شعبه در کشور چین بوده و علاوه بر آن، در کشورهای دیگری همچون ژاپن، تایلند، سنگاپور، کره، انگلستان، فرانسه، آلمان، هلند، ایتالیا، استرالیا و نیوزیلند نیز شعبه دارد.

انتهای پیام/