دیده بان پیشرفت علم، فناوری و نوآوری
17 بهمن 1401 - 10:37

توسعه هوش مصنوعی در آیگپ/ بروزرسانی سرویس‌های کاربردی TTS و ASR

توسعه هوش مصنوعی در آیگپ  بروزرسانی سرویس‌های کاربردی TTS و ASR
در راستای توسعه هوش مصنوعی در آیگپ، سرویس‌های TTS (تکنولوژی تبدیل متن به گفتار) و ASR (تکنولوژی تبدیل گفتار به متن) با تغییرات چشمگیری، بروزرسانی شد.
کد خبر : 830410

 به گزارش گروه بازار خبرگزاری آنا به نقل از روابط عمومی آیگپ، پیام‌رسان آیگپ در مسیر توسعه و همگام سازی با نمونه های موفق کاربردی و پرطرفدار مشابه در دنیا، پس از برداشتن اولین گام در مسیر هوشمند شدن که همراه با ارائه سومین نسل از این پیام‌رسان اتفاق افتاد، سرویس‌های کاربردی و پرطرفدار TTS  و ASR را بروزرسانی کرد.

در این بروزرسانی، اتفاقات متفاوتی رخ داده که آیگپ را متمایز از سایر پیام‌رسان‌ها در مسیر هوشمند شدن قرار داده است.

سرویس TTS (تکنولوژی تبدیل متن به گفتار)

سرویس TTS (تکنولوژی تبدیل متن به گفتار) در نسخه بروزرسانی شده با قابلیت‌های پایه‌ زیر ارائه شده است:

  • • قابلیت خوانش متون فارسی
  • • قابلیت اعراب‌گذاری خودکار متون
  • • امکان تغییر سرعت گوینده
  • • قابلیت خوانش اعداد
  • • امکان سفارشی‌سازی لحن گوینده
  • • امکان ایجاد محیط گرم و تعاملی با استفاده از چیت چت
  • • توانایی سفارشی سازی صدای گوینده خاص
  • • گوینده پایه خانم و آقا
  • • قابلیت افزایش و کاهش استاتیک کلمات خاص در دیکشنری

بروزرسانی‌های انجام شده در سرویس TTS در حوزه‌های مختلفی انجام شده که در ادامه به آن‌ها می پردازیم:

  • • تصحیح اشتباهات پرتکرار در خوانش

در این بروز رسانی، مدل جدیدی پیاده‌سازی شده است که به صورت اخصاصی تعداد زیادی از اشتباهات و تلفظ‌های غلط را شناسایی کرده و در لغتنامه موتور تصحیح می‌کند.

  • • سانسور محتوای نامناسب

در بروز رسانی جدید، سرویس، پیامی که حاوی کلمات نامناسب باشد را خوانش کرده و با صدای "بوق" از روی کلمه نامناسب عبور خواهد کرد.

  • • خوانش ایموجی

در نسخه جدید، ایموجی‌های پرتکرار شناسایی شده و با اسم متناظرشان خوانده می‌شوند.

  • • موارد نگارشی

در این بروز رسانی، سرویس در برخورد با علائم نگارشی، رفتاری صحیح  از خود نشان خواهد داد. برای مثال در صورت برخورد با ویرگول مکث کرده و یا با پایان یک پاراگراف و شروع پاراگراف بعدی، به اندازه لازم مکث خواهد داشت.

سرویس ASR (تکنولوژی تبدیل گفتار به متن)

          سرویس ASR (تکنولوژی تبدیل صوت به متن) در نسخه بروزرسانی شده با قابلیت‌های پایه‌ زیر ارائه شده است:

  • • تبدیل گفتار فارسی به متن با دقت و سرعت بالا
  • • قابلیت تبدیل گفتار محاوره‌ای و رسمی به متن
  • • امکان تشخیص گویندگان متفاوت در یک فایل صوتی
  • • تشخیص لهجه‌های مختلف زبان فارسی
  • • قابلیت تبدیل گفتار به متن برای زبان‌های دیگر
  • • مقاوم در برابر نویز

بروزرسانی‌های انجام شده در سرویس ASR در حوزه‌های مختلفی انجام شده که در ادامه به آن‌ها می پردازیم:

  • • دقت:

این بروز رسانی، به صورت اختصاصی با تمرکز بر روی پیام رسان‌ها و کاربرهایی که می‌خواهند از پیام رسان استفاده کنند، پیاده‌سازی شده است. این تمرکز، باعث افزایش دقت سرویس در حوزه‌های زبان محاوره‌ای، تشخیص نویز، مکث و سکوت، بهبود ویس‌های ضبط شده با میکروفون‌های ضعیف و تسلط بر دایره جملات استفاده شده در ارتباط کاربران با یکدیگر شده است.

  • • حجم مدل:

در بروز رسانی جدید، با فشرده‌سازی‌های انجام شده و کمتر شدن حجم سرویس، افزایش قابل توجهی را بر روی سرعت سرویس شاهد هستیم.

علاقه‌مندان می‌توانند برای استفاده از امکانات و قابلیت‌های هوش مصنوعی در آیگپ و همچنین سایر خدمات این پیام‌رسان، نسبت به نصب آیگپ اقدام کنند.

انتهای پیام/

ارسال نظر
قالیشویی ادیب