أدوات مساعدة صوتية مطوّرة بالذكاء الاصطناعي
أفادت وکالة آنا الإخباریة، حدثّت شركة «أوبن أيه آي» خلال العام الماضي برنامج الدردشة الآلي الخاص بها "تشات جي بي تي" للرد عليك باستخدام كلمات منطوقة، وقدّمت شركة «غوغل» مؤخراً نموذج الذكاء الاصطناعي «جيميناي» بديلاً للمساعد الصوتي الخاص بها المستخدم في الهواتف التي تعمل بنظام "أندرويد".
وتراهن الشركات، التي تعمل في مجال التكنولوجيا، على حدوث نهضة في المساعدات الصوتية، بعد مرور سنوات كثيرة على اعتبار أكثر الناس أن الحديث مع أجهزة الكومبيوتر ليس لطيفاً.
هل سينجح الأمر هذه المرة؟
ربما، لكنه قد يستغرق بعض الوقت. لم يستخدم عدد كبير من الناس بعد أدوات مساعدة صوتية مثل "أليكسا" من شركة "أمازون" و"سيري" من شركة "أبل" و"أسيستانت" من شركة "غوغل"، وقالت الأغلبية العظمى منهم إنهم لم يرغبوا قط في أن يراهم أحد يتحدثون إلى المساعدين الصوتيين علناً بحسب دراسات تم إجراؤها خلال العقد الماضي.
أنا أيضاً نادراً ما أستخدم مساعدين صوتيين، وخلال تجربتي مع نظارة "ميتا" مؤخراً، التي تتضمن كاميرا، وسماعات خارجية، لتوفير معلومات عن البيئة المحيطة بك، خلصت إلى أن التحدث إلى جهاز كومبيوتر أمام آباء وأبنائهم في حديقة يظل أمراً محرجاً للغاية. لقد جعلني ذلك أسأل عما إذا كان هذا الأمر سيبدو طبيعياً يوماً ما.
منذ مدة ليست بالطويلة، كان الحديث على الهاتف باستخدام سماعات "بلوتوث" يجعل الناس تبدو مختلة عقلياً، لكن الجميع يفعل ذلك الآن. هل سنرى في وقت ما الكثير من الناس يتجولون وهم يتحدثون إلى أجهزة الكومبيوتر الخاصة بهم مثلما يحدث في أفلام الخيال العلمي؟
لقد طرحت هذا السؤال على خبراء وباحثين في التصميم، وقد أجمعوا بشكل واضح على القول بأنه نظراً لأن أنظمة الذكاء الاصطناعي الجديدة سوف تحسّن قدرة المساعدين الصوتيين على فهم ما نقوله ومساعدتنا، من المرجح أن نتحدث إلى أجهزة بشكل أكبر في المستقبل القريب، لكن لا تزال هناك سنوات طويلة تفصلنا عن القيام بذلك علناً أمام الآخرين.
ذكاء اصطناعي توليدي
لماذا تزداد أدوات المساعدة الصوتية ذكاءً؟ المساعدون الصوتيون الجديدون مزودون بذكاء اصطناعي توليدي، يستخدم إحصاءات، وخوارزميات معقدة لتخمين الكلمات التي ينتمي بعضها إلى بعض، مثل خاصية الإكمال التلقائي الموجودة على هاتفك.
ويجعلهم ذلك أكثر قدرة على استخدام السياق لفهم الطلبات وأسئلة المتابعة مقارنة بمساعدين افتراضيين مثل «سيري» و«أليكسا»، والذين يستطيعون الرد فقط على قائمة محدودة من الأسئلة.
على سبيل المثال، إذا قلت لبرنامج دردشة آلي: "ما هي رحلات الطيران من سان فرنسيسكو إلى نيويورك خلال الأسبوع المقبل؟" وسؤال متابعة هو: "ما حالة الطقس هناك؟ وما الأشياء التي ينبغي أن أحضرها معي؟» يستطيع برنامج الدردشة الآلي الإجابة عن تلك الأسئلة لأنه ينشئ روابط بين الكلمات لفهم سياق المحادثة.
سوف يفشل مساعد صوتي أقدم مثل "سيري"، الذي يستجيب لقاعدة بيانات مكونة من أوامر وأسئلة تمت برمجته لفهمها، إلا إذا استخدمت كلمات محددة، من بينها: "ما هي حالة الطقس في نيويورك؟"، و«ما الذي ينبغي لي وضعه في حقيبتي خلال رحلة قصيرة إلى نيويورك؟». تبدو المحادثة السابقة أكثر سلاسة مثل الطريقة التي يتحدث بها الناس إلى بعضهم. ومن الأسباب المهمة، التي جعلت الناس تتخلى عن مساعدين صوتيين مثل «سيري» و«أليكسا»، عدم قدرة أجهزة الكومبيوتر على فهم الكثير مما يتم سؤالهم عنه، وكان من الصعب عليهم تعلّم الأسئلة المناسبة.
قالت دميترا فيرغيري، مديرة تكنولوجيا الحديث في معمل الأبحاث «إس أر أي» الذي كان وراء ظهور النسخة الأولية من المساعد الصوتي «سيري» قبل استحواذ شركة «أبل» عليه، إن الذكاء الاصطناعي التوليدي قد عالج الكثير من المشكلات التي ظل الباحثون يعملون بجهد لسنوات من أجل حلها. كذلك أوضحت أن التكنولوجيا تجعل المساعدين الصوتيين قادرين على فهم الحديث العفوي والرد بإجابات مفيدة.
وقال جون بيركي، مهندس سابق في شركة «أبل» عمل على المساعد الصوتي «سيري» عام 2014 وكان من منتقديه بشكل علني، إنه اعتقد أن الذكاء الاصطناعي التوليدي قد جعل من الأسهل على الناس الحصول على مساعدة من أجهزة الكومبيوتر، مما زاد احتمال زيادة عدد الناس الذين سيتحدثون إلى المساعدين قريباً، وعندما يبدأ العدد الكافي من الناس في القيام بذلك، سيصبح أمراً عادياً. وقال: «كان (سيري) محدوداً من حيث الحجم؛ حيث كان يعرف كلمات كثيرة فقط. لدينا الآن أدوات ووسائل أفضل».
مع ذلك قد تمر سنوات طويلة قبل تبني الموجة الجديدة من المساعدين الصوتيين، الذين يعملون بتقنية الذكاء الاصطناعي، على نطاق واسع لأنها تتضمن مشكلات جديدة، إذ إن برامج الدردشة الآلية، ومن بينها «تشات جي بوت» و«جيميناي» من «غوغل» و«ميتا أيه آي»، عرضة لـ«الهلاوس»، التي تحدث عندما تختلق أشياء لعدم تمكنها من التوصل إلى الإجابات الصحيحة. لقد ارتكبت أخطاء في مهام أساسية مثل العدّ والحساب وتلخيص معلومات من شبكة الإنترنت.
متى يقدم المساعدون الصوتيون المساعدة؟
رغم تحسّن وتطوّر تكنولوجيا المحادثة، من المرجح ألا يحلّ التحادث محل التفاعلات التقليدية مع أجهزة الكومبيوتر باستخدام لوحات المفاتيح على حد قول خبراء.
ولدى الناس حالياً أسباب قوية للحديث إلى أجهزة الكومبيوتر في بعض المواقف التي يكونون فيها وحدهم، مثل تحديد وجهة على خريطة أثناء قيادة سيارة. مع ذلك فإن الحديث إلى مساعد صوتي علناً لن يجعلك تبدو غريباً فقط، بل سيكون غير عملي في أكثر الأحوال. عندما كنت أرتدي نظارة «ميتا» في متجر بقالة، وطلبت منها تحديد هوية نوع من الخضراوات، رد متسوق كان يسترق السمع بوقاحة: «إنه لفت».
كذلك لن يريد المرء إملاء رسالة بالبريد الإلكتروني خاصة بعمل سري في وجود آخرين على متن قطار. بالمثل سيكون من اللامبالاة وعدم مراعاة الآخرين الطلب من مساعد صوتي قراءة رسائل نصية بصوت مرتفع في مقهى. مع ذلك من السهل العثور على أوقات يساعد فيها التحدث مع جهاز كومبيوتر المرء كثيراً إلى حد يجعله لا يبالي بأي حرج أمام الآخرين، على حد قول كارولينا ميلانيزي، محللة في شركة الأبحاث «كريتيف ستراتيجيس».
إذا كنت تتوجه لحضور اجتماع في المكتب المجاور، سيكون من المفيد الطلب من مساعد صوتي إطلاعك على معلومات عن الأشخاص الذين ستقابلهم. وعند تسلق درب جبلي، سيكون سؤال مساعد صوتي عن الاتجاه الذي ينبغي لك السير فيه، أسرع من التوقف لتفحص الخريطة. وعند زيارة متحف، سيكون من الجيد أن يشرح المساعد الصوتي درساً في التاريخ عن اللوحة التي تنظر إليها. لقد تم تطوير بعض من تلك التطبيقات بالفعل باستخدام تكنولوجيا ذكاء اصطناعي جديدة.
أنا مقتنع بأن اليوم، الذي سوف يتحدث فيه الناس أحياناً إلى أجهزة الكومبيوتر بشكل اعتيادي في حياتهم اليومية، سيأتي حتماً، لكنه سيأتي ببطء شديد.