بيت التفكير إلى الأمام المساعدون الأذكياء: ماذا بعد السيري؟

المساعدون الأذكياء: ماذا بعد السيري؟

فيديو: من زينو نهار اليوم ØµØ Ø¹ÙŠØ¯ÙƒÙ… انشر الفيديو Øتى يراه كل Ø§Ù„Ø (شهر نوفمبر 2024)

فيديو: من زينو نهار اليوم ØµØ Ø¹ÙŠØ¯ÙƒÙ… انشر الفيديو Øتى يراه كل Ø§Ù„Ø (شهر نوفمبر 2024)
Anonim

لقد انتقل المساعدين الأذكياء - سيري وجوجل ناو وكورتانا وما شابه - من الفضول والحيل في صالات الاستقبال قبل بضع سنوات إلى الأدوات الأساسية التي يستخدمها كثير من الناس في حياتهم اليومية. في الأسبوع الماضي ، تخلت عن مؤتمر المساعدين الذكي في نيويورك ، الذي قدمته شركة Opus Research ، وقد أعجبت بالتقدم الذي يحرزه البرنامج في مجموعة متنوعة من الصناعات ، بما في ذلك تقدم الشركات المالية والتأمينية والطبية في بناء وكلاء محددين.

أوضح مؤسس Opus Research Dan Miller أن العديد من التقنيات الأساسية ، مثل التعرف على الكلام ، موجودة منذ أكثر من 20 عامًا. على الرغم من أنه شهد مؤخرًا بعض التحسينات الكبيرة ، بدلاً من حدوث ثورة ، إلا أنه قال "إننا نسير على طريق تطوري" ، مع وجود الكثير من المنتجات على استمرارية ذات قدرات مختلفة. وأشار إلى أن هناك المئات من المساعدين الأذكياء للمؤسسات التي يمكن استخدامها في محادثة نصية بسيطة باللغة الإنجليزية البسيطة باستخدام مجموعة بيانات ثابتة ، ولأشياء مثل التنقل في موقع ويب أو أسئلة وأجوبة. على الطرف الآخر من الطيف ، ربما لا يوجد سوى بضع عشرات من "التطبيقات الديناميكية التي تشعر بالإنسان" والتي تكون أكثر تحادثية وإدراكًا للسياق.

وأشار ميلر إلى الطلبات التي فازت بجوائز في المؤتمر. بدأت شركة Amtrak's Julie كعامل خدمة هاتفية للاستجابة الصوتية قبل سنوات ، ولكنها تطورت الآن إلى وكيل يعمل على الموقع الإلكتروني لتوجيه المسافرين عبر Amtrak.com ، استنادًا إلى وكيل من Next IT. لدى Telefonica Mexico وكيل يدعى Nico وله صورة رمزية ويوفر أيضًا الدعم عبر Twitter و Facebook ، استنادًا إلى نظام AgentBot. يحتوي ING Netherlands على Inge ، وهو تطبيق يتيح لك التحقق من رصيد حسابك المصرفي أو تحويل الأموال عبر الصوت ، باستخدام تقنية القياس الحيوي الصوتي من Nuance ، لمصادقة هويتك.

تشمل الإشارات المحترمة تطبيقات الرعاية الصحية ، مثل التطبيق الذي يساعدك في اختيار خطة الرعاية الصحية. تشمل التطبيقات الأخرى التي سمعت عنها في المعرض Domino's Pizza ، والذي يحتوي على تطبيق يسمى Dom يتيح لك استخدام الصوت لطلب البيتزا ؛ و BMW ، التي لديها وكيل افتراضي كجزء من ذراع تمويل السيارات Up2drive.

تحدث بريت بيرانك من Nuance عن كيف أن التطورات في الشبكات العصبية للتعلم العميق قد حسنت أشياء مثل فهم اللغة الطبيعية وكذلك التعرف على الصوت ، وكيف يتم ذلك الآن من أجل تمكين المزيد من الاهتمام في هذا المجال. كان مساعد Nuina's Nina مثالًا مبكرًا ، ومنذ ذلك الحين نما إلى العديد من التطبيقات المحددة ، بدءًا من أنظمة الاستجابة الصوتية التفاعلية في شركات التأمين وتطبيقات التسوق. لكل تطبيق من هذه التطبيقات شخصية مختلفة ، اعتمادًا على ما يحاول مساعدتك.

إحدى الميزات الجديدة الكبيرة التي ناقشها هي القياسات الحيوية الصوتية ، حيث يحل صوتك محل كلمة المرور. تحدث عن كيفية قيام شركات مثل ING في أوروبا بتطوير وكلاء لا يستخدمون التعرف على الصوت ومعالجة اللغة الطبيعية فقط ، ولكنهم بدأوا أيضًا في استخدام الصوت للتعرف على الشخص المتصل. وقال إن هذا كان أكثر أمانًا وأكثر طبيعية من كلمة المرور التقليدية.

في حين أن الدراسات الحديثة قلقة من أن التسجيلات الصوتية يمكن أن تخدع مثل هذه الأنظمة ، إلا أن نانس لاحظت أن تكنولوجيا اليوم تشمل ميزات تهدف إلى التقاط الحالات الشاذة من الصوت المسجل ، وأشار إلى الدراسات الأخرى التي اتخذت وجهة نظر مختلفة. وقال إنه بالإضافة إلى ذلك ، يمكن للمصممين استخدام مستويات مختلفة من القياسات الحيوية الصوتية لوظائف مختلفة ، مثل استخدام التعرف البسيط للتحقق من رصيد الحساب ، أو يطلب منك تكرار تسلسل عشوائي للكلمات لتحويلات مالية كبيرة.

يبدو أن القياسات الحيوية الصوتية تكتسب قدرًا كبيرًا من الجر. في Gartner Symposium في الأسبوع الماضي ، شملت جلسة حول "حالات العملاء الرائعة" في الخدمات المالية تطبيق Citibank الذي استخدم هذه الميزة.

لدى MyWave مساعد يدعى فرانك يُقصد به أن يتم تمكينه من قبل العديد من الشركات التجارية للسماح لك بالتفاعل معهم بطريقة أكثر تحادثية ، بدلاً من قيام كل شركة بتطوير أعمالها الخاصة. تتضمن الاستخدامات الأولى بنكًا نيوزيلنديًا وتطبيقًا يسمى Saveawatt مصممًا لمساعدتك في اختيار مزود الكهرباء الخاص بك.

أوضح الرئيس التنفيذي جيرالدين ماكبرايد أن الشركة تحاول إنشاء مساعدين لسد الفجوة بين العملاء وتطبيقات الخدمة ، مع ما تسميه "العلاقات التي يديرها العملاء" أو CMR ، وهي تدور حول تطبيقات CRM التقليدية. وقالت إن أحد الاختلافات الكبيرة هو أن العميل مسؤول عن جميع بياناته أو بياناتها ، وليس عن الشركة.

هناك شركة أخرى جديدة نسبيًا ، وهي Expect Labs لديها منتج يسمى MindMeld يعمل كخلفية لعدد من الشركات التي ترغب في تقديم واجهة صوتية لاستبدال الواجهات التقليدية والتعامل مع الأسئلة والأجوبة. يمكن استخدام هذا لمجموعة متنوعة من التطبيقات ، مثل مشاهدة البرامج التلفزيونية عن طريق طرح الاسم والحصول على نظام الاستعلام عن أنظمة متعددة. (يحتوي Amazon's Fire TV على بعض هذه الميزات ، ولكنه غير مدمج مع جهاز فك تشفير الكابل الخاص بك ، في حين أن أحد المستثمرين في Expect Labs هي شركة الكابلات Liberty Global.)

أوضح الرئيس التنفيذي تيم تاتل أن MindMeld تميل إلى استخدام التعرّف على الكلام المتوفر بالفعل في معظم الأجهزة وتركز بدلاً من ذلك على فهم اللغة الطبيعية وبناء رسم بياني معرفة بالمعلومات المتوفرة. وقال إن الشركة تحاول توسيع نطاق النظام ليشمل المزيد من المعلومات من مصادر متعددة ، ولتفصيل التسلسلات الهرمية لمختلف فئات المعلومات التي تشكل جزءًا من معظم هذه الأنظمة. وقال إن فهم الأسئلة حقًا يعني القدرة على فهم النية عبر مجموعة متنوعة من الفئات.

أحد الأشياء التي سمعتها من عدد من الحاضرين كانت إحصائيات تشير إلى أن حوالي 10 بالمائة من جميع عمليات البحث على الويب تتم الآن عبر عملاء المخابرات. (قال رائد AI Andrew Andrew Ng إن هذا صحيح بالنسبة للبحث الصوتي في Baidu العام الماضي ، وقال العديد من الأشخاص إن هذا صحيح الآن في Google أيضًا ، لكنني لم أسمع أي تأكيد مباشر.)

وقال ميلر من أوبوس للأبحاث إنه لا يزال هناك الكثير من العمل الذي يتعين القيام به. توفر الدقة الأساسية للأنظمة مساحة كبيرة للتحسين ، لا سيما في الانتقال من ما تقوله إلى ما تقصد به إلى ما يجب القيام به نتيجة لذلك. وذكر محادثة من الرئيس التنفيذي لشركة Xerox PARC ستيفن هوفر في المؤتمر ، الذي قال إن الأنظمة اليوم تصل إلى 90 في المائة من الدقة في فهم ما نعنيه ، ولكن 10 في المائة لا تزال مشكلة لأنه ما يتذكره معظم الناس عند التعامل مع نظام. وقال ميلر إن هناك مجالًا لتحسين التخصيص ، لأنه إذا كان النظام يعرف من يتحدث ، فيمكنه تقديم نتائج أفضل. على سبيل المثال ، أشار إلى أن Facebook يعرف من يستخدم النظام لأنك سجلت الدخول ؛ وقال أن القيام بذلك بسلاسة مع المزيد من الوكلاء سوف يصبح أكثر أهمية.

إنها بالتأكيد فئة رائعة ، وأتوقع أن نقضي جميعًا وقتًا أطول في التحدث إلى هواتفنا وأجهزة الكمبيوتر لدينا ، والتفاعل مع وكلاء ليسوا بشريين. أجد هذا أحد أكثر الاتجاهات إثارة للاهتمام في الحوسبة هذه الأيام.

المساعدون الأذكياء: ماذا بعد السيري؟