بيت المميزات كيف تحاول جوجل بانوراما لإزالة السموم من الإنترنت

كيف تحاول جوجل بانوراما لإزالة السموم من الإنترنت

2024

جدول المحتويات:

منظور وسط مباريات الصراخ
بانوراما وجوجل
الذكاء الاصطناعى "خطأ وأحمق أحياناً"
ما هي درجة السمية؟
رديت الغريب Testbed
الأحكام المعقدة في النقاش عبر الإنترنت
جميع التعليقات يصلح للطباعة
داخل المشرف ، واجهة تعليقات نيويورك تايمز
"نحن لا نحل محلك مع الآلات"
يصرخ في الهاوية

فيديو: Ø¨Ø³Ù Ø§ÙÙÙ Official CLIP BISMILLAH Edition 2013 ARABE (شهر نوفمبر 2024)

يمكن أن يشعر الإنترنت وكأنه مكان سام. تنزل المتصيدون على أقسام التعليقات وخيوط التواصل الاجتماعي لإلقاء خطاب الكراهية والمضايقات ، وتحويل المناقشات التي يمكن أن تكون مفيدة إلى هجمات hominem الإعلانية وأكوام جماعية. إن إبداء الرأي عبر الإنترنت في كثير من الأحيان لا يبدو أنه يستحق الزناد الناتج.

المنصات الاجتماعية الضخمة - بما في ذلك Facebook و Twitter و YouTube - تعترف بأنها لا تستطيع مراقبة هذه المشكلات بالشكل المناسب. إنهم في سباق تسلح مع السير ، المتصيدون ، وغيرهم من غير المرغوب فيهم الذين يتسللون عبر مرشحات المحتوى. البشر ليسوا قادرين جسديا على قراءة كل تعليق على شبكة الإنترنت ؛ أولئك الذين يحاولون في كثير من الأحيان نأسف لذلك.

جرب عمالقة التقنية مجموعات مختلفة من الاعتدال البشري ، خوارزميات الذكاء الاصطناعى ، والمرشحات للخوض خلال تدفق المحتوى المتدفق عبر خلاصاتهم كل يوم. تحاول لعبة Jigsaw إيجاد حل وسط. بدأت شركة الأبجدية الفرعية والحاضنة التقنية ، المعروفة سابقًا باسم Google Ideas ، في إثبات أن التعلم الآلي (ML) الذي تم تصميمه كأدوات للمنسقين البشر يمكن أن يغير طريقة تعاملنا مع مشكلة سمية الإنترنت.

Perspective عبارة عن واجهة برمجة تطبيقات تم تطويرها بواسطة Jigsaw وفريق مكافحة إساءة استخدام Google. يستخدم ML لتحديد موقع الإساءة والتحرش عبر الإنترنت ، ويسجل التعليقات بناءً على التأثير الملحوظ الذي قد يكون له على محادثة في محاولة لجعل حياة المشرفين على البشر أكثر سهولة.

منظور وسط مباريات الصراخ

تم الإعلان عن التكنولوجيا مفتوحة المصدر لأول مرة في عام 2017 ، على الرغم من أن التطوير عليها بدأ قبل بضع سنوات. بعض المواقع الأولى التي جربت برنامج Perspective كانت منشورات إخبارية مثل نيويورك تايمز ومواقع مثل ويكيبيديا. ولكن في الآونة الأخيرة ، وجدت Perspective منزلاً على مواقع مثل Reddit ومنصة التعليقات Disqus (والتي تستخدم على PCMag.com.)

وقال سي جيه آدامز ، مدير المنتج في Perspective ، إن المشروع أراد فحص كيفية إسكات أصوات الناس عبر الإنترنت. أراد Jigsaw أن يستكشف كيف يمكن أن تؤدي الإساءة المستهدفة أو الجو العام من المضايقات إلى إحداث تأثير تقشعر له الأبدان ، مما يشجع الناس إلى الحد الذي يشعرون أنه لا يستحق الوقت أو الطاقة لإضافة صوتهم إلى المناقشة. كم عدد المرات التي رأيت فيها تغريدة أو مشاركة أو تعليقًا واخترت عدم الرد لأن قتال المتصيدون والحصول على Mad Online لا يستحق كل هذا العناء؟

وقال آدمز: "من السهل للغاية تدمير محادثة عبر الإنترنت". "من السهل القفز ، ولكن شخصًا حقيقيًا أو سامًا يمكن أن يطرد أصواتًا أخرى. ربما يقرأ 100 شخص مقالًا أو يبدأون مناقشة ، وغالبًا ما ينتهي بك الأمر بأعلى الأصوات في الغرفة كونهم الوحيدين المتبقيين ، في الإنترنت الذي تم تحسينه من أجل الإعجابات والمشاركات ، لذا فأنت صامتة كل هذه الأصوات ، ثم ما الذي يعرّف النقاش هو أعلى صوت في الغرفة - مباراة الصراخ ".

بانوراما وجوجل

لقد كانت سنة قاسية بالنسبة لشركة Google ، الشقيقة Jigsaw ، التي عانت من مشاكل أمان البيانات ، وردود الموظفين على مشاركتها في مشاريع البنتاغون والصين ، والكشف عن كيفية تعاملها مع التحرش الجنسي. ناهيك عن جلسة استماع مثيرة للجدل في الكونجرس ، استجابت فيها نواب الرئيس التنفيذي ساندار بيشاي للمشرعين.

أكثر في Jigsaw ، حاضنة الإيثار الإيثار ، كانت الأمور أقل إثارة بعض الشيء. قضى الفريق وقته في دراسة المزيد من أشكال الرقابة التقنية ، مثل تسمم DNS من خلال تطبيق Intra وهجمات DDoS باستخدام Project Shield. مع المنظور ، الهدف أكثر تجريدًا. بدلاً من استخدام التعلم الآلي لتحديد ما هو أو لا يعارض مجموعة معينة من القواعد ، يعتبر تحدي المنظور تحديًا شخصيًا مكثفًا: تصنيف التأثير العاطفي للغة.

للقيام بذلك ، تحتاج إلى معالجة اللغة الطبيعية (NLP) ، التي تقسم الجملة إلى اكتشاف الأنماط. يواجه فريق Perspective مشاكل مثل تحيز التأكيد ، والتفكير الجماعي ، والمضايقة في السلوك في بيئة ضاعفت فيها التكنولوجيا من مدى وصولها وجعلت حلها أكثر صعوبة.

الذكاء الاصطناعى "خطأ وأحمق أحياناً"

إن تحسين المحادثات عبر الإنترنت من خلال التعلم الآلي ليس مهمة بسيطة. لا يزال مجال البحوث الناشئة. يمكن أن تكون الخوارزميات منحازة ، وأنظمة التعلم الآلي تتطلب صقلًا لا نهاية له ، ولا تزال المشكلات الصعبة والأكثر أهمية غير مستكشفة إلى حد كبير.

بدأت مجموعة أبحاث Conversation AI ، التي أنشأت المنظور ، بالاجتماع مع الصحف والناشرين والمواقع الأخرى التي تستضيف المحادثات. كانت بعض المواقع الأولى التي جربت هذه التقنية هي New York Times و Wikipedia و The Guardian و The Economist .

في عام 2017 ، فتح الفريق العرض التوضيحي الأولي للمنظور عبر موقع إلكتروني عام كجزء من اختبار ألفا ، مما أتاح للناس كتابة ملايين التعليقات الدنيئة والمسيئة في الموقع. لقد كان نوعًا من التجربة الفاشلة مثل تجربة Tay chatbot الفاشلة من مايكروسوفت ، إلا أنه بدلاً من خداع الروبوت في الرد على التغريدات العنصرية ، استخدم Jigsaw الفوعة التعهيدية الجماهيرية كبيانات تدريب لإطعام نماذجها ، مما يساعد على تحديد أنواع مختلفة من الإساءة عبر الإنترنت وتصنيفها.

لم تشغيل الاختبار العام الأولي بسلاسة. أوضحت "Wrolls عبر أمريكا" Wired التي حطمت السمية في التعليق في جميع أنحاء البلاد استنادًا إلى سجل المنظور ، كيف تميزت الخوارزمية عن غير قصد ضد المجموعات حسب العرق أو الهوية الجنسية أو الميل الجنسي.

كان آدمز صريحًا بشأن حقيقة أن الاختبار الأولي للمنظور كشف النقاب عن النقاط الرئيسية العمياء والتحيز الحسابي. مثل أداة تجنيد الأمازون التي ألغيت ، والتي دربت على عقود من بيانات الوظائف المعيبة وطورت تحيزًا كامنًا ضد المتقدمات ، كانت نماذج المنظور المبكرة تعاني من عيوب صارخة بسبب البيانات التي تم تدريبها عليها.

"في مثال المجموعات المستهدفة بشكل متكرر ، إذا نظرت إلى التوزيع عبر التعليقات في مجموعة بيانات التدريب ، كان هناك عدد صغير من التعليقات التي تضمنت كلمة" مثلي الجنس "أو" النسوية "وكانت تستخدمها بشكل إيجابي "، وأوضح آدمز. "تستخدم التعليقات المسيئة الكلمات كإهانات. لذا فإن ML ، عند النظر إلى الأنماط ، قد يقول ،" مهلاً ، وجود هذه الكلمة يعد مؤشراً جيدًا على ما إذا كانت هذه المشاعر سامة أم لا."

على سبيل المثال ، قد تكون خوارزمية ألفا قد صنفت عن طريق الخطأ عبارات مثل "أنا رجل مثلي الجنس فخور" ، أو "أنا نسوية ومتحول جنسيًا" مع درجات سمية عالية. لكن أدامز قال إن عملية التدريب الشفافة العلنية - رغم كونها مؤلمة - كانت درسًا لا يقدر بثمن بالنسبة إلى بانوراما في عواقب التحيز غير المقصود.

عند تدريب نماذج للتعلم الآلي على شيء مؤلم وشخصي مثل الإساءة والتحرش عبر الإنترنت ، فإن وجود التحيز الحسابي يؤكد أيضًا على أن الذكاء الاصطناعي وحده ليس هو الحل. قامت الشركات الاجتماعية مثل Facebook و YouTube بترويج ميزات تعديل محتوى الذكاء الاصطناعي في منصاتها فقط للتراجع وسط الفضيحة وتصحيح المسار من خلال التعاقد مع الآلاف من المشرفين على البشر.

تيك بانوراما هي مزيج من الاثنين. المنظور ليس اتخاذ خوارزميات الذكاء الاصطناعي القرارات في فراغ ؛ تم دمج واجهة برمجة التطبيقات (API) في واجهات إدارة المجتمع والمحتوى ، لتكون بمثابة أداة مساعدة للمشرفين الإنسانين. يصف المهندسون المنظورون خطاب الكراهية المعتدل باستخدام ML وبدونه باستخدام تشبيه لقش الكومة: تساعد الذكاء الاصطناعي من خلال أتمتة عملية الفرز ، وتقليص أكوام التبن الواسعة مع الاستمرار في إعطاء البشر القول الفصل حول ما إذا كان التعليق يعتبر مسيئًا أو مضايقًا.

وقال أدامز "إنها هذه القدرة الجديدة لشركة إم إل". "يتحدث الناس عن مدى ذكاء الذكاء الاصطناعي ، لكنهم لا يتحدثون في كثير من الأحيان عن جميع الطرق التي يكون بها خطأ وغبياء في بعض الأحيان. منذ البداية ، كنا نعلم أن هذا سوف يرتكب الكثير من الأخطاء ، لذلك قلنا ،" هذا أداة مفيدة للاعتدال البشري بمساعدة الآلة ، لكنها ليست مستعدة لاتخاذ قرارات تلقائية. ولكن قد يستغرق الأمر مشكلة "الإبرة في كومة قش" في العثور على هذا الخطاب السام والوصول به إلى حفنة من القش."

ما هي درجة السمية؟

الجانب الأكثر إثارة للانقسام في نمذجة المنظور هو وضع الأرقام لمتغير شخصي مثل "السمية". أول ما أشار إليه آدمز هو أن درجات المنظور هي مؤشر على الاحتمال ، وليس الشدة. تمثل الأرقام الأعلى احتمالًا أكبر لأن الأنماط الموجودة في النص تشبه الأنماط في التعليقات التي وصفها الأشخاص بأنها سامة.

أما بالنسبة لما يعنيه فعليًا "السامة" ، فإن فريق Perspective يعرّفه على نطاق واسع على أنه "تعليق فظ أو غير محترم أو غير معقول من المحتمل أن يجعلك تترك مناقشة". ولكن كيف يمكن أن تظهر هذه الخفية. في عام 2018 ، تعاونت Jigsaw مع مختبر رودس للذكاء الاصطناعي (RAIL) لتطوير نماذج ML التي يمكن أن تلتقط أشكالًا غامضة أكثر من خطاب التهديد أو البغيض ، مثل تعليق رافض أو متهكم أو ساخر ليس عدائيًا بشكل مفتوح.

حتى هذه المرحلة ، تم تدريب معظم موديلات Perspective من خلال مطالبة الناس بتقييم تعليقات الإنترنت على مقياس من "سام للغاية" إلى "صحي للغاية". يمكن للمطورين بعد ذلك معايرة النموذج للإشارة إلى التعليقات أعلى من عتبة معينة ، من 0.0 إلى 1.0. تشير درجة أعلى من 0.9 إلى احتمال كبير للتسمم ، والنتيجة 0.5 أو أقل تعني درجة أقل بكثير من اليقين الحسابي. يستخدم المنظور أيضًا ما يسمى تطبيع الدرجات ، والذي يمنح المطورين خطًا أساسيًا ثابتًا يمكن من خلاله تفسير النتائج. أوضح آدمز أنه بناءً على المنتدى أو الموقع ، يمكن للمطورين مزج النماذج ومطابقتها. لذلك عندما لا يمانع المجتمع الألفاظ النابية ، يمكن تقدير هذه السمة.

أظهر لي آدمز واجهة تعديل تجريبي متكاملة مع API المنظور. في لوحة المشرف ، بجانب خيارات فرز التعليقات حسب الأعلى ، الأحدث ، وهلم جرا ، يوجد رمز إشارة صغير للترتيب حسب السمية. هناك أيضًا آلية مضمنة لتعليقات المشرف البشري لإخبار المنظور بأنه سجل تعليقًا بشكل غير صحيح وتحسين النموذج بمرور الوقت.

لقد نقر من خلال واجهة العرض التوضيحي من أجل الإشراف على تعليقات صفحة ويكيبيديا نقاش التي سجلتها نماذج مختلفة للمنظور ، ورسم بياني للرسم البياني يوضح التعليقات التي من المحتمل أن تكون هجومًا على مؤلف صفحة أو هجومًا على معلق آخر.

وقال آدمز: "نريد أن نبني أدوات للاعتدال بمساعدة الآلة للإشارة إلى الأشياء التي يجب على الإنسان مراجعتها ، لكننا لا نريد بعض التعريف المركزي أو أن يقول شخص ما ما هو جيد وسيئ". "لذا ، إذا قمت بالفرز حسب السمية ، فسترى أن التعليقات تأتي إلى الأعلى. ولكن إذا كنت تهتم أكثر ، دعنا نقول ، هجمات الهوية أو التهديدات أكثر من المقاييس مثل الشتائم ، ربما لن تستخدم نموذجًا سمية عامًا. هذه هي المكونات التي يمكنك مزجها. نحن نقدم هذه ، والمطورين وزنها ".

تأخذ تجربة RAIL مقاربة أكثر تفصيلاً. يقوم طلاب الدراسات العليا في أوكسفورد ببناء مجموعة بيانات من عشرات الآلاف من التعليقات من قسم تعليقات جريدة غلوب آند ميل الكندية وصفحات ويكيبيديا نقاش. إنهم يطلبون من "الشروحين" من البشر الإجابة عن أسئلة حول كل تعليق يتعلق بخمسة سمات فرعية من "محتوى غير صحي": معاداة أو إهانات (المتصيدون) ، التعميمات المرفوضة أو المتعارضة أو الراعية ، التعسفية ، وغير العادلة.

كشف ظهور هذه الصفات الأكثر ذكاءً عن مشكلات معقدة جديدة مع الانحياز غير المقصود تجاه مجموعات محددة وإيجابيات خاطئة مع تعليقات ساخرة. إنها جزء من آلام الذكاء الاصطناعى المتنامية ، وتغذي النماذج المزيد والمزيد من البيانات لمساعدتها على فهم المعاني الضمنية غير المباشرة وراء خطاب الإنسان. لا يزال الفريق يتدفق ويعلق على آلاف التعليقات ، ويعتزم إصدار مجموعة البيانات النهائية مطلع هذا العام.

وقال آدمز: "ما نريد العمل من أجله هو شيء يمكن للمجتمع أن يسجل فيه مجموعة من التعليقات ، ومن ثم يمكننا أن نجعلها مزيجًا مخصصًا لنماذج المنظور لتتناسب".

رديت الغريب Testbed

رديت هو نموذج مصغر لكل شيء جيد ورهيب عن الإنترنت. هناك مجتمع subreddit لكل موضوع واهتمام غريب ، غريب يمكنك التفكير فيه. Jigsaw لا يعمل مع Reddit على مستوى الشركة ، ولكن أحد الأماكن الأكثر إثارة للاهتمام التي يتم فيها اختبار الاعتدال في منظور المنظور هو وضع رباط فرعي يسمى r / changemyview.

والمثير للدهشة أن هناك زوايا للإنترنت حيث لا يزال النقاش والمناقشة حقيقيين. تغيير طريقة العرض الخاصة بي ، أو CMV ، لا يشبه معظم النماذج الفرعية الأخرى. الفكرة هي نشر الرأي الذي تقبله قد يكون معيبًا أو منفتحًا على التغيير ، ثم الاستماع إلى وجهات نظر أخرى وفهمها لمعرفة ما إذا كان بإمكانهم تغيير رأيك بشأن مسألة ما. تتراوح المواضيع بين المواضيع الدنيوية مثل ترتيب العرض المناسب لأفلام حرب النجوم إلى مناقشات جادة حول قضايا تشمل العنصرية والسياسة والسيطرة على الأسلحة والدين.

يعد Change My View اختبارًا مثيرًا للاهتمام لـ Perspective نظرًا لأن subreddit يحتوي على مجموعة مفصلة من القواعد الخاصة ببدء المحادثات وإدارتها التي تحرض على المناقشة والجدل الساخن حسب التصميم. كال تيرنبول ، الذي يذهب من خلال u / Snorrrlax على رديت ، هو أحد مؤسسي r / changemyview. أخبر تيرنبول PCMag أن API المنظور يصطف بشكل جيد مع القاعدة الفرعية 2 ، والتي تحظر بشكل أساسي الكلام الغاشم أو العدائي.

وقال تيرنبول ، الذي يتخذ من اسكتلندا مقراً له: "يبدو الأمر كقاعدة بسيطة ، لكن هناك الكثير من الأهمية بالنسبة إليه". "من الصعب أتمتة هذه القاعدة دون أن تكون ذكيًا في اللغة. يمنحك Reddit هذا الشيء المسمى AutoModerator ، حيث يمكنك إعداد المرشحات والكلمات الرئيسية لوضع العلامات. ولكن هناك الكثير من الإيجابيات الخاطئة ، وقد يكون من الصعب للغاية ملاحظتها ، لأن شخصًا ما يمكنه قول كلمة سيئة دون إهانة شخص ما ، كما يمكنه إهانة شخص ما دون استخدام أي كلمات سيئة ".

وصل Jigsaw إلى Turnbull في مارس 2018. بدأ التعاون مع القاعدة 2 ، ولكن سرعان ما قام الفريق ببناء نماذج المنظور لقواعد أخرى أيضًا. إنها ليست تكاملًا كاملًا لواجهة برمجة تطبيقات Perspective API ذات المصدر المفتوح ، بل هي روبوت رديت يتيح للمشرفين الإبلاغ عن التعليقات المسجلة أعلى من سمية معينة.

على مدار السنوات الست الماضية ، كانت تقوم Turnbull وغيرها من برامج التعديل بإجراء كل هذا يدويًا من قائمة انتظار تقارير AutoModerator (الكلمات الرئيسية ذات العلامات) وتقارير المستخدم. استخدمت Jigsaw سنوات من ملاحظات انتهاك القواعد من المشرفين ، والتي قاموا بتتبعها من خلال امتداد المتصفح ، وصممت نماذج Perspective بناءً على تلك البيانات مع بعض نماذج السمية الحالية في Perspective. خلال عام 2018 ، قدمت تعديلات CMV ملاحظات حول قضايا مثل الإيجابيات الزائفة الزائدة ، وقامت Jigsaw بتعديل نقاط التسجيل مع الاستمرار في تصميم المزيد من قواعد CMV.

الأحكام المعقدة في النقاش عبر الإنترنت

(تم دمج بوت المنظور في واجهة مشرف Reddit.)

المنظور ليس حيا لجميع اعتدال حكم subreddit. بعض القواعد الأكثر تعقيدًا أو التجريدية لا تزال خارج نطاق ما يمكن لهذا النوع من ML فهمه.

القاعدة 4 ، على سبيل المثال ، تحكم نظام نقاط دلتا الفرعية ، في حين تمنع القاعدة ب المستخدمين من لعب داعية الشيطان أو استخدام منشور "لتلميع الصابون". الاعتدال الدقيق مثل هذا يتطلب بيانات سياقية وفهمًا إنسانياً عاديًا ، لمعرفة ما إذا كان شخص ما يجادل في نقطة لأسباب حقيقية أو مجرد التصيد.

في المستقبل المنظور ، سنظل بحاجة إلى تعديلات بشرية. سيناريوهات الحكم الأكثر تعقيدًا هذه هي حيث بدأ مشرفو CMV في رؤية الشقوق في نمذجة الذكاء الاصطناعي ، ويمكن أن تحدد الأتمتة الأكثر ذكاء ما إذا كان كل هذا قابلاً للتطوير أم لا.

وقال تيرنبول: "أعتقد أن سبب تعقيد هذا هو أنه مزيج من حكمنا على منشأهم الأصلي وتفاعلاتهم طوال المحادثة بأكملها. لذلك ليس مجرد تعليق واحد يطلق نموذجًا". "إذا كانت الحجة تسير للأمام والخلف ، وفي النهاية هي تعليق يقول" شكرًا لك "أو" شكر "، ندعه يذهب حتى لو تم كسر قاعدة في وقت سابق في الخيط. أو مزحة خفيفة القلب في السياق قد يبدو وقحًا - إنه شيء بشري صغير لطيف ، وهذا شيء لا يحصل عليه الروبوت حتى الآن."

يعد Change My View البديل الوحيد الذي يستخدم نماذج Perspective ML للاعتدال في الوقت الحالي ، على الرغم من أن Adams قال إن الفريق تلقى طلبات وصول من عدة جهات أخرى. مجموعة القواعد المحددة من CMV جعلتها حالة اختبار مثالية ، ولكن نماذج المنظور قابلة للطرق ؛ يمكن للطرز الفرعية الفردية تخصيص خوارزمية تسجيل النتائج لتتوافق مع إرشادات مجتمعهم.

وقال إن الخطوة التالية لـ Turnbull هي إزالة CMV من Reddit لأن المجتمع يتفوق عليها. على مدار الأشهر الستة الماضية ، كانت الشركات الناشئة المشكَّلة حديثًا تعمل مع Jigsaw على موقع مخصص يتمتع بوظائف أعمق من واجهة وزارة الدفاع Reddit والبوتات التي يمكن أن توفرها.

لا يزال المشروع في اختبار ألفا فقط ، ولكن تحدثت Turnbull عن ميزات مثل التنبيهات الاستباقية عندما يكتب المستخدم تعليقًا قد ينتهك القاعدة ، والإبلاغ المضمن لمنح المشرفين المزيد من السياق ، والبيانات التاريخية لاتخاذ القرارات. أكد تيرنبول أنه لا توجد أي خطط لإغلاق أو ترحيل الباطن ، لكنه متحمس للتجربة الجديدة.

جميع التعليقات يصلح للطباعة

بناءً على يوم الأسبوع ، يحصل موقع New York Times على الإنترنت من 12000 إلى أكثر من 18000 تعليق. حتى منتصف عام 2017 ، تم الإشراف على أقسام التعليقات في الصحيفة من قبل موظفي إدارة المجتمع بدوام كامل الذين قرأوا كل تعليق وقرروا الموافقة عليه أو رفضه.

باسي إيتيم ، الذي كان حتى هذا الشهر رئيس تحرير المجتمع لصحيفة التايمز ، أمضى عشر سنوات في مكتب المجتمع وكان رئيس تحريره منذ عام 2014. في ذروة يوم من أيام الأسبوع ، قد يكون لدى الفريق عدد قليل من الأشخاص الذين يديرون تعليقاتهم على قصص الرأي في حين أن آخرين تناولت الأخبار. تم تقسيم جدول البيانات وتعقب المسؤوليات المختلفة ، ولكن تم تعيين فريق مؤلف من قرابة 12 شخصًا بشكل دائم أو تم نقلهم استنادًا إلى أهم الأخبار في الوقت الحالي. كما قاموا بتغذية الحكايات من التعليقات مرة أخرى إلى المراسلين لتغذية الأعلاف المحتملة.

في النهاية ، أصبح من الواضح أن هذا كان أكثر من 12 شخصًا يستطيعون التعامل معه. سيتعين إغلاق أقسام التعليقات على القصص بعد الوصول إلى أقصى عدد ممكن من التعليقات التي يمكن للفريق تعديلها.

كانت مجموعة تطوير جمهور الصحيفة قد جربت بالفعل التعلم الآلي للحصول على الموافقات الأساسية والتعليقات الواضحة ، لكن إيتيم قال إنها ليست ذكية ولا قابلة للتخصيص بشكل خاص. أعلنت The Times لأول مرة عن شراكتها مع Jigsaw في سبتمبر 2016. ومنذ ذلك الحين ، توسعت أقسام تعليقاتها من الظهور في أقل من 10 بالمائة من جميع القصص إلى حوالي 30 بالمائة اليوم وتسلقها.

من وجهة نظر Jigsaw ، شهدت الحاضنة الفرصة لتزويد Perspective ببيانات مجهولة المصدر من ملايين التعليقات يوميًا ، ويديرها مهنيون قد يساعدون في تحسين العملية. في مقابل الحصول على بيانات تدريب ML مجهولة الهوية ، عملت Jigsaw و Times معًا لبناء منصة تسمى Moderator ، والتي تم نشرها في يونيو 2017.

داخل المشرف ، واجهة تعليقات نيويورك تايمز

(الصورة من نيويورك تايمز )

يجمع Moderator بين طرازات Perspective مع أكثر من 16 مليون تعليقًا مضيفًا ومجهول الهوية تعود إلى عام 2007.

ما يراه فريق المجتمع فعليًا في واجهة Moderator عبارة عن لوحة معلومات بها مخطط مدرج تكراري تفاعلي يصور تفصيل التعليقات فوق حد معين. يمكنهم سحب شريط التمرير ذهابًا وإيابًا ، على سبيل المثال ، للموافقة تلقائيًا على جميع التعليقات بدرجة تقييم من 0 إلى 20 بالمائة فقط ، والتي تستند إلى مزيج من إمكانات التعليق على الفحش والسمية واحتمال الرفض. هناك أزرار تعديل سريعة أدناه للموافقة على تعليق أو رفضه ، أو تأجيله ، أو وضع علامة على التعليق ، لمواصلة تحسين نمذجة المنظور.

وقال إيتيم: "بالنسبة لكل قسم من أقسام الموقع ، قمنا بتحليل التعليقات الواردة والطريقة التي سيصنف بها المنظور بها. لقد استخدمنا كلا من نماذج المنظور العامة ونماذجنا الفريدة لصحيفة نيويورك تايمز ". "أود أن أحلل التعليقات من كل قسم وأحاول أن أجد نقطة النهاية حيث سنكون مرتاحين للقول ،" حسناً ، كل شيء فوق هذا الاحتمال باستخدام علامات التسمم المحددة هذه ، مثل الفحش على سبيل المثال ، سنوافق."

قال إيتيم إن التعلم الآلي يوافق على نسبة صغيرة نسبياً من التعليقات (حوالي 25 بالمائة أو نحو ذلك) ، حيث تعمل التايمز على نشر التعليقات على المزيد من القصص وحتى في النهاية لتخصيص كيفية تصفية النماذج والموافقة على تعليقات أقسام مختلفة من الموقع. النماذج توافق فقط على التعليقات ؛ لا يزال يتم التعامل مع الرفض بالكامل من قبل المشرفين الإنسان.

لقد ولت تلك المقطوعات اليدوية للتعليق. وقال إيتيم إن التعليقات تغلق عادةً على قصة ما بعد 24 ساعة من نشرها على الإنترنت أو في اليوم التالي للنشر مطبوعًا.

"نحن لا نحل محلك مع الآلات"

المرحلة التالية هي بناء المزيد من الميزات في النظام لمساعدة المشرفين على إعطاء الأولوية للتعليقات التي يجب النظر إليها أولاً. على نحو متزايد ، فإن أتمتة ما كان دائمًا عملية يدوية قد مكّن المشرفين على قضاء بعض الوقت بشكل استباقي مع المراسلين للرد على التعليقات. تم إنشاء حلقة تغذية مرتدة حيث تؤدي التعليقات إلى متابعة التقارير وقصص إضافية - يمكنها توفير الموارد وإعادة تخصيصها لإنشاء المزيد من الصحافة.

وقال إيتيم: "لقد جعل المنسق والمنظور التايمز أكثر استجابة لمخاوف القراء ، لأن لدينا الموارد اللازمة للقيام بذلك ، سواء كان ذلك من خلال كتابة القصص بأنفسنا أو العمل مع الصحفيين لمعرفة القصص". "الشيء الممتع في هذا المشروع هو أننا لم نستبعد أي شخص. نحن لا نستبدلكم بالآلات. نحن ببساطة نستخدم البشر الذين لدينا أكثر كفاءة ونتخذ قرارات صعبة حقًا."

الورقة مفتوحة للعمل مع المنشورات الأخرى لمساعدة بقية الصناعة على تطبيق هذا النوع من التكنولوجيا. يمكن أن يساعد منافذ الأخبار المحلية بموارد محدودة في الاحتفاظ بأقسام التعليقات دون وجود طاقم كبير مخصص واستخدام التعليقات كما تفعل التايمز ، للعثور على العملاء المحتملين وتأجيج الصحافة الشعبية.

شبّه إيتيم الاعتدال بمساعدة الذكاء الاصطناعي بإعطاء المزارع محراثًا ميكانيكيًا مقابل الأشياء بأسمائها الحقيقية. يمكنك القيام بالمهمة بشكل أفضل مع المحراث.

وقال "إذا كان بإمكان المنظور أن يتطور بالطريقة الصحيحة ، فيمكنه ، على أمل ، إنشاء مجموعة من الإرشادات على الأقل قابلة للتكرار في منافذ البيع الصغيرة". "إنها لعبة طويلة ، لكننا أنشأنا بالفعل الكثير من الأساس لتكون جزءًا من تجربة القارئ. ثم قد يكون لهذه الصحف المحلية تعليقات مرة أخرى وتأسيس رأس شاطئ صغير ضد اللاعبين الاجتماعيين الرئيسيين."

يصرخ في الهاوية

في هذه المرحلة ، شاهد معظمنا أشخاصًا يهاجمون أو يتحرشون على وسائل التواصل الاجتماعي للتعبير عن رأيهم. لا أحد يريد أن يحدث لهم ، باستثناء المتصيدون الذين يزدهرون في هذا النوع من الأشياء. لقد تعلمنا أن الصراخ على شخص غريب لن يستمع أبدًا إلى حجة عقلانية يعد استخدامًا مفيدًا لوقتنا.

تحاول Perspective رفع هذه الديناميكية ، لكن CJ Adams قال إن الهدف الأوسع هو نشر البيانات والبحث ونماذج UX مفتوحة المصدر الجديدة لإنشاء هياكل جديدة للمحادثة - مهمة شاقة. إن جعل الإنترنت مكانًا صحيًا يستحق وقت الناس يعني توسيع نطاق هذه الأنظمة إلى ما وراء أقسام التعليقات الإخبارية والبيانات الفرعية. في النهاية ، يجب أن تكون أدوات AI قادرة على التعامل مع التطبيقات والشبكات الاجتماعية الهائلة التي تهيمن على تفاعلاتنا الرقمية اليومية.

إذا وضعنا جانباً ما يفعله Facebook و Twitter وعمالقة اجتماعية أخرى داخليًا ، فإن الطريقة الأكثر مباشرة لتحقيق ذلك هي نقل التكنولوجيا من المشرفين إلى المستخدمين أنفسهم. أشار آدامز إلى مشروع كورال للحصول على فكرة عن الشكل الذي قد يبدو عليه.

تأسس مشروع كورال في البداية كتعاون بين مؤسسة موزيلا ونيويورك تايمز وواشنطن بوست. تبني كورال أدوات مفتوحة المصدر مثل منصة Talk لتشجيع النقاش عبر الإنترنت وإعطاء مواقع الأخبار بديلاً لإغلاق أقسام التعليقات. تعمل Talk حاليًا على تشغيل المنصات لما يقرب من 50 ناشراً عبر الإنترنت ، بما في ذلك Post و New York Magazine و The Wall Street Journal و The Intercept.

في وقت سابق من هذا الشهر ، حصلت Vox Media على مشروع Coral من مؤسسة Mozilla. وهي تخطط "لدمجها" بعمق في كورس ، ونظام إدارة المحتوى ورواية القصص.

وقال آدمز إن Perspective يحتوي على مكون إضافي لمشروع Coral Project يستخدم نفس التقنية الأساسية - درجات السمية والعتبات المستندة إلى ML - لإعطاء المستخدمين اقتراحات استباقية أثناء الكتابة. لذلك عندما يكتب المستخدم تعليقًا يحتوي على عبارات يُشار إليها على أنها إساءة أو مضايقة ، قد ينبثق إشعار للمستخدم يقول: "قبل نشر هذا ، تأكد من تذكر إرشادات المنتدى" أو "اللغة في هذا التعليق قد تنتهك إرشادات المجتمع. سيقوم فريق الإشراف لدينا بمراجعتها قريبًا."

وقال أدامز: "إن هذه الضجة الصغيرة يمكن أن تساعد الناس على أخذ تلك الثانية في التفكير ، ولكنها أيضًا لا تمنع أي شخص". "إنها لا توقف النقاش."

إنها آلية تم دمج منصات الدردشة والدفق عبر ألعاب الفيديو فيها لإيقاف الإساءة والتحرش. يمكن لمستخدمي Twitter الاستفادة بوضوح من مثل هذا النظام أيضًا.

إنه يتحدث عن فكرة أن عالِم أبحاث معهد ماساتشوستس للتكنولوجيا أندرو ليبمان طرح في قضية PCMag المستقبلية: تحدث عن آليات مدمجة من شأنها أن تسمح للناس بالتوقف والتفكير قبل أن يتشاركوا في شيء ما عبر الإنترنت ، للمساعدة في وقف انتشار المعلومات الخاطئة. ينطبق المفهوم على المناقشة عبر الإنترنت أيضًا. لقد أنشأنا أنظمة اتصالات خالية من الاحتكاك وقادرة على تضخيم الوصول إلى بيان بشكل كبير في لحظة ، ولكن في بعض الأحيان قد يكون الاحتكاك القليل أمرًا جيدًا ، على حد تعبير ليبمان.

المنظور لا يتعلق باستخدام الذكاء الاصطناعي كحل شامل. إنها طريقة لصياغة نماذج ML في أدوات للبشر لمساعدتهم في تنظيم تجاربهم الخاصة. ولكن النقطة المقابلة هي أنه إذا قمت بتسهيل الأمر على الناس لضبط الضوضاء التي لا يحبونها على الإنترنت ، فسيصبح الإنترنت أكثر من غرفة صدى أكبر مما هو عليه بالفعل.

ولدى سؤاله عما إذا كانت أدوات مثل Perspective قد تؤدي إلى تفاقم هذا الأمر في نهاية المطاف ، قال آدمز إنه يعتقد أن غرف الصدى على الإنترنت موجودة لأنه لا توجد آليات لاستضافة مناقشة يمكن للناس أن يختلفوا بشأنها.

وقال "الطريق الأقل مقاومة هو" هؤلاء الناس يقاتلون. دعونا ندعهم يتفقون مع أنفسهم في زواياهم. دعوا الناس صومعة أنفسهم ". "أنت تدع الناس يصرخون أي شخص آخر خارج الغرفة ، أو تغلق المناقشة. نريد أن ينشئ المنظور خيارًا ثالثًا."

وضعت آدمز سيناريو العينة. إذا سألت غرفة تضم 1000 شخص ، "كم منكم قرأ شيئًا اليوم تهتم به حقًا؟" يشير معظم مستخدمي الإنترنت إلى مقال أو تغريدة أو منشور أو أي شيء يقرؤونه عبر الإنترنت. لكن إذا سألتهم ، "كم منكم اعتقد أن الأمر يستحق وقتك للتعليق عليه أو إجراء مناقشة؟" جميع الأيدي في الغرفة سوف تنخفض.

"بالنسبة للكثيرين منا ، لا يستحق هذا الجهد. هيكل المناقشة الذي لدينا الآن يعني فقط أنه مسؤولية. إذا كان لديك فكرة معقولة حالية أو شيء تريد مشاركته ، بالنسبة لمعظم الناس ، فإنهم لا يفعلون ذلك" قال آدمز: "أريد المشاركة". "هذا يعني أنه من بين 1000 شخص يمكن أن يكونوا في القاعة ، لديك فقط حفنة ممثلة في المناقشة ؛ دعنا نقول 10 أشخاص. لدي إيمان عميق بأننا نستطيع بناء هيكل يتيح لهذا 990 آخرين العودة إلى المناقشة ويفعل ذلك بطريقة يجدونها تستحق وقتهم ".