جدول المحتويات:
- كيف التعلم العميق يولد أصوات الإنسان
- إعادة صوت شخص لا صوت له
- تحقيق التوازن بين الاستخدامات السلبية لتوليفات الذكاء الاصطناعي
فيديو: من زينو نهار اليوم ØµØ Ø¹ÙŠØ¯ÙƒÙ… انشر الÙيديو Øتى يراه كل Ø§Ù„Ø (شهر نوفمبر 2024)
في عام 2017 ، سُرق مرض التصلب الجانبي الضموري (ALS) ، وهو اضطراب عصبي مدمر ، بات كوين ، مؤسس تحدي دلو الثلج الشهير ، لقدرته على الكلام.
بفضل التقدم في التعلم الآلي والتعلم العميق ، أصبحت خوارزميات الذكاء الاصطناعي جيدة جدًا في تقليد البشر. لكن على الرغم من أن العديد من التطورات البارزة في الفضاء كانت سلبية ، إلا أن قوة تقليد منظمة العفو الدولية كانت قوة تغيير إيجابي بالنسبة لكوين.
يقول أوسكار ويستردال ، مؤسس مشروع Project Revoice ، وهي مبادرة تهدف إلى مساعدة مرضى ALS مثل كوين: "معظم المصابين بمرض ALS (المعروف أيضًا باسم مرض الخلايا العصبية الحركية) مشلولون وغير قادرين على التواصل مع أي شيء سوى أصوات" الكمبيوتر "المصطنعة"..
لإعادة صوت كوين ، تعاون مشروع Revoice مع Lyrebird ، وهي واحدة من حفنة من الشركات التي تستخدم الذكاء الاصطناعي لاستنساخ صوت شخص - وهي مجموعة تضم أيضًا Google Wave Wave و Voicery ، وهي شركة ناشئة مدعومة من قبل Y Combinator تستخدم AI لإنشاء تسجيلات صوتية مركبة.
كيف التعلم العميق يولد أصوات الإنسان
وراء هذه التطبيقات ، توجد خوارزميات للتعلم العميق ، وهي فرع شائع من الذكاء الاصطناعى يطلع على مجموعات كبيرة من البيانات للرؤى والأنماط التي لا يمكن التقاطها باستخدام البرامج التقليدية القائمة على القواعد. عندما تقوم بتدريب جهاز توليف صوتي عميق التعلم مع تسجيلات صوتية كافية ، فإنه ينشئ نموذجًا رقميًا يمثل صوت الشخص ويمكنه إنشاء عينات صوتية جديدة.
قبل ظهور تقنية التوليف الصوتي المدعوم من منظمة العفو الدولية ، كان على مرضى ALS استخدام الأصوات الرقمية العامة التي لم تكن لهم. يمكن للتقنيات الأخرى أن تجمع بين الجمل المسجلة مسبقًا بصوت المريض ، ولكن النتائج كانت مصطنعة للغاية وتتطلب عشرات الساعات من التسجيلات الصوتية بحيث لا تكون ذات فائدة تذكر.
تطبيقات التعلم العميق ، من ناحية أخرى ، تتطلب بيانات أقل بكثير وتوفر نتائج أفضل. يقول ويستردال: "ما يمكن أن يحققه ليريبيرد ببضع ساعات من الصوت هو أمر رائع ، فهو يمنح الناس استنساخًا صوتيًا رقميًا كاملاً ، حتى يتمكنوا من قول ما يريدون".
إعادة صوت شخص لا صوت له
أحد حدود تطبيقات التعلم العميق هو اعتمادها على عينات بيانات عالية الجودة لتدريب شبكاتها العصبية. المشكلة مع مرضى ALS هي أنه بمجرد أن يفقدوا أصواتهم ، يصبح تسجيل عينات الصوت أمرًا مستحيلًا. لحسن الحظ ، كان لدى كوين ساعات من الكلمات الأساسية والمقابلات المسجلة.
"كان التحدي الأكبر هو الجودة. تعتمد هذه التكنولوجيا تمامًا على وجود تسجيلات متسقة وعالية الجودة تتبع أيضًا نصًا دقيقًا - لذلك اضطررنا إلى العمل مع استوديو صوتي" للتذكير "يدويًا ونسخ كل خط حوار يمكن أن نجده من بات ، "يقول Westerdal.
يقول خوسيه سوتيلو ، أحد مؤسسي Lyrebird: "كنا خائفين بعض الشيء من أننا لن نكون قادرين على توفير جودة رائعة لإنشاء صوت بات". "بما أننا لم نتمكن من الحصول على تسجيلات نظيفة ، فإن الجودة النهائية للصوت الاصطناعي ليست مثالية. نعتقد أنه يمكننا القيام بعمل أفضل بكثير من خلال تسجيلات نظيفة."
النتائج لا تزال تبدو غير طبيعية قليلا الاصطناعية. لكن بالنسبة لكوين ، الذي كان يستخدم صوتًا عامًا للتواصل ، كان الفرق كبيرًا. "بعد سماع صوتي من خلال هذه التكنولوجيا الجديدة ، كنت في مهب! لكي يعرف المرضى أنه يمكنهم الحصول على صوتهم الخاص بعد أن يزيل ALS ، فإن ذلك سيغير طريقة تعايش الناس مع ALS" ، كما يقول.
يوصي كوين بأن يسجل مرضى ALS أصواتهم قبل فوات الأوان. يقول: "بعد سماع صوتي مرة أخرى ، أحتاج إلى أن يعرف مرضى ALS أن تسجيل صوتهم مهم للغاية".
تحقيق التوازن بين الاستخدامات السلبية لتوليفات الذكاء الاصطناعي
في وقت سابق من هذا العام ، أطلق FakeApp ، وهو تطبيق مبادل للوجه مدعوم من منظمة العفو الدولية ، هجومًا هائلاً من مقاطع الفيديو الإباحية المزيفة التي تعرض المشاهير والسياسيين. هناك مخاوف من أن تطبيقات مثل FakeApp و Lyrebird ستدخل عصرًا جديدًا من الأخبار المزيفة والاحتيال والتزوير.
أقرت صفحة الأخلاقيات على موقع Lyrebird الإلكتروني سابقًا أن هذه التقنية "يمكن أن يكون لها عواقب وخيمة مثل الدبلوماسيين المضللين والاحتيال ، وبشكل أعم أي مشكلة أخرى ناتجة عن سرقة هوية شخص آخر."
ولتحقيق الهدف ، يتميز موقع الشركة الإلكتروني بالعديد من التسجيلات المركبة التي تم إنشاؤها باستخدام أصوات دونالد ترامب وباراك أوباما.
realDonaldTrump https://t.co/N6DRPdEGPT pic.twitter.com/G30DvmQNdk
- Lyrebird AI (LyrebirdAi) 4 سبتمبر ، 2017
قد تساعد قصة كوين في تسليط الضوء على الجوانب الإيجابية للصناعة التي استحوذت على الاستخدامات المخيفة وغير الأخلاقية لتطبيقاتها. "من المهم أن يدرك الناس الجانب المشرق من هذه التكنولوجيا ،" يذكر لييربيردز سوتيلو.
بصرف النظر عن الاستخدامات الطبية ، يمكن أن تخدم تطبيقات توليف الذكاء الاصطناعي الأهداف الإنتاجية الأخرى. توفر Voicery العلامات التجارية بأصوات رقمية مخصصة مدعومة بخوارزميات AI. تقوم Google أيضًا بتجربة WaveNet لتوفير تجربة أكثر طبيعية لمستخدمي أجهزتها التي تعمل بواسطة مساعد Google. تشمل المجالات الأخرى التي تكون فيها التكنولوجيا مفيدة أتمتة الكتب الصوتية أو جعل الدبلجة الصوتية في الأفلام أسهل بكثير.
لا شك أن العقبات الأخلاقية والقانونية ستستمر وستستمر المناقشات. لكن بالنسبة لكوين ، الذكاء الاصطناعى قوة من أجل الخير. يقول: "لا أريد أن أبدو مثل الكمبيوتر". "أريد أن أبدو مثلي".