بيت التفكير إلى الأمام رقائق ساخنة: التعلم الآلي يأخذ مركز الصدارة

رقائق ساخنة: التعلم الآلي يأخذ مركز الصدارة

2024

فيديو: Ø¹Ù†Ø¯Ù…Ø§ Ø¨ÙƒÙ‰ Ø§Ù„Ø´ÙŠØ® Ø¹Ø¨Ø¯ Ø§Ù„Ø¨Ø§Ø³Ø· Ø¹Ø¨Ø¯ Ø§Ù„ØµÙ…Ø¯ Ù…Ù‚Ø·Ø¹ Ø³ÙŠÙ‡Ø² Ù‚Ù„Ø¨Ùƒ (شهر نوفمبر 2024)

فيديو: Ø¹Ù†Ø¯Ù…Ø§ Ø¨ÙƒÙ‰ Ø§Ù„Ø´ÙŠØ® Ø¹Ø¨Ø¯ Ø§Ù„Ø¨Ø§Ø³Ø· Ø¹Ø¨Ø¯ Ø§Ù„ØµÙ…Ø¯ Ù…Ù‚Ø·Ø¹ Ø³ÙŠÙ‡Ø² Ù‚Ù„Ø¨Ùƒ (شهر نوفمبر 2024)

إن أهم موضوع في الحوسبة هذه الأيام هو التعلم الآلي ، وهذا بالتأكيد مرئي على جانب الأجهزة. في الأسابيع الأخيرة ، سمعنا الكثير عن الرقائق الجديدة المصممة للتعلم العميق ، بدءًا من Tesla P100 من Nvidia و Drive PX 2 ووحدات معالجة Tensor من Google إلى Xeon Phi من Intel. لذلك ، ليس من المستغرب أن نسمع في مؤتمر Hot Chips الأسبوع الماضي من عدد من الشركات المختلفة مع بعض الأساليب المختلفة جدًا للتصميم المصممة لتعلم الآلة ومعالجة الرؤية.

ربما كان الخبر الأكبر هو الكشف عن Nvidia لمزيد من التفاصيل حول رقاقة Parker ، المستخدمة في وحدة Drive PX 2 الخاصة بها للسيارات ذاتية القيادة وتهدف إلى التعلم العميق لآلات الحكم الذاتي. تستخدم هذه الشريحة نواة وحدة دنفر CPU متوافقة مع ARM ، وأربعة نوى ARM Cortex-A57 ، و 256 من مصطلحات Nvidia Pascal CUDA (الرسومات).

وقال نفيديا إن هذه كانت أول شريحة مصممة ومصنفة للاستخدام في السيارات ، مع ميزات مرونة خاصة ، وتحدثت عن سرعتها وذاكرتها بشكل أسرع ، مشيرة إلى أن قلب دنفر يوفر تحسنا ملحوظا في الأداء لكل واط. من بين الميزات الجديدة ، المحاكاة الافتراضية المدعومة بالأجهزة ، مع ما يصل إلى 8 VMS لتمكين دمج ميزات السيارة التي تتم تقليديًا على أجهزة كمبيوتر منفصلة. بشكل عام ، قالت الشركة إن طراز Drive PX 2 يمكن أن يحتوي على اثنين من رقائق Parker واثنين من وحدات معالجة الرسومات المنفصلة ، مع أداء إجمالي يبلغ 8 teraflops (الدقة المزدوجة) أو 24 عملية تعلم عميقة (8 بت أو نصف دقة.) أدرجت الشركة معايير لمقارنتها بشكل إيجابي مع المعالجة الحالية للهاتف المحمول باستخدام SpecInt_2000 ، وهو معيار قديم نسبيًا. لكن الأداء يبدو رائعًا ، وقد صرحت شركة فولفو مؤخرًا بأنها ستستخدمه لاختبار السيارات المستقلة التي تبدأ العام المقبل.

بالطبع ، هناك العديد من الأساليب الأخرى.

ناقش DeePhi للشركات الناشئة الصينية منصة قائمة على الشبكات FPGA للشبكات العصبية ، مع بنائين مختلفين يعتمدان على نوع الشبكة المعنية. تم تصميم Aristotle للشبكات العصبية التلافيفية الصغيرة نسبيًا واستناداً إلى Xilinx Zynq 7000 ، بينما تم تصميم ديكارت للشبكات العصبية المتكررة الأكبر التي تستخدم ذاكرة طويلة المدى (RNN-LSTM) ، استنادًا إلى Kintex Ultrascale FPGA. تدعي DeePhi أن برنامج التحويل البرمجي والعمارة يقلل وقت التطوير مقارنة بمعظم استخدامات FPGA وأن استخدام FPGA يمكن أن يوفر أداء أفضل من حلول Tegra K1 و K40 من Nvidia.

هناك طريقة أخرى تتمثل في استخدام معالج الإشارات الرقمية أو DSP ، والذي يؤدي عادةً وظيفة محددة أو مجموعة صغيرة جدًا من الوظائف بسرعة شديدة ، باستخدام طاقة قليلة جدًا. غالبًا ما يتم تضمينها في شرائح أخرى أكثر تعقيدًا لتسريع وظائف معينة ، مثل معالجة الرؤية. كان عدد من الشركات ، بما في ذلك Movidius و CEVA و Cadence ، يشاركون حلولهم في Hot Chips.

تعرض Movidius حلها القائم على DSP المعروف باسم وحدة معالجة الرؤية Myriad 2 ، وعرضته في طائرة DJI Phantom 4 drone. أظهر أيضًا كيف يتفوق Myriad 2 على وحدات معالجة الرسومات وشبكة GoogLeNet العصبية العميقة المستخدمة في مسابقة ImageNet 2014.

كانت CEVA تروج لـ CEVA-XM4 Vision DSP ، والتي تم ضبطها خصيصًا لمعالجة الرؤية وتهدف إلى سوق السيارات ، جنبًا إلى جنب مع منصة CEVA Deep Neural Network 2 ، التي قالت إنها قد تستغرق أي شيء مكتوبًا لأطر Caffe أو TensorFlow وتحسينها لتشغيلها على DSP لها. يجب أن يكون المعالج الجديد في SoCs العام المقبل.

وفي الوقت نفسه ، ناقشت Cadence ، التي تصنع عائلة Tensilica من معالجات الرؤية (والتي يمكن دمجها في منتجات أخرى) ، الإصدار الأحدث ، Vision P6 ، الذي أضاف ميزات جديدة مثل دعم النقطة العائمة المتجهية وغيرها من الميزات للشبكات العصبية التلافيفية. يجب أن تكون المنتجات الأولى خارج قريبا.

تحدثت Microsoft عن تفاصيل الأجهزة الخاصة بسماعات سماعة HoloLens ، قائلة إنها استخدمت معالج Intel Atom Cherry Trail بطول 14nm يعمل بنظام Windows 10 ومحور مستشعر مخصص Holographic Processing Unit (HPU 1.0) ، تم تصنيعه بواسطة TSMC في عملية 28nm. وهذا يشمل 24 Tensilica DSP النوى.

لقد التقطت بشكل خاص إحدى شرائح Cadence التي أظهرت الاختلافات في الإنتاجية والكفاءة في وحدات معالجة الرسومات ووحدات معالجة الصور المتحركة (FPGA) وأنواع مختلفة من وحدات معالجة البيانات (DSP) فيما يتعلق بعمليات إضافة متعددة ، وهي واحدة من لبنات البناء الأساسية للشبكات العصبية. في حين أنه من الواضح أن الخدمة الذاتية (كما هي الحال بالنسبة لجميع عروض البائعين) ، فقد أوضحت كيف تختلف التقنيات المختلفة من حيث السرعة والكفاءة (الأداء لكل واط) ، ناهيك عن التكلفة وسهولة البرمجة. هناك الكثير من الحلول لمناهج مختلفة هنا ، وسيكون من المثير للاهتمام أن نرى كيف سيحدث هذا خلال السنوات القليلة القادمة.