بيت التفكير إلى الأمام هل ستحكم البنى البديلة في الحوسبة الفائقة؟

هل ستحكم البنى البديلة في الحوسبة الفائقة؟

فيديو: سكس نار Video (شهر نوفمبر 2024)

فيديو: سكس نار Video (شهر نوفمبر 2024)
Anonim

في السنوات الأخيرة ، رأينا بعض الأساليب الجديدة المثيرة للاهتمام للحوسبة عالية الأداء ، لا سيما التحول عن المعالجات الكبيرة التقليدية وتجاه مجموعات x86 من وحدات المعالجة المركزية مع المعجلات أو المعالجات المشتركة لتسريع أنواع معينة من العمليات الحسابية. بعد خروجنا من عرض الحوسبة الفائقة الأسبوع الماضي ، رأينا إنتل تضغط من أجل دمج معالجها Xeon Phi مع معالج خادم Xeon التقليدي لتسهيل البرمجة ؛ نفيديا تقديم نسخة جديدة من مسرع تسلا GPU لها ؛ ويدعم Micron نوعًا مختلفًا جدًا من المعالجات من أجل حوسبة أكثر تخصصًا. وقد حدث كل هذا في وقت تهيمن فيه المسرعات والمعالجات الثانوية على قائمة أفضل 500 من أسرع أجهزة الكمبيوتر في العالم ، مما دفع بعض الخبراء إلى اقتراح أن المعايير الحالية تعطي وزناً كبيراً لهذه المعالجات.

كانت Nvidia تروج لنجاحاتها من خلال لوحات تسريع Tesla الخاصة بها ، وهي مجموعات كبيرة من وحدات معالجة الرسومات (GPU) المتصلة بالمعالجات الرئيسية من Intel أو AMD. تُستخدم هذه الرقائق في مجموعة واسعة من الأنظمة ، بما في ذلك نظام Titan في مختبر أوك ريدج الوطني ونظام Piz Daint الجديد في المركز الوطني السويسري للحوسبة الفائقة للحوسبة. والأمر الأكثر إثارة للاهتمام هو أن الشركة تقول إن لوحات Tesla في أفضل 10 أنظمة على قائمة Green 500 الأخيرة من أكثر الحواسيب العملاقة كفاءة في استخدام الطاقة في العالم. تستخدم جميع هذه الأنظمة أيضًا Intel Xeons باستثناء Titan الذي يستند إلى AMD Opteron ، وهو ثاني أسرع نظام في العالم في قائمة أفضل 500 ولكنه يحتل المرتبة الأدنى في قائمة Green 500.

بالإضافة إلى ذلك ، أعلنت Nvidia عن شراكة مع IBM لتقديم معجلات تسلا الخاصة بها في الأنظمة القائمة على بنية IBM Power. لطالما أشارت شركة IBM إلى أدائها التسلسلي ، ويقوم نظام BlueGene / Q المعتمد على معالجات Power بتشغيل نظام سيكويا في مختبر لورنس ليفرمور الوطني ونظام ميرا في مختبر أرجون الوطني وغيرها. يجب أن ينتج عن عمل IBM و Nvidia معًا بعض الأنظمة المثيرة للاهتمام في المستقبل.

في المعرض ، أعلنت الشركة عن Tesla K40 ، الجيل التالي من لوحة تسريع GPU. وقالت الشركة إنها ستقدم 1.4 تيرافلوبس من الأداء المزدوج الدقة وذاكرة 12 جيجا بايت (عرض النطاق الترددي 288 جيجابايت في الثانية) وميزة GPU Boost ، مما يسمح لها بالعمل بسرعة أسرع على مدار الساعة في بعض الحالات. هذه ترقية من سلسلة Tesla K20 الحالية ، باستخدام نفس تصميم GPU الأساسي المنتج على تقنية 28nm.

تشمل المبادرات الأخرى طرقًا لجعل برمجة GPU أسهل ، بما في ذلك CUDA 6 ، والتي تدعم الآن الذاكرة الموحدة ، مما يتيح للمطورين التعامل مع الذاكرة كمجموعة واحدة ، على الرغم من أن وحدة المعالجة المركزية وذاكرة GPU تظل منفصلة. تدعم الشركة أيضًا OpenACC ، وهي مجموعة قياسية من توجيهات برنامج التحويل البرمجي التي تخبر النظام بأية أجزاء من البرنامج (مكتوبة في C / C ++ و Fortran) يمكن إلغاء تحميلها من وحدة المعالجة المركزية إلى مسرع لزيادة الأداء.

إن طريقة إنتل ، والتي تسميها هندسةها المتعددة المتكامل (MIC) ، مختلفة جداً. فهو يجمع بين عدة نوى x86 صغيرة في شريحة واحدة تسمى زيون فاي. على مدار السنوات القليلة الماضية ، كانت إنتل تدل على حقيقة أن جميع أجهزة x86s تجعل البرنامج أسهل ، على الرغم من أنه من الواضح أن المطورين لا يزال يتعين عليهم استهداف البنية مباشرة. تم تصميم الإصدار الحالي من Xeon Phi ، المسمى Knights Corner ، ليتم استخدامه كمسرع مع رقائق خادم Xeon E التقليدية ، ويستخدم من قبل مجموعة متنوعة من أفضل النظم ، بما في ذلك Tianhe-2 الصينية (النظام الأسرع حاليًا في العالم) ونظام التدافع في مركز الحوسبة المتقدمة في جامعة تكساس.

في المعرض ، أعلنت إنتل عن إصدار جديد يحمل اسم Knights Landing ، والذي سيعمل أيضًا كوحدة المعالجة المركزية المستقلة التي يمكن أن تتلاءم مع بنية حامل قياسية وتشغيل نظام التشغيل مباشرةً ، دون الحاجة إلى وحدة المعالجة المركزية المضيفة (مثل Xeon E). قد يكون هذا مهمًا للغاية في توسيع نطاق جاذبية Xeon Phi ، لا سيما في سوق محطات العمل. مرة أخرى ، تم تصميم هذا لتسهيل على مطوري البرامج مشاهدته كوحدة المعالجة المركزية واحدة. ستتوفر Knights Landing كوحدة معالجة مركزية مستقلة وكوحة PCI Express تناسب الأنظمة الحالية كترقية من Knights Corner.

هناك تغييرات مهمة أخرى على Knights Landing أيضًا ، بما في ذلك إضافة "قرب الذاكرة" ، بفعالية DRAM التي يتم تقديمها على الحزمة مع وحدة المعالجة المركزية ، وبالتالي يمكن أن توفر نطاقًا تردديًا أعلى بكثير من ذاكرة DDR التقليدية ، والتي تقتصر على سرعة الحافلة. (هذا يزداد سرعة أيضًا ، ولكن ليس تقريبًا). هذه ليست الخطوة الأولى في هذا الاتجاه ؛ قامت IBM بترويج DRAM مضمن في بنية الطاقة الخاصة بها منذ سنوات ، وتقوم Intel نفسها بوضع DRAM مضمن للرسومات في إصدارات Iris Pro من عائلة Haswell Core. ومع ذلك ، أعتقد أنه سنرى المزيد من الجهود في هذا الاتجاه في السنوات المقبلة.

وفي الوقت نفسه ، واحدة من أكثر الطرق الجديدة إثارة للاهتمام تأتي من Micron ، التي أعلنت عن مسرع جديد يسمى معالج Automata المصمم في الغالب لمعالجة مشاكل البيانات غير المهيكلة المعقدة.

وصف Micron هذا بأنه يقدم نسيجًا يتألف من عشرات الآلاف إلى ملايين من عناصر المعالجة المتصلة لحل مهام محددة. تقول الشركة ، إحدى أكبر الشركات المصنعة لذاكرة DRAM و NAND ، إن هذا سيستخدم المعالجة القائمة على الذاكرة لحل تحديات الحوسبة المعقدة في مجالات مثل أمن الشبكات والمعلوماتية الحيوية ومعالجة الصور وتحليلات. ستقوم Micron في البداية بتوزيع Automata Processor على لوحة PCI-Express لجعل المطورين يعملون معها ، لكن الشركة تخطط لبيع المعالجات على وحدات الذاكرة القياسية ، والمعروفة باسم DIMM ، أو كشرائح فردية للأنظمة المدمجة. يشبه هذا في بعض النواحي صفيفات البوابة القابلة للبرمجة (FPGAs) ، والتي يتم ضبطها لحل تطبيقات معينة تتضمن مطابقة الأنماط.

وقالت الشركة إنها تعمل مع Georgia Tech وجامعة Missouri وجامعة فرجينيا لتطوير تطبيقات جديدة لـ Automata. على الرغم من أن الشركة لم تعلن عن موعد للمنتجات النهائية ، إلا أن مجموعة أدوات تطوير البرامج ستصدر العام المقبل ، إلى جانب أدوات المحاكاة.

يبدو Automata وكأنه عمل جارٍ ، وربما يكون من السابق لأوانه معرفة مدى اتساع التطبيقات ، لكنه أسلوب مثير للاهتمام.

بشكل عام ، نشهد تطور الحوسبة عالية الأداء. منذ سنوات قليلة ، كانت أسرع أجهزة الكمبيوتر في الغالب مجرد أعداد هائلة من معالجات الخوادم القياسية. في الواقع ، لا تزال أنظمة IBM Blue Gene وتلك القائمة على Sparc (مثل الكمبيوتر K في معهد RIKEN المتقدم للعلوم الحسابية في اليابان ، والذي يستخدم معالجات Fujitsu Sparc) تمثل جزءًا كبيرًا من السوق ، بما في ذلك خمسة من أسرع 10 النظم في العالم. ولكن في السنوات الأخيرة ، تحول الزخم نحو المعالج المشترك ، حيث تستخدم الأنظمة التي تستخدم Tesla ومؤخرًا Xeon Phi مسرعات أكثر من الأنظمة الأحدث. مع التحسينات في تلك الأنظمة ، والشراكات الجديدة ، والبرمجيات الأفضل وبعض الأساليب الجديدة ، قد يكون سوق الحوسبة الفائقة مختلفًا تمامًا في المستقبل.

هل ستحكم البنى البديلة في الحوسبة الفائقة؟