بيت التفكير إلى الأمام التغييرات الكبيرة هي في النهاية في الأفق بالنسبة لأجهزة الكمبيوتر العملاقة

التغييرات الكبيرة هي في النهاية في الأفق بالنسبة لأجهزة الكمبيوتر العملاقة

2024

فيديو: Ø¨Ù†ØªÙ†Ø§ ÙŠØ§ Ø¨Ù†ØªÙ†Ø§ (شهر نوفمبر 2024)

إذا نظرنا إلى الوراء في مؤتمر الحوسبة الفائقة ISC 17 هذا الأسبوع ، يبدو أن عالم الحوسبة الفائقة سيشهد بعض التحسينات الكبيرة في العامين المقبلين ، لكن التحديث إلى قائمة أفضل 500 شركة من أسرع 500 كمبيوتر فائق في العالم لم يكن مختلفًا تمامًا عن الإصدار السابق.

لا تزال أسرع أجهزة الكمبيوتر في العالم هي الجهازين الصينيين الهائلين اللذين تصدرا القائمة منذ بضع سنوات: كمبيوتر Sunway TaihuLight من المركز الوطني الصيني للحوسبة الفائقة في وشى ، مع أداء Linpack المستمر لأكثر من 93 بيتلافلوب (93 ألف تريليون نقطة عائمة) عمليات في الثانية الواحدة) ؛ والكمبيوتر Tianhe-2 من المركز الوطني الصيني الفائق للكمبيوتر في قوانغتشو ، مع أداء مستدام لأكثر من 33.8 بيتلافلوب. تظل هذه أسرع الأجهزة بهامش كبير.

الرقم الثالث الجديد هو نظام Piz Daint من المركز الوطني السويسري للحوسبة الفائقة ، وهو نظام كراي يستخدم Intel Xeons و Nvidia Tesla P100s ، التي تم ترقيتها مؤخرًا لمنحها أداء مستدامًا من Linpack يبلغ 19.6 بيتافلوبس ، أي ضعف إجماليها السابق. هذا رفعه من الرقم ثمانية في القائمة.

هذا يسقط النظام الأمريكي الأعلى - نظام تايتان في مختبر أوك ريدج الوطني - إلى المركز الرابع ، مما يجعل هذه المرة الأولى منذ عشرين عامًا التي لا يوجد فيها نظام أمريكي في المراكز الثلاثة الأولى. تبقى بقية القائمة على حالها ، حيث لا تزال الولايات المتحدة تمثل خمسة من بين أفضل 10 دول ، واليابان لمدة سنتين.

حتى لو لم تتغير أسرع قائمة للكمبيوتر ، فهناك تغييرات كبيرة في أماكن أخرى. في قائمة Green 500 للأنظمة الأكثر كفاءة في استخدام الطاقة ، تم تغيير تسعة من العشرة الأوائل. ويأتي في المقدمة نظام Tsubame 3.0 ، وهو نظام HPE ICE XA معدّل في معهد طوكيو للتكنولوجيا على أساس Xeon E5-2680v4 14 ، وتوصيل Omni-Path ، و Tesla P100 من Nvidia ، والذي يسمح بـ 14.1 جيجابت لكل واط. هذه قفزة هائلة من DGX Saturn V من Nvidia ، استنادًا إلى منصة DGX-1 للشركة ورقائق P100 ، التي كانت في المرتبة الأولى في قائمة شهر نوفمبر ولكنها تحتل المرتبة العاشرة هذه المرة ، بمعدل 9.5 جيجابت / وات. P100 في تسعة من أفضل عشرة أنظمة Green500.

يعد كسر 10 جيجابت / وات مشكلة كبيرة لأنه يعني أن نظام إكسافلوب الافتراضي الذي تم إنشاؤه باستخدام تقنية اليوم سيستهلك أقل من 100 ميجاوات (MW). لا يزال هذا كثيرًا - فالهدف هو 20 إلى 30 ميجاوات لنظام exaflop ، والذي يأمل الباحثون رؤيته في السنوات الخمس المقبلة أو نحو ذلك - لكنه خطوة كبيرة إلى الأمام.

مثل قائمة أفضل 500 ، كانت هناك تغييرات طفيفة فقط على قوائم مماثلة ذات معايير مختلفة ، مثل معيار الأداء العالي للالتحام المتدرج (HPCG) ، حيث تميل الآلات إلى رؤية 1 إلى 10 بالمائة فقط من أعلى مستوياتها النظرية ، وحيث النظام - في هذه الحالة ، لا يزال جهاز Riken K يسلم أقل من بيتافلوب واحد. انتقل نظامي TaihuLight و Piz Daint إلى هذه القائمة. عندما يتحدث الباحثون عن آلة exaflop ، فإنها تميل إلى أن تعني معيار Linpack ، ولكن HPCG قد يكون أكثر واقعية من حيث الأداء في العالم الحقيقي.

كان ظهور الحوسبة GPU كمسرع - يستخدم دائمًا تقريبًا معالجات Nvidia GPU مثل P100 - هو التغيير الأكثر وضوحًا على هذه القوائم في السنوات الأخيرة ، يليه إدخال مسرّع Intel الخاص ، Xeon Phi متعدد النواة (بما في ذلك أحدث إصدار من Knights Landing). تتضمن قائمة أفضل 500 قائمة حاليًا 91 نظامًا تستخدم المعجلات أو المعالجات المشتركة ، بما في ذلك 74 مع وحدات معالجة الرسومات Nvidia و 17 مع Xeon Phi (مع ثلاثة أخرى تستخدم كليهما) ؛ واحدة مع معالج AMD Radeon GPU كمسرع واثنين يستخدمان معالجًا متعدد النواة من PEZY Computing ، وهو مورد ياباني. يستخدم 13 نظامًا إضافيًا الآن Xeon Phi (Knights Landing) كوحدة المعالجة الرئيسية.

لكن العديد من التغييرات الكبيرة على أجهزة الكمبيوتر العملاقة لا تزال في الأفق ، حيث نبدأ في رؤية أنظمة أكبر مصممة مع وضع هذه المفاهيم في الاعتبار. ومن الأمثلة على ذلك ، MareNostrum 4 الجديد في مركز برشلونة للحوسبة الفائقة ، الذي دخل في قائمة أفضل 500 شركة في الرقم 13. كما تم تثبيته حتى الآن ، فإن هذا النظام من لينوفو يعتمد على إصدار Skylake-SP القادم من Xeon (رسمياً Xeon Platinum 8160 24 النواة المعالج). ما يثير الاهتمام هنا هو المجموعات الثلاث الجديدة من "التكنولوجيا الناشئة" المخطط لها على مدار العامين المقبلين ، بما في ذلك مجموعة واحدة مع معالجات IBM Power 9 ووحدات معالجة الرسومات Nvidia ، المصممة للحصول على قدرة معالجة قصوى لأكثر من 1.5 Petaflops ؛ الثانية بناء على نسخة فرسان هيل من زيون فاي. والثالث يعتمد على معالجات ARMv8 64 بت من تصميم Fujitsu.

يتم استخدام هذه المفاهيم في عدد من مشاريع الحوسبة الفائقة الرئيسية الأخرى ، ولا سيما العديد من المشاريع التي ترعاها وزارة الطاقة الأمريكية كجزء من CORAL Collaboration في Oak Ridge و Argonne و Lawrence Livermore National Labs. يجب أن تكون القمة الأولى في Summit في Oak Ridge ، والتي ستستخدم معالجات IBM Power 9 ووحدات معالجة الرسومات Nvidia Volta ، ومن المقرر تسليم أكثر من 150 إلى 300 قمة لوقود petaflops ؛ تليها سييرا في لورانس ليفرمور ، والمقرر تسليم أكثر من 100 قمة بيتافلوبس.

ثم يجب أن نرى الكمبيوتر العملاق Aurora في مختبر Argonne الوطني ، استنادًا إلى إصدار Knights Hill من Xeon Phi والذي صممه Cray ، والذي من المقرر أن يقدم 180 قمة بيرافلوبس. يجب أن تكون أنظمة CORAL صعودًا و جري العام القادم.

وفي الوقت نفسه ، خططت المجموعات الصينية واليابانية ترقيات كذلك ، معظمها باستخدام هياكل فريدة من نوعها. يجب أن تكون مثيرة للاهتمام لمشاهدة.

يبدو أن التحول أكبر بكثير بعيدًا تمامًا: التحول نحو تعلم الآلة ، عادة على وحدات المعالجة الموازية بشكل كبير داخل المعالج نفسه. بينما يشير رقم Linpack إلى الأداء 64 بت أو الدقة المزدوجة ، هناك فئات من التطبيقات - بما في ذلك العديد من التطبيقات المستندة إلى الشبكة العصبية العميقة - تعمل بشكل أفضل مع الحسابات أحادية أو حتى نصف الدقة. تستفيد المعالجات الجديدة من هذا ، مثل إعلان Volta V100 الأخير من Nvidia وإصدار Knights Mill القادم من Xeon Phi. في المعرض ، قالت إنتل إن هذا الإصدار ، الذي من المقرر أن يكون قيد الإنتاج في الربع الرابع ، سيحتوي على مجموعات تعليمات جديدة لـ "الحوسبة منخفضة الدقة" تدعى Quad Fused Multiply Add (QFMA) و Quad Virtual Neural Network Instruction (QVNNI).

أفترض أنه يمكن تطبيق هذه المفاهيم على أبنية أخرى أيضًا ، مثل TPU من Google أو FPGAs من Intel وشرائح Nervana.

حتى لو لم نشهد تغييرات كبيرة هذا العام ، فمن المتوقع أن نرى المزيد في العام المقبل. لا يزال مفهوم الجهاز exascale (1000 teraflops) بعيد المنال ، على الرغم من أنه سيتضمن على الأرجح عددًا من التغييرات الكبيرة.