بيت التفكير إلى الأمام Ivytown ، steamroller ، 14 و 16 nm عملية تسليط الضوء على isscc

Ivytown ، steamroller ، 14 و 16 nm عملية تسليط الضوء على isscc

2024

فيديو: N-path filters explained (شهر نوفمبر 2024)

على الرغم من أن بائعي الرقائق عمومًا لا يقدمون رقائقًا جديدة في المؤتمر السنوي لدوائر الحالة الصلبة الدولية (ISSCC) ، إلا أنهم غالبًا ما يقدمون مزيدًا من التفاصيل حول الأعمال الداخلية للمنتجات التي تم الإعلان عنها بالفعل. إليك بعض الأشياء التي وجدتها مثيرة للاهتمام في عرض هذا الأسبوع.

إنتل Ivytown خادم العمارة

ناقشت Intel أحدث إصدار من عائلة المعالجات Xeon E7 ، وهي شريحة تضم حتى 15 مركزًا و 30 موضوعًا ، والمعروفة باسم Ivytown. يعتمد على بنية Ivy Bridge EP المستخدمة في Xeon E5 2600 V2. تم تصميم المعالج باستخدام تقنية معالجة 22nm من Intel مع ترانزستورات ثلاثية البوابة (يبلغ ارتفاع الزعانف 34nm وعرض 8nm) وسيحل محل Xeon E7 الحالي من Westmere EX. بالمقارنة ، يحتوي Xeon E7 الحالي ، والذي يتم إنتاجه على معالج HKMG ذي مستو 32nm ، على 10 مراكز و 20 سلسلة ، و 30 ميغابايت من ذاكرة التخزين المؤقت L3 مقارنة بـ 37.5 ميغابايت في إصدار Ivytown.

واحدة من الميزات الأكثر إثارة للاهتمام من عائلة المعالج الجديدة هذه هي بنية وحداتها. تتكون خطة الأرضية من ثلاثة أعمدة من خمسة نوى ، ولكل منها شريحة خاصة بها من ذاكرة التخزين المؤقت L3 وحافلة حلقة مدمجة و IO مخصصة في أعلى وأسفل الأعمدة (روابط QPI في الأعلى ووحدة تحكم الذاكرة في الأسفل). تخطط إنتل لإنشاء نسخة 10 نواة عن طريق إزالة العمود الأيمن. ولإنشاء إصدار 6 النواة عن طريق إزالة صفين.

يحتوي الإصدار 15 نواة على 4.31 مليار الترانزستورات - التي تقول إنتل إنها الأفضل في أي معالجات دقيقة - وتبلغ مساحتها 541 ملليمتر مربع. النسخة 10 الأساسية لديها 2.89 مليار الترانزستورات وقياس 341 ملليمتر مربع. البديل 6 النواة لديه 1.86 مليار الترانزستورات وقياس 257 ملليمتر مربع. تتراوح ترددات التشغيل من 1.4 جيجا هرتز إلى 3.8 جيجا هرتز مع نطاقات TDP تتراوح من 40W إلى 150W.

الجانب الآخر المثير للاهتمام من Ivytown هو بنية المخزن المؤقت للذاكرة. تدعم نفس القوالب ذاكرة DDR3 القياسية ذات الأربع قنوات التي تعمل بسرعة تصل إلى 1867MT / s وواجهة جديدة أحادية الجانب (VMSE) من فولطية الوضع (VMSE) إلى مخزن مؤقت ملحق للذاكرة يعمل على 2667 طن متري / ثانية. يمكن أن يدعم ما يصل إلى 12 تيرابايت من الذاكرة في خادم ذي 8 مآخذ ، أي ثلاثة أضعاف سعة ذاكرة Westmere EX. ستتوفر النسخة المكونة من 15 نواة في عبوتين مختلفتين: واحدة متوافقة مع نظام Romley الأساسي الحالي (Socket-R) لإجراء ترقيات سهلة والأخرى التي تتيح نظامًا أساسيًا جديدًا باستخدام ذاكرة مؤقتة.

المزيد من التفاصيل Haswell

قدمت Intel أيضًا عددًا من التفاصيل حول بنية Haswell ، المستخدمة في عائلة Core الحالية. وهذا يستخدم أيضا 22nm تري بوابة الترانزستورات. قالت إنتل إن Haswell يدمج العديد من التقنيات الجديدة ، بما في ذلك منظم الجهد متكامل أو FIVR (دمج النظام الأساسي من خمس منظمات جهد كهربي إلى واحد) ، ذاكرة التخزين المؤقت المدمجة DRAM للحصول على أداء أفضل للرسومات ، حالات طاقة منخفضة ، تعليمات IO ، AVX2 محسّنة ، و وحدة عدد صحيح SIMD أوسع.

هناك ثلاثة أشكال أساسية لـ Haswell: أولاً ، هناك رباعي النواة يتواصل مع PCH منفصل (Platform Controller Hub) مع رسومات أسرع (من اثنين إلى أربعة مراكز). ثانياً ، هناك منصة فائقة السرعة تجمع بين Haswell ثنائي النواة مع PCH في حزمة واحدة متعددة الشرائح. يدعم المعالج حالات الطاقة المنخفضة ، يتم تعديل PCH للحصول على طاقة منخفضة ، ويتواصل الاثنان عبر ناقل منخفض الطاقة ، وكل ذلك يقلل من الطاقة الاحتياطية بنسبة 95 بالمائة. أخيرًا ، هناك إصدار به رسومات Iris Pro وذاكرة تخزين مؤقت سعة 128 ميجابايت في نفس الحزمة. تستخدم الحزم متعددة الرقاقات IO على الحزمة التي توفر نطاق ترددي عالي عند انخفاض الطاقة بين وحدة المعالجة المركزية و PCH و eDRAM.

اعتمادًا على عدد وحدات المعالجة المركزية (CPU) والرسومات (GT2 أو GT3) ، يوجد لدى Haswell في أي مكان من 960 مليون إلى 1.7 مليار الترانزستورات ويبلغ حجم القوالب 130 إلى 260 مليمتر مربع. إنه مصمم للعمل من 0.7 إلى 1.1 فولت مع نطاق تردد واسع من 1.1 إلى 3.8 جيجا هرتز.

تبلغ سعة قرص eDRAM 128 جيجا بايت 77 مليمترا مربعا ، ويوفر نطاق ترددي يصل إلى 102 جيجابايت في الثانية. وقالت إنتل إنه بالمقارنة مع نفس النظام بدون eDRAM ، فإن ذاكرة التخزين المؤقت الإضافية تحقق مكاسب أداء تصل إلى 75 بالمائة ، على الرغم من زيادة الأداء الكلي بنسبة 30 إلى 40 بالمائة.

AMD في Steamroller القوى كافيري

تركز AMD ، التي تميل إلى وضع المزيد من الرسومات على ما تسميه وحدات المعالجة السريعة (APUs ، أو المعالجات التي تجمع بين وحدات المعالجة المركزية والرسومات) على وحدة المعالجة المركزية الجديدة الخاصة بها ، والمعروفة باسم Steamroller ، والذي يستخدم في سلسلة معالجات Kaveri الجديدة للشركة. يحتوي جهاز Steamroller الأساسي ، الذي تم إنتاجه في عملية CMOS بكميات كبيرة تبلغ 28nm ، على 236 مليون ترانزستور في مساحة 29.47 ملليمتر مربع. يتضمن ذلك نواة عدد صحيح ، وحدتي فك ترميز تعليميتين ، وعدة عناصر مشتركة ، بما في ذلك جلب التعليمات ، ووحدة الفاصلة العائمة ، وذاكرة تخزين مؤقت L2 بسعة 2 ميجابايت. تستخدم AMD عادة واحدة من وحدات Steamroller هذه في رقائقها "ثنائية النواة" (والتي تعكس النوى الصحيحة 2) ؛ واثنين في رقائق "رباعية النواة".

مقارنةً بنواة Piledriver السابقة ، والتي تم إنتاجها باستخدام عملية 32Im SOI ، يضيف Steamroller وحدة فك تشفير للتعليمات الثانية ، وذاكرة تخزين مؤقت أكبر لتعليمات مشتركة بحجم 96 كيلوبايت ، وتحسينات أخرى. وقال AMD إن هذا أدى إلى الحصول على إرشادات إضافية تصل إلى 14.5 بالمائة لكل دورة ، مما يترجم إلى أداء أفضل بنسبة 9 بالمائة على التطبيقات ذات الخيوط المفردة وأداء أفضل بنسبة 18 بالمائة على التطبيقات ذات الخيوط المزدوجة. يمكن أيضًا تشغيله بتردد أكبر بسرعة 500 ميجاهرتز في نفس الطاقة ، أو تقديم نفس الأداء مع تقليل استهلاك الطاقة بنسبة 38 بالمائة. تم تصميم قلب Steamroller للعمل في نطاق من 0.7 إلى 1.45 فولت.

معالجات متنقلة من MediaTek و Renesas و Qualcomm

قدم عدد من الشركات عروضاً تقديمية حول المعالجات القائمة على ARM.

تحدث MediaTek عن معالج متعدد النواة (HMP) غير متجانس بسرعة 28nm مع وحدة المعالجة المركزية رباعية النواة و GPU المزدوج. تحتوي شريحة MediaTek على قلبين من Cortex A15 ، يعملان بسرعة 1.8 جيجاهرتز ، واثنين من مراكز Cortex A7 ، التي تعمل بسرعة 1.4 جيجاهرتز ، بالإضافة إلى وحدة معالجة الرسومات Imagination G6200 400MHz ثنائية النواة. كما أنه يحتوي على برنامج ترميز فيديو عالي الدقة للأجهزة ومعالج استشعار صورة بدقة 13 ميجابكسل.

تحدث MediaTek أيضًا عن تقنية PTP (الأداء والحرارية والطاقة) التي تراقب طاقة الرقاقة والتحكم فيها. في هذه الحالة ، قالت الشركة إن PTP يسمح بزيادة في سرعة الساعة بنسبة 23 بالمائة أو ما يصل إلى 41 بالمائة من توفير الطاقة.

تستخدم هذه الشريحة معالجة ARM الحقيقية لـ ARM ، مما يعني أن أي مجموعة من النوى الكبيرة والصغيرة من واحد إلى أربعة يمكن أن تعمل وفقًا لحجم العمل. قال MediaTek أنه باستخدام HMP حقيقي ، يمكن للرقاقة أن تقدم أداء أفضل بنسبة 33-51 في المائة على أعباء العمل الثقيلة أو كفاءة طاقة أفضل بواقع 2 إلى 5 أضعاف على أعباء العمل الخفيفة ، بينما توفر الإدارة الحرارية التكيفية دفعة أخرى بنسبة 10 في المائة للأداء.

قدمت رينيساس معالجًا غير متجانس ثنائي النواة HPM ثنائي النوى بقوة 28 نانومتر مصممًا للأجهزة المحمولة وأنظمة الترفيه في السيارات. تستخدم الشريحة أربعة نوى Cortex A15 وأربعة نوى Cortex A7. إنه قادر على تشغيل جميع النوى الثمانية في وقت واحد للحصول على أعلى أداء ، لكنه يستخدم أيضًا الهندسة غير المتجانسة وتقنيات إدارة الطاقة لتحسين الأداء لبعض أعباء العمل أو مغلفات الطاقة.

وصفت Qualcomm معالج الإشارات الرقمية Hexagon ، والذي يستخدم في SoCs المحمول لمجموعة متنوعة من تطبيقات الوسائط المتعددة والمودم. يتم تصنيعها الإصدار الحالي في 28MM HKMG عملية CMOS بالجملة. يستهدف هذا التصميم إرشادات عالية لكل ساعة بدلاً من ترددات التشغيل العالية.

على جانب خادم ARM ، تحدثت شركة Applied Micro عن معالج ARMv8 من الجيل الأول للشركة ، والذي تم الإعلان عنه لأول مرة خلال قمة Open Compute الأخيرة. يعتمد هذا على وحدة المعالجات "Potenza" (PMD) ، والتي تتضمن نواة تشترك في ذاكرة التخزين المؤقت L2 بسعة 256 كيلوبايت. يتم تصنيع Potenza في CMOS بكميات كبيرة 40nm ويحتوي كل PMD على 84 مليون الترانزستورات ويستخدم 14.8 ملليمتر مربع من منطقة يموت. يمكن أن تعمل بسرعة تصل إلى 3GHz عند 0.9 فولت ، ولكن متوسط 4.5W تحت أعباء العمل النموذجية. تتضمن منصة خادم X-Gene 3 أربعة وحدات PMD (ثمانية مراكز) ، وذاكرة تخزين مؤقت (L3) مشتركة بسعة 8 ميجابايت وأربع قنوات ذاكرة DRAM حول مفتاح مركزي. كما أنه يدمج شبكة إيثرنت 10GB و SATA 2/3 و PCIe Gen. 3 و USB 3.0.

الجيل القادم من Chip Process Tech

كان هناك أيضًا عرضان تقديميان على الجيل التالي من تقنية معالجة الرقاقات ، حيث إن جميع شركات تصنيع الرقاقات الرئيسية تقريبًا لديها خطط للانتقال إلى إنتاج ثلاثي الأبعاد أو FinFET ، في العقدة 14 أو 16nm (بعد Intel ، التي تقوم بالفعل بشحن شرائح 22nm مع هذه التكنولوجيا).

تحدثت Samsung عن عملية FinFET التي تصل إلى 14 نانومتر ، والتي تعرض صفيفًا وشريحة اختبار تبلغ سعتها 128 ميجابايت 6 تيرابايت. صرحت Samsung بأن FinFETs يعد حلاً جيدًا لشركة SoCs المتنقلة منخفضة الطاقة لأنها توفر تحجيمًا جيدًا وتسربًا منخفضًا حاليًا ومنخفضًا ولديها تحكم جيد في القناة القصيرة.

هذا يفرض أيضًا بعض التحديات على SRAMs ، لأن جهد تزويد SRAM لم يتوسع. تشغل SRAM الآن ما بين 20 إلى 30 بالمائة من مساحة الموت في شركة نفط الجنوب ، ولكنها تستخدم حوالي 40-50 بالمائة من الطاقة. لمعالجة هذه المشكلات ، اقترحت Samsung بعض التقنيات الجديدة لتشغيل SRAM باستخدام ترانزستورات FinFET بجهد إمداد أقل.

عالجت TSMC مشكلات مماثلة ، حيث عرضت شريحة SRAM بسعة 16 ميجابايت بسرعة 128 ميجابايت. قالت شركة TSMC إن FinFETs أصبحت تقنية رئيسية للإنتاج تتجاوز 20 نانومتر ، لكنها قالت إن حجم عرض القناة وطولها مع FinFETs يمثل تحديًا لتوسيع نطاق 6T-SRAM التقليدي وفولتية الإمداد. اقترح TSMC أسلوبين للكتابة المساعدة للتغلب على هذه المشكلات.

هذه مشكلات فنية إلى حد ما ، ولكن حل المشكلات أمر بالغ الأهمية إذا أردنا الحصول على شرائح أكثر كثافة وفعالية من حيث الطاقة في المستقبل.