NVIDIA Ampere A100250W TDP GPU على PCIe 4.0 تم تصميمه للذكاء الاصطناعي وعلوم البيانات والحوسبة الفائقة التي تم إطلاقها مع أداء موعود بنسبة 90 في المائة من طراز 400 واط

المعدات / NVIDIA Ampere A100250W TDP GPU على PCIe 4.0 تم تصميمه للذكاء الاصطناعي وعلوم البيانات والحوسبة الفائقة التي تم إطلاقها مع أداء موعود بنسبة 90 في المائة من طراز 400 واط 2 دقيقة للقراءة

نفيديا



أطلقت NVIDIA رسميًا A100 ، وهو معالج رسومات متوافق مع PCIe 4.0 استنادًا إلى بنية Ampere من الجيل التالي. على الرغم من أنها تتميز بملف تعريف أقل بقدرة 250 وات TDP ، إلا أن NVIDIA تعد بأن تكون وحدة معالجة الرسومات PCIe 4.0 Ampere A100 قادرة على تقديم ما يصل إلى 90 بالمائة من أداء وحدة معالجة الرسومات (GPU) الكاملة 400 وات A100 HGX. البديل الثالث لعائلة وحدة معالجة الرسومات Ampere A100 المتزايدة ، A100 PCIe مخصص للخوادم التي تشغل الذكاء الاصطناعي (AI) وعلوم البيانات ومجموعات الحوسبة الفائقة.

كشفت NVIDIA عن متغير PCI-Express 4.0 لوحدة معالجة الرسومات A100. تعتمد وحدة معالجة الرسومات على معمارية 7 نانومتر أمبير. بالإضافة إلى ذلك ، أعلنت الشركة أيضًا عن العديد من الأنظمة التي تعمل بنظام A100 من الشركات المصنعة للخوادم الرائدة ، بما في ذلك Asus و Dell و Cisco و Lenovo والمزيد. إن مسرع GPU 250W A100 PCIe 4.0 مشابه تمامًا لمتغير 400W TDP الكامل ، كما أن NVIDIA تعد أيضًا بأداء متطابق تقريبًا على الرغم من الانخفاض الكبير في ملف تعريف TDP.



NVIDIA A100 Ampere GPU في PCIe 4.0 Form-Factor مع نفس تكوين 400W A100 HGX GPU ولكن عند 250 واط:

أعلنت شركة NVIDIA عن مُسرّع وحدة معالجة الرسومات PCIe 4.0 A100 PCIe. تتوفر وحدة معالجة الرسومات Ampere لمجموعة متنوعة من حالات الاستخدام الصناعي مع أنظمة تتراوح من وحدة معالجة رسومات A100 PCIe واحدة إلى الخوادم التي تستخدم بطاقتين في نفس الوقت من خلال 12 قناة NVLINK التي توفر إجمالي 600 جيجابايت / ثانية من عرض النطاق الترددي المتداخل. لا يتغير مسرع GPU 250W TDP A100 PCIe كثيرًا من حيث التكوين الأساسي عند مقارنته بوحدة معالجة الرسومات 400W A100 HGX.



تتميز وحدة معالجة الرسومات GA100 بمواصفات متغير 400W A100 HGX مع 6912 نواة CUDA مرتبة في 108 وحدة SM و 432 Tensor Cores و 40 GB من ذاكرة HBM2 التي توفر نفس عرض النطاق الترددي للذاكرة البالغ 1.55 تيرابايت / ثانية (مقربًا إلى 1.6 تيرابايت / ثانية) س). ومع ذلك ، فإن نشر حزمة GPU على ملف معيار PCIe 4.0 كان له عيبه الخاص في تقليل TDP بشكل كبير. يقال إن هذا يعني عقوبة أداء بنسبة 10 إلى 50 بالمائة بناءً على عبء العمل. علاوة على ذلك ، فإن البديل 250W TDP لوحدة معالجة الرسومات A100 هو أكثر ملاءمة للدفقات القصيرة بدلاً من الأحمال المستمرة.

NVIDIA A100 Ampere GPU في أداء عامل الشكل PCIe 4.0:

نظرًا للانخفاض الكبير في ملف تعريف TDP ، يمكن افتراض أن البطاقة ستحتوي على ساعات أقل للتعويض عن إدخال TDP الأقل. ومع ذلك ، فإن مقاييس الأداء التي أصدرتها NVIDIA مدهشة حقًا لأنها تقترب تمامًا من متغير 400W TDP. لا يزال أداء FP64 مصنفًا عند 9.7 / 19.5 TFLOPs ، وتم تصنيف أداء FP32 عند 19.5 / 156/312 TFLOPs (Sparsity) ، وتم تصنيف أداء FP16 عند 312/624 TFLOPs (Sparsity) ، وتم تصنيف INT8 في 624/1248 TOPs ( تناثر).



تشير الرياضيات البسيطة ، وتؤكد NVIDIA ، أن وحدة معالجة الرسومات PCIe 4.0 250W A100 المستندة إلى Ampere يمكنها تقديم 90 بالمائة من أداء بطاقة A100 HGX (400 واط) في تطبيقات الخادم الأعلى. هذا له ما يبرره لأنه يستغرق وقتًا أقل للمتغير الجديد لإكمال المهام المذكورة أعلاه. ومع ذلك ، يجب أن تكون الأرقام صالحة لفترات قصيرة فقط. في المواقف المعقدة التي تتطلب إمكانات مستدامة لوحدة معالجة الرسومات ، يمكن لوحدة معالجة الرسومات 250W PCIe 4.0 توفير أداء يصل إلى 90٪ إلى 50٪ من أداء وحدة معالجة الرسومات 400W A100 HGX.

من المؤكد أن هندسة Ampere الدقيقة ستستفيد من A100 الجديدة. تعد NVIDIA بتحسين أداء 20X على الأقل مقارنة بالسلف المعتمد على Volta. تتميز وحدة معالجة الرسومات PCIe 4.0 A100 بتقنية GPU متعددة المثيلات. هذا يعني أنه يمكن تقسيم A100 واحد إلى ما يصل إلى سبع وحدات معالجة رسومات منفصلة للتعامل مع مهام الحوسبة المختلفة. في حين أن هذا يعزز التقسيم ، هناك الجيل الثالث من NVLink ، والذي يتيح دمج العديد من وحدات معالجة الرسومات في وحدة معالجة رسومات عملاقة واحدة.

العلامات نفيديا