تم إصدار Radeon Open Compute “ROCm” Stack v3.1 مع RAS لـ Vega 7nm ، ودعم SLURM لتحسين إدارة الموارد ، ولكن Navi لا يزال مفقودًا

المعدات / تم إصدار Radeon Open Compute “ROCm” Stack v3.1 مع RAS لـ Vega 7nm ، ودعم SLURM لتحسين إدارة الموارد ، ولكن Navi لا يزال مفقودًا 2 دقيقة للقراءة

AMD راديون



Radeon Open Compute أو 'ROCm' المكدس الإصدار الجديد هو الآن متاح للتحميل. يجلب Radeon Open Compute v3.1 معه عددًا قليلاً من الميزات ، ولكن الغريب أن دعم AMD Navi بالإضافة إلى GFX10 لا يزال مفقودًا.

ROCm ، النظام الأساسي العالمي الأكثر قبولًا على نطاق واسع للحوسبة المسرعة GPU ، الآن في الإصدار 3.1. يتضمن آخر تحديث للنظام الأساسي المعياري الذي يسمح لبائعي الأجهزة ببناء برامج تشغيل تدعم إطار عمل ROCm بعض الميزات التي طال انتظارها مثل دعم RAS لـ 7nm Vega ودعم SLURM لوحدات معالجة الرسومات AMD. ومع ذلك ، لأسباب غير معروفة حتى الآن ، لا تزال ROCm تفتقر إلى الدعم الكامل للجيل القادم من AMD Navi Architecture.

ما الجديد في Radeon ROCm v3.1:

التغيير الأكبر والأكثر وضوحًا في التثبيت الجديد لـ Radeon ROCm v3.1 هو في بنية دليل التثبيت ROCm. يؤدي تثبيت جديد لمجموعة أدوات ROCm إلى تثبيت الحزم في ملف / opt / rocm- مجلد. في السابق ، تم تثبيت حزم أدوات ROCm في ملف / opt / rocm مجلد.



عزز الإصدار الجديد من ROCm الموثوقية وإمكانية الوصول وإمكانية الخدمة (RAS) لوحدات معالجة الرسومات Vega 7nm. من المفترض أن يكون هذا العمل فيغا 7 نانومتر تحت المجهر لا يزال 'Arcturus' المستندة إلى Vega مسرّع الحوسبة قادم هذا العام. يشمل الدعم:



  • UMC RAS ​​- إعادة تعيين HBM ECC (إدخال خطأ غير قابل للتصحيح) ، وسحب الصفحة ، واستعادة RAS عبر GPU (BACO)
  • GFX RAS - GFX ، MMHUB ECC (حقن خطأ غير قابل للتصحيح) ، استعادة RAS عبر إعادة تعيين GPU (BACO)
  • PCIE RAS - PCIE_BIF ECC (حقن خطأ غير قابل للتصحيح) ، إعادة تعيين استرداد RAS عبر GPU (BACO)

يحصل Radeon ROCm v3.1 أيضًا على دعم SLURM لوحدات معالجة الرسومات AMD. SLURM أو Simple Linux Utility لإدارة الموارد هي واحدة من أنظمة إدارة المجموعات وجدولة الوظائف المفضلة والمستخدمة بسهولة لمجموعات Linux. يُفضل SLURM نظرًا لكونه مفتوح المصدر ومتحمل للأخطاء وقابل للتطوير بدرجة كبيرة.

يمكن لهذا النظام الآن التفاعل بشكل جيد مع وحدات معالجة الرسومات AMD. يتضمن أحدث إصدار 20.02.0 من SLURM مكونات AMD الإضافية التي تمكن SLURM من اكتشاف وتهيئة وحدات معالجة الرسومات AMD تلقائيًا. يقوم أيضًا بجمع والإبلاغ عن استهلاك الطاقة لرقائق الرسومات. يعد دعم SLURM إضافة مفيدة نظرًا للعدد المتزايد لعمليات نشر الحوسبة الفائقة باستخدام وحدات معالجة الرسومات Radeon ومجموعات AMD GPU الأكبر حجمًا.

على الرغم من تضمين العديد من الميزات ، لا تزال هناك علامات على دعم GFX10 / Navi في ROCm. ال صفحة GitHub لـ ROCm تم تحديثه ليعكس كافة التغييرات وملاحظات التثبيت والمشكلات المعروفة.



العلامات ايه ام دي