Vorige week op Intel’s Innovatieconferentie werd de Intel Developer Cloud”DevCloud”aangekondigd, terwijl er aan de AMD-kant al iets soortgelijks is: de AMD Cloud-platform. Eind 2021 kondigde AMD de Accelerator Cloud aan als een manier om de nieuwste EPYC-CPU’s en Instinct-versnellers uit te proberen, compleet met een vooraf geconfigureerde ROCm-rekensoftwarestack. Het AMD Cloud Platform is momenteel een parallelle inspanning met de Accelerator Cloud, waarbij de eerste meer bedoeld is voor ontwikkelaars, terwijl de laatste meer klantgericht is. Na het AMD Cloud Platform uitgeprobeerd te hebben, is het inderdaad een gemakkelijke manier om de nieuwste AMD-datacenterproducten te evalueren terwijl je beschikt over een eenvoudig te implementeren, vooraf geconfigureerde softwareomgeving.

Het AMD Cloud Platform (of de vergelijkbare AMD Accelerator Cloud) staat al lang op mijn TODO-lijst om er toegang toe te hebben om te testen, hoewel mijn TODO-lijst eeuwig lang is en toen herinnerde Intel’s DevCloud-aankondiging me aan deze langverwachte evaluatie. Terwijl Intel’s Developer Cloud zich richt op het uitproberen van pre-productie hardware zoals de aankomende Sapphire Rapids, Data Center GPU’s en andere producten, gaat het in het geval van het AMD Cloud Platform op dit moment over vrijgegeven maar huidige hardware: AMD EPYC”Milan”CPU’s en een assortiment van verschillende AMD Instinct-accelerators zijnde het huidige aanbod.

Op dit moment zijn de AMD Accelerator Cloud en AMD Cloud Platform twee vergelijkbare AMD-clouds bij het bedrijf, zij het beheerd door verschillende groepen, maar hopelijk zullen ze na verloop van tijd samensmelten tot één enkele cloud… Het lijkt een beetje vreemd dat AMD twee verschillende maar vergelijkbare clouds heeft met totaal verschillende branding en veel mensen hebben waarschijnlijk nog nooit van beide gehoord. Het AMD Cloud Platform is meer bedoeld voor het testen van ontwikkelaars, waar de AMD Accelerator Cloud werd opgericht met marketing/klanten in gedachten. Ik weet zeker dat we dit in de loop van de tijd zullen zien uitbreiden met Xilinx-producten en dergelijke. We zullen zien of ze in de toekomst ook pre-productie hardwaretoegang aanbieden als een knipoog van Intel’s Developer Cloud.

Vergeleken met openbare cloudproviders, is de AMD Cloud Platform biedt veel documentatie over het uitvoeren van verschillende applicaties/workloads om ervoor te zorgen dat u de Instinct-versnellers goed gebruikt.

AMD’s Cloud Platform is momenteel verspreid over AMD’s faciliteiten in Frankfurt en München.

Voor de doeleinden van deze test bood AMD gratis toegang tot hun ACP-cloud.

Het AMD Cloud Platform is zeer gestructureerd en vanuit de webgebaseerde interface is het heel gemakkelijk om een ​​aantal verschillende en veelvoorkomende GPU-computing-gerichte workloads uit te voeren, zoals PyTorch, DeepSpeed, MLFlow en verschillende benchmarks van HPL-AI tot MLPerf en andere. AMD zegt dat ze doorgaan met het toevoegen van meer benchmarks en HPC-workloads die momenteel beschikbaar zijn vanaf de AMD Infinity Hub en ook aan het AMD Cloud Platform.

Met deze verschillende stock-applicaties is nog steeds de mogelijkheid om zaai aangepaste inputs/modellen en andere configuratiewijzigingen om de evaluatie aan uw behoeften te voldoen.

Het AMD Cloud Platform biedt ook een interactieve SSH-sessie voor diegenen die gewoon op afstand verbinding willen maken met een AMD-knooppunt om uw eigen aangepaste werklast uit te voeren of te verkennen. Met die interactieve sessie via SSH is de ROCm-rekenstack ook vooraf geconfigureerd, net als alle andere applicatie-instances-waardoor het heel snel en gemakkelijk gaat als je de AMD-software/hardware-ondersteuning wilt evalueren zonder eerst in de hardware te investeren en ook de tijd besteed aan het opzetten van de softwarestack.

Het AMD Cloud Platform maakt het ook mogelijk om het aantal nodes, het aantal GPU’s tot 16 (maar 8 is de huidige limiet) te specificeren , en alle andere applicatiespecifieke configuratiewijzigingen.

Over het algemeen was dit een leuke en efficiënte manier om met name de AMD Instinct-versnellers uit te proberen met een vooraf geconfigureerde softwarestack. Via de verschillende openbare clouds is het al heel eenvoudig als je alleen de AMD EPYC Milan/Milan-X CPU-prestaties wilt evalueren, terwijl het met het AMD Cloud Platform het mogelijk maakt om Instinct-versnellers via de MI250 te proberen met maximaal 8 GPU’s (de webinterface heeft een knop voor 16 GPU’s, maar er is mij verteld dat ze nog geen servers met 16 GPU’s hebben), terwijl ze vooral de vooraf geconfigureerde softwarestack klaar hebben voor gebruik. Dankzij de structuur van het AMD Cloud Platform hoeft u ROCm niet handmatig in te stellen en vanuit de webinterface kunt u verschillende veelvoorkomende AI/ML-gerichte workloads evalueren of uw eigen interactieve SSH-sessie hebben voor meer aangepaste evaluaties. Hopelijk wordt dit in de toekomst uitgebreid met AMD-Xilinx-producten. Als dit niet al selectief is gedaan, zou het ook leuk zijn om de mogelijkheid te hebben om-met een knipoog van Intel DevCloud-het te gebruiken om meer pre-productie evaluatie/enablement werk te laten plaatsvinden met AMD-partners en klanten.

Degenen die Cloud Platform/Accelerator Cloud-toegang willen aanvragen of meer willen weten, gaan naar de AMD.com Accelerator Cloud-pagina en/of acp.amd.com.

Categories: IT Info