
Secondo un'indagine del Dipartimento del Lavoro, uno stabilimento di produzione dell'Alabama ha esposto i dipendenti a rischi per la sicurezza utilizzando seghe non protette
Aug 24, 2023Amazon EC2 M7i e M7i
Jul 25, 2023Apollo atterra oggi. Un robot umanoide vitale che soddisfa e trasporta le scatole giuste
Jul 14, 2023Build Armored Core 6: telai eleganti che danno una spinta
Mar 04, 2024Presentazione del chip caldo di Arm: sviluppo del silicio più rapido, miglioramenti delle prestazioni
Jul 23, 2023Amazon EC2 M7i e M7i

InfoQ Homepage Novità Istanze Amazon EC2 M7i e M7i-flex ora disponibili per carichi di lavoro generici
09 agosto 2023 3 minuti di lettura
di
Steef-Jan Wiggers
AWS ha recentemente annunciato la disponibilità generale (GA) delle istanze Amazon EC2 M7i e M7i-flex, dotate di processori scalabili Intel Xeon di quarta generazione personalizzati (nome in codice Sapphire Rapids). Le istanze Amazon EC2 M7i e M7i-flex sono tipi di istanze destinate a carichi di lavoro generici che forniscono un equilibrio tra risorse di elaborazione, memoria e rete.
Le istanze Amazon EC2 M7i e M7i-flex sono progettate per carichi di lavoro che utilizzano equamente le risorse, come server Web e repository di codice. Rispetto alle istanze EC2 M6i annunciate due anni fa, l'azienda dichiara un rapporto prezzo/prestazioni migliore del 19% per le istanze M7i-flex e un rapporto prezzo/prestazioni migliore del 15% per le istanze M7i.
Le istanze M7i-flex sono una variante a basso costo delle istanze M7i. Sono disponibili nelle cinque dimensioni più comuni con dimensioni che vanno da 2 vCPU e 8 GiB di memoria (m7i-flex.large) a 32 vCPU e 128 GiB di memoria (m7i-flex.8xlarge), ciascuno con larghezza di banda di rete fino a 12,5 Gbps e larghezza di banda EBS fino a Gbps. Ideale, secondo l'azienda, per l'esecuzione di carichi di lavoro generici come server Web e applicativi, desktop virtuali, elaborazione batch, microservizi, database e applicazioni aziendali.
In un thread Reddit, l'M7i-flex solleva dubbi sul fatto che sia a basso costo, come chiede un intervistato seligman99:
Dato che è sullo Xeon di quarta generazione, mi chiedo se abbia qualcosa a che fare con il modo in cui vendono i core ad alta/bassa priorità agli utenti?
Con un altro Mutjny che risponde:
Questo è davvero un ottimo punto. Questi arrivano solo fino a 8xlarge e c'è un grafico che li elenca come "Prestazioni base / vCore: 40%", quindi penso che sia fortemente quello che è. Tranne che questi m7i-flex sono Intel Xeon Platinum 8488C, che mostra un chipset Sapphire Rapids, il che sembrerebbe controindicare che si tratti di core a basse prestazioni in una CPU core mista.
D'altra parte, le istanze M7i sono disponibili in nove dimensioni che vanno da 2 vCPU e 8 GiB di memoria (m7i.large) a 192 vCPU e 768 GiB di memoria (m7i.48xlarge) – con larghezza di banda di rete crescente fino a 50 GB e fino a 40 Larghezza di banda ESB Gb. Secondo l'azienda, queste istanze sono consigliate per carichi di lavoro come server applicativi e database di grandi dimensioni, server di gioco, apprendimento automatico basato su CPU e streaming video.
Inoltre, con acceleratori integrati come Intel Advanced Matrix Extensions (Intel AMX) nei processori Sapphire Rapids, Intel afferma in un comunicato stampa:
Gli acceleratori integrati come Intel Advanced Matrix Extensions (Intel AMX) offrono un'alternativa molto necessaria sul mercato per i clienti con una crescente domanda di carichi di lavoro AI. Xeon di quarta generazione con AMX può anche soddisfare i parametri delle prestazioni di inferenza per modelli linguistici di grandi dimensioni (LLM) inferiori a 20 miliardi di parametri, rendendo i LLM convenienti e sostenibili per l'esecuzione su infrastrutture generiche.
Gli altri acceleratori integrati nei processori Sapphire Rapids sono:
Inoltre, le future aggiunte alla famiglia M7i includeranno dimensioni bare metal adatte a carichi di lavoro ad alta transazione e sensibili alla latenza.
Oltre ad AWS, Azure e Google Cloud offrono un'ampia selezione di tipi di istanze e diverse combinazioni di storage, CPU, memoria e capacità di rete, consentendo alle organizzazioni di ridimensionare le proprie risorse per soddisfare le esigenze dei loro carichi di lavoro specifici. Ad esempio, Microsoft offre varie macchine virtuali per carichi di lavoro generici; l'ultima è la serie Dv5, dotata del processore Intel Xeon Platinum di terza generazione. In confronto, Google Cloud dispone di macchine per uso generico E2, N2, N2D e N1 e istanze C3 rilasciate lo scorso ottobre, inclusi i processori Sapphire Rapids.