back to top
ΑρχικήΤεχνολογίαΗ AMD παρουσιάζει το Instinct MI325X: Νέα GPU AI με τεράστια μνήμη...

Η AMD παρουσιάζει το Instinct MI325X: Νέα GPU AI με τεράστια μνήμη HBM3e και εντυπωσιακή βελτίωση απόδοσης


Η AMD κυκλοφόρησε τον πιο πρόσφατο επιταχυντή GPU AI Instinct MI325X που συνοδεύεται από 256 GB μνήμης HBM3e, ενώ το MI355X του επόμενου έτους θα λάβει 288 GB.

Η AMD κυκλοφορεί με HBM3e Χωρητικότητες μνήμης: 256 GB στο MI325X “CDNA 3” φέτος και 288 GB στο MI355X “CDNA 4” το επόμενο έτος

Στο πλαίσιο της ερινής εκδήλωσης “Advancing AI”, η AMD λανσάρει τον ολοκαίνουργιο Instinct MI325X AI GPU Accelerator που βελτιώνει το MI300X με ολοκαίνουργιες δυνατότητες.

Αλλά πριν μπούμε στις λεπτομέρειες, πρέπει να μιλήσουμε για την πλατφόρμα Instinct της AMD στο σύνολό της, η οποία έχει συγκεντρώσει υποστήριξη από τις κορυφαίες εταιρείες τεχνητής νοημοσύνης στον κόσμο και χρησιμοποιείται από μερικές από τις μεγαλύτερες μάρκες όπως η , η OpenAI και η Microsoft.

Η δέσμευση της AMD για ηγετική θέση στην απόδοση, την εύκολη μετανάστευση, ένα ανοιχτό οικοσύστημα και το χαρτοφυλάκιο με επίκεντρο τον πελάτη οδήγησε σε τεράστια υποστήριξη από κορυφαίους OEM και συνεργάτες στο cloud, και ως εκ τούτου, η εταιρεία έχει επιταχύνει την κυκλοφορία της επόμενης λύσης της ως AI Οι απαιτήσεις στον κλάδο αυξάνονται σε απαράμιλλα ύψη.

Επί του παρόντος, το MI300X της AMD λέγεται ότι προσφέρει έως και 30% υψηλότερη απόδοση σε μια σειρά φόρτων εργασίας ειδικά για την τεχνητή νοημοσύνη έναντι του NVIDIA H100. Η πρόσθετη δουλειά της AMD στη σουίτα ROCm βοηθά στην εξαγωγή μεγαλύτερης απόδοσης από τον κορυφαίο επιταχυντή, αλλά τώρα είναι η ώρα να δημιουργήσετε ακόμα καλύτερο υλικό με την ίδια ισχυρή υποστήριξη λογισμικού.

Γνωρίστε το AMD Instinct MI325X, αυτός ο ολοκαίνουργιος επιταχυντής είναι κατασκευασμένος με βάση τον ίδιο θεμελιώδη σχεδιασμό και αρχιτεκτονική με το MI300X. Χρησιμοποιώντας την αρχιτεκτονική CDNA 3 GPU, το MI325X μπορεί να θεωρηθεί ως αναβάθμιση στο μέσο του κύκλου, προσφέροντας 256 GB μνήμης HBM3e που κατασκευάζεται με στοίβες 16-Hi με εύρος ζώνης μνήμης έως 6 TB/s, 2,6 PFLOP FP8, 1,3 PFLOPs Απόδοση FP16, όλα συσκευασμένα σε ένα τσιπ με 153 δισεκατομμύρια τρανζίστορ.

2024-10-10_18-16-19
2024-10-10_18-16-25

Η AMD αναμένει την πρώτη παραγωγή GPU Instinct MI325X AI από το 4ο τρίμηνο του 2024 μαζί με τη διαθεσιμότητα αντίστοιχων λύσεων διακομιστή από το 1ο τρίμηνο του 2025 μέσω κορυφαίων συνεργατών. Οι διακομιστές AI Instinct θα διαθέτουν έως και 8 διαμορφώσεις MI325X με έως και 2 TB μνήμης HBM3e, 896 GB/s εύρος ζώνης infinity ύφασμα, 48 TB/s εύρος ζώνης μνήμης, ,8 PFLOPs FP8 και 10,8 PFLOPs FP8 και 10.4 επιδόσεις FPFL1. Κάθε GPU έχει επίσης ρυθμιστεί στα 1000W, κάτι που αποτελεί μεγάλη αύξηση σε σχέση με τις διαμορφώσεις 750-700W του MI300X.

Αναλύοντας τα νούμερα, η AMD ισχυρίζεται ότι ο επιταχυντής GPU Instinct MI325X AI θα πρέπει να είναι 40% ταχύτερος από το NVIDIA H200 στο Mixtral 8x7B, 30% ταχύτερος στο Mistral 7B και 20% ταχύτερος στο Meta Llama 3.1 70BLL. Μια πλατφόρμα 8x MI325X θα προσφέρει επίσης 40% ταχύτερη απόδοση έναντι μιας πλατφόρμας H200 HGX AI στο Llama 3.1 405B και 20% ταχύτερη στη δοκιμή συμπερασμάτων 70B. Όσον αφορά την εκπαίδευση AI, το MI325X θα προσφέρει παρόμοια ή 10% καλύτερη απόδοση από τις πλατφόρμες H200.

Το επόμενο έτος, η AMD σχεδιάζει να κυκλοφορήσει έναν ολοκαίνουργιο επιταχυντή GPU Instinct MI355X που θα στοχεύει φόρτους εργασίας AI και θα κατασκευαστεί χρησιμοποιώντας έναν κόμβο διεργασίας . Η GPU θα ενσωματώσει την αρχιτεκτονική CDNA 4. Όσον αφορά τις προδιαγραφές, η μνήμη θα αναβαθμιστεί σε ακόμη υψηλότερες χωρητικότητες, έως και 288 GB HBM3e ενώ θα προσφέρει υποστήριξη για τύπους δεδομένων FP4/FP6.

Η AMD λέει ότι η αρχιτεκτονική CDNA 4 προσφέρει 35x άλμα απόδοσης σε σχέση με το CDNA 3 συν 7 φορές αύξηση στον υπολογισμό AI, αύξηση 50% στη χωρητικότητα μνήμης/εύρος ζώνης και επίσης συνοδεύεται από τις πιο πρόσφατες βελτιώσεις στην απόδοση δικτύωσης.

Όσον αφορά την απόδοση, η GPU AMD Instinct MI355X AI θα προσφέρει έως και 2,3 PFLOPs απόδοσης FP16, αύξηση 80% σε σχέση με το MI325X, ενώ τα στοιχεία του FP8 έχουν επίσης αύξηση 80% στα 4,6 PFLOPs έναντι του MI325X. Οι νέες υπολογιστικές επιδόσεις FP6 και FP4 βαθμολογούνται με 9,2 PFLOP.

Το MI355X θα σημειώσει 50% αύξηση τόσο στη χωρητικότητα της μνήμης όσο και στο εύρος ζώνης της μνήμης, με ταχύτητες έως και 8 TB/s σε σχέση με το MI300X τρέχουσας γενιάς. Οι πρώτες πλατφόρμες που διαθέτουν οκτώ από αυτές τις GPU MI355X θα είναι διαθέσιμες το δεύτερο εξάμηνο του 2025 και θα προσφέρουν έως και 2,3 TB χωρητικότητας μνήμης HBM3E με εύρος ζώνης 64 TB/s, 18,5 PFLOPs FP16, 37 PFLOPs FP8 και 74 PFLOPs Υπολογισμός /FP4.

Το ROCm 6.2 συνεχίζει να καλεί το Dial Up AI Performance For Instinct

Επιστρέφοντας στο μέτωπο του λογισμικού, η AMD ανακοινώνει το πιο πρόσφατο οικοσύστημά της ROCm 6.2, το οποίο φέρνει μέση βελτίωση απόδοσης 2,4x και έως 2,8x σε μια σειρά φόρτου εργασίας AI στο Inferencing και μέση βελτίωση 2,4x στην απόδοση της Εκπαίδευσης.

Τέλος, η AMD εξακολουθεί να επιβεβαιώνει το Instinct MI400 της που κυκλοφόρησε το 2026 ως μέρος “CDNA Next” και δεν χρησιμοποιεί το όνομα αρχιτεκτονικής UDNA που αποκαλύφθηκε πρόσφατα. Ίσως είναι πολύ νωρίς για να προχωρήσουμε στην ονομασία του UDNA, καθώς δεν έχει γίνει επίσημη από την AMD, παρά το γεγονός ότι ένας από τους κορυφαίους εκπροσώπους της το επιβεβαίωσε, οπότε θα δούμε πώς θα πάει αυτό στο μέλλον.

Με αυτά τα λόγια, η AMD φαίνεται να μπαίνει στην τρέλα της τεχνητής νοημοσύνης με τις μελλοντικές προσφορές Instinct, φέρνοντας έντονο ανταγωνισμό ενάντια σε εταιρείες όπως η NVIDIA και αντιμετωπίζοντας επίσης την Intel που δυσκολεύονται να φτάσουν τα υπόλοιπα.

AMD Instinct MI325X AI GPU Accelerator Gallery:

AMD Instinct AI Accelerators:

Όνομα επιταχυντή AMD Instinct MI400 AMD Instinct MI350X AMD Instinct MI325X AMD Instinct MI300X AMD Instinct MI250X
Αρχιτεκτονική GPU CDNA Επόμενο CDNA 4 Aqua Vanjaram (CDNA 3) Aqua Vanjaram (CDNA 3) Aldebaran (CDNA 2)
Κόμβος διεργασίας GPU TBD 3 nm 5nm+6nm 5nm+6nm 6 nm
GPU Chiplets TBD 8 (MCM) 8 (MCM) 8 (MCM) 2 (MCM)
1 (Per Die)
Πυρήνες GPU TBD TBD 19.456 19.456 14.080
Ταχύτητα ρολογιού GPU TBD TBD 2100 MHz 2100 MHz 1700 MHz
INT8 Υπολογισμός TBD TBD 2614 ΚΟΡΥΦΕΣ 2614 ΚΟΡΥΦΕΣ 383 ΚΟΡΥΦΑΙΕΣ
FP6/FP4 Υπολογισμός TBD 9.2 PFLOP N/A N/A N/A
FP8 Υπολογισμός TBD 4.6 PFLOP 2.6 PFLOP 2.6 PFLOP N/A
FP16 Υπολογισμός TBD 2.3 PFLOP 1.3 PFLOP 1.3 PFLOP 383 TFLOP
FP32 Υπολογισμός TBD TBD 163,4 TFLOP 163,4 TFLOP 95,7 TFLOP
FP64 Υπολογισμός TBD TBD 81,7 TFLOP 81,7 TFLOP 47,9 TFLOP
VRAM TBD 288 HBM3e 256 GB HBM3e 192 GB HBM3 128 GB HBM2e
Infinity Cache TBD TBD 256 MB 256 MB N/A
Ρολόι μνήμης TBD 8,0 Gbps; 5,9 Gbps 5,2 Gbps 3,2 Gbps
Λεωφορείο μνήμης TBD 8192-bit 8192-bit 8192-bit 8192-bit
Εύρος ζώνης μνήμης TBD 8 TB/s 6,0 TB/s 5,3 TB/s 3,2 TB/s
Form Factor TBD ΟΑΜ ΟΑΜ ΟΑΜ ΟΑΜ
Ψύξη TBD Παθητική Ψύξη Παθητική Ψύξη Παθητική Ψύξη Παθητική Ψύξη
TDP (Μέγ.) TBD TBD 1000W 750 W 560 W

Προϊόντα που αναφέρονται σε αυτήν την ανάρτηση



VIA: wccftech.com

Dimitris Troktikos
Dimitris Troktikoshttps://www.troktiko.net
Αφοσιωμένος λάτρης κινητών Samsung, ο Δημήτρης έχει εξελίξει μια ιδιαίτερη σχέση με τα προϊόντα της εταιρίας, εκτιμώντας τον σχεδιασμό, την απόδοση και την καινοτομία που προσφέρουν. Γράφοντας και διαβάζοντας τεχνολογικά νέα από όλο τον κόσμο.
RELATED ARTICLES

Απάντηση

Most Popular

Lastest Articles