Τρίτη, 8 Οκτωβρίου, 2024
ΑρχικήΤεχνολογίαΚίνα: Εκπαίδευση LLM με υψηλότερο αριθμό παραμέτρων και χρήση της τεχνολογίας της...

Κίνα: Εκπαίδευση LLM με υψηλότερο αριθμό παραμέτρων και χρήση της τεχνολογίας της Huawei


Ο κινεζικός κρατικός πάροχος China Telecom ανακοίνωσε την ανάπτυξη δύο LLM (μεγάλων γλωσσικών μοντέλων) που εκπαιδεύονται εξ ολοκλήρου σε εγχώρια παραγόμενα chips. Σε δήλωση του Ινστιτούτου Τεχνητής Νοημοσύνης της China Telecom, το ανοιχτού κώδικα TeleChat2-115B, το οποίο έχει πάνω από 100 δισεκατομμύρια παραμέτρους, και ένα δεύτερο ανώνυμο μοντέλο, το οποίο φέρεται να έχει 1 τρισεκατομμύριο παραμέτρους (!), εκπαιδεύτηκαν χρησιμοποιώντας δεκάδες χιλιάδες τοπικά κατασκευασμένους επεξεργαστές.

Η δήλωση υποστηρίζει ότι αυτή η εξέλιξη «δείχνει ότι η Κίνα έχει πραγματικά επιτύχει την πλήρη αυτάρκεια στην εγχώρια εκπαίδευση LLM», έναν δύσκολο στόχο για τη χώρα, δεδομένου ότι οι ΗΠΑ επέβαλαν αυστηρούς κανονισμούς εξαγωγής που εμποδίζουν την πρόσβαση σε GPUs υψηλής τεχνολογίας, όπως οι H100 και A100.

Αν και η China Telecom δεν έχει διευκρινίσει ποιος προμήθευσε τους επεξεργαστές που χρησιμοποιήθηκαν για την εκπαίδευση των LLM της, είναι πιθανό ότι η παρείχε την πλειοψηφία, αν όχι όλα. Η τελευταία έχει χαρακτηριστεί ως η εγχώρια εναλλακτική λύση στην Nvidia και η South China Morning Post ειώνει ότι η China Telecom «αποκάλυψε προηγουμένως ότι αναπτύσσει τεχνολογία LLM χρησιμοποιώντας επεξεργαστές Ascend που αναπτύχθηκαν από τον γίγαντα τηλεπικοινωνιακού εξοπλισμού με έδρα τη Shenzhen».

Η Huawei άρχισε πρόσφατα να στέλνει δείγματα του νέου επεξεργαστή Ascend 910C σε κινεζικές εταιρείες servers και τηλεπικοινωνιών για δοκιμές και έχει στοχεύσει σε μεγάλους πελάτες της Nvidia στην Κίνα με την ελπίδα να τους κάνει να αντικαταστήσουν τουλάχιστον μέρος των δραστηριοτήτων τους.

Παρόλο που υπάρχει μια ακμάζουσα μαύρη αγορά στην Κίνα για τις high-end GPU της Nvidia, πολλές εταιρείες, συμπεριλαμβανομένων των ByteDance και Alibaba, προτιμούν να παραμείνουν συμβατές και να χρησιμοποιούν χαμηλότερων προδιαγραφών, επιτρεπόμενες GPU όπως η H20 της Nvidia για να αποφύγουν νομικούς και δυσφημιστικούς κινδύνους και να διατηρήσουν την πρόσβαση στις υπηρεσίες υποστήριξης της Nvidia. Αυτές οι εταιρείες στρέφονται όλο και περισσότερο στη Huawei για τις ανάγκες τους σε AI. Πρόσφατα αναφέρθηκε ότι η ByteDance, ιδιοκτήτρια του TikTok, είχε υποβάλει παραγγελία για 100.000 επεξεργαστές Ascend.

Η South China Morning Post αναφέρει επίσης ότι, εκτός από τη Huawei, η China Telecom εξετάζει υλικό από την Cambricon, μια τοπική start-up εταιρεία κατασκευής AI chip, για να διαφοροποιήσει περαιτέρω τον εφοδιασμό.

[via]



VIA: TechGear.gr

Dimitris Troktikos
Dimitris Troktikoshttps://www.troktiko.net
Αφοσιωμένος λάτρης κινητών Samsung, ο Δημήτρης έχει εξελίξει μια ιδιαίτερη σχέση με τα προϊόντα της εταιρίας, εκτιμώντας τον σχεδιασμό, την απόδοση και την καινοτομία που προσφέρουν. Γράφοντας και διαβάζοντας τεχνολογικά νέα από όλο τον κόσμο.
RELATED ARTICLES

Απάντηση

Most Popular

Lastest Articles