Σάββατο, 28 Σεπτεμβρίου, 2024
ΑρχικήΤεχνολογίαΝέα Έκδοση: Το Llama 3.2 της Meta κάνει την εμφάνισή του

Νέα Έκδοση: Το Llama 3.2 της Meta κάνει την εμφάνισή του


Η Meta ανακοίνωσε την παραγωγή του Llama 3.2, μιας άνευ προηγουμένου συλλογής μοντέλων τεχνητής νοημοσύνης δωρεάν και ανοιχτού κώδικα που στοχεύει στη διαμόρφωση του μέλλοντος της νοημοσύνης μηχανών με ευελιξία και αποτελεσματικότητα.

Δεδομένου ότι οι επιχειρήσεις αναζητούν αποκαλυπτικές λύσεις τεχνητής νοημοσύνης που μπορούν να λειτουργήσουν στο πιο κοινό υλικό ή σε εκείνα που είναι δημοφιλή για την ανάπτυξη λύσεων για μεγάλες επιχειρήσεις καθώς και για ανεξάρτητες, το Llama 3.2 προσφέρει μοντέλα.

Η εστίαση του Llama 3.2 σε συσκευές edge και κινητές συσκευές

Η έμφαση στην άκρη και την κινητικότητα είναι κάτι που είναι εμφανές στο Meta.

Όσον αφορά τις νέες δυνατότητες αυτής της έκδοσης, οι προγραμματιστές έχουν προσθέσει μικρού και μεσαίου μεγέθους vision LLM: 11B και 90B, και έτσι εισήγαγαν εναλλακτικές λύσεις καθαρού κειμένου, 1B και 3B.

Συγκεκριμένα, τα νέα μοντέλα που παρουσιάζονται εδώ είναι ευθυγραμμισμένα για τη λειτουργία συσκευών edge, καθιστώντας έτσι την τεχνολογία AI διαθέσιμη σε περισσότερους πελάτες. Τα ελαφριά μοντέλα μόνο κειμένου, ειδικά εκείνα χωρίς οπτικά δεδομένα, έχουν σχεδιαστεί για απλούστερες εργασίες, όπως η σύνοψη και η παρακολούθηση οδηγιών λόγω της χαμηλής υπολογιστικής ισχύος.

Τα υπομοντέλα του Llama 3.2 αποτελούνται από δύο μοντέλα στη συσκευή και δύο πολυτροπικά μοντέλα

Λόγω της κεντρικής επεξεργασίας δεδομένων σε κινητές συσκευές, με τοπική εκτέλεση, κανένα από τα δεδομένα δεν μεταφορτώνεται στο cloud, όπως αναφέρει η Meta,

“Η τοπική εκτέλεση σε κινητές συσκευές διασφαλίζει ότι τα δεδομένα παραμένουν στη συσκευή, ενισχύοντας το απόρρητο των χρηστών αποφεύγοντας την επεξεργασία που βασίζεται σε σύννεφο.”

Αυτή η δυνατότητα είναι ιδιαίτερα χρήσιμη για που επεξεργάζονται ευαίσθητα δεδομένα, καθώς επιτρέπει στην εφαρμογή να εκτελεί σημαντικές εργασίες, διατηρώντας παράλληλα την εμπιστευτικότητα των δεδομένων. Για παράδειγμα, οι χρήστες μπορούν να απαντούν σε προσωπικά μηνύματα ενώ τα συνοψίζουν ή να λαμβάνουν στοιχεία λίστας υποχρεώσεων από συσκέψεις χωρίς να μεταδίδουν μηνύματα σε εξωτερικούς διακομιστές.

Εξελίξεις στην αρχιτεκτονική μοντέλων

Η πιο σημαντική αλλαγή στο Llama 3.2 είναι διάφορες αρχιτεκτονικές βελτιώσεις. Τα νέα μοντέλα χρησιμοποιούν μια αρχιτεκτονική που βασίζεται σε προσαρμογέα που μπορεί να συνδυάσει κωδικοποιητές εικόνας με προεκπαιδευμένα μοντέλα κειμένου χωρίς τροποποίηση. Αυτή η ενσωμάτωση οδηγεί σε βελτιώσεις στην ικανότητα συλλογισμού τόσο σε τομείς κειμένου όσο και εικόνας και διευρύνει σημαντικά το εύρος των εφαρμογών για αυτά τα μοντέλα.

Τα προεκπαιδευμένα μοντέλα που προέκυψαν πέρασαν από αυστηρές ασκήσεις λεπτομέρειας που συνεπάγονταν τη χρήση τεράστιων θορυβωδών δεδομένων ζεύγους εικόνας-κειμένου.

Υπάρχει μια σημαντική προσθήκη στο μήκος περιβάλλοντος συμβολικού, και αυξήθηκε σε πολύ εντυπωσιακό 128 χιλ για τα ελαφριά μοντέλα 1Β και 3Β. Διευκολύνει την ευρύτερη μεταφορά δεδομένων, η οποία είναι ιδιαίτερα πολύτιμη για μεγάλα έγγραφα και περίπλοκη σκέψη.

Αυτή η ικανότητα να δέχεται τόσο μεγάλα μεγέθη εισόδου τοποθετεί το Llama 3.2 σε πλεονέκτημα σε σχέση με τους ανταγωνιστές στη δυναμική αγορά τεχνητής νοημοσύνης που κυριαρχείται από τα μοντέλα GPT του .

Τι λέτε για τις μετρήσεις απόδοσης;

Τα μοντέλα της Llama 3.2 έχουν επιδείξει εξαιρετικές μετρήσεις απόδοσης, ενισχύοντας περαιτέρω το ανταγωνιστικό τους πλεονέκτημα στην αγορά. Το μοντέλο 1Β πέτυχε βαθμολογία 49,3 στο σημείο αναφοράς MMLU, ενώ το μοντέλο 3Β σημείωσε βαθμολογία 63,4. Από την πλευρά της όρασης, τα μοντέλα 11B και 90B παρουσίασαν τις δυνατότητές τους με βαθμολογίες 50,7 και 60,3, αντίστοιχα, σε εργασίες οπτικής συλλογιστικής.

Αυτές οι μετρήσεις υποδεικνύουν ότι τα μοντέλα Llama 3.2 όχι μόνο πληρούν αλλά συχνά υπερβαίνουν τις επιδόσεις παρόμοιων προσφορών από άλλες εταιρείες, όπως η Claude 3 Haiku και η GPT4o-mini.

Η ενσωμάτωση της τεχνολογίας UnslothAI προσθέτει επίσης στην αποτελεσματικότητα αυτών των μοντέλων, επιτρέποντας διπλάσιες ταχύτητες μικρορύθμισης και συμπερασμάτων, ενώ μειώνει τη χρήση VRAM κατά 70%. Αυτή η βελτίωση είναι ζωτικής σημασίας για τους προγραμματιστές που θέλουν να εφαρμόσουν λύσεις τεχνητής νοημοσύνης σε πραγματικό χρόνο χωρίς να αντιμετωπίζουν περιορισμούς υλικού.

Συνεργασία και υποστήριξη οικοσυστήματος

Ένας από τους βασικούς παράγοντες που καθορίζουν την ετοιμότητα του Llama 3.2 να εισαχθεί στην αγορά είναι το καλά ανεπτυγμένο οικοσύστημά του. Οι συνεργασίες με άλλους ηγέτες της βιομηχανίας κινητής τηλεφωνίας, όπως η Qualcomm, η και το AWS, επιτρέπουν στους προγραμματιστές να εφαρμόσουν αυτά τα μοντέλα σε διαφορετικές ρυθμίσεις, περιβάλλοντα cloud και τοπικές συσκευές.

Ο Στοίβα Λάμα Διανομές όπως το Llama Stack για εγκαταστάσεις στη συσκευή και το Llama Stack για εγκατάσταση ενός κόμβου προσφέρουν λύσεις που οι προγραμματιστές μπορούν να επωφεληθούν και να ενσωματώσουν αυτά τα μοντέλα στα έργα τους χωρίς πρόσθετες επιπλοκές.

Πώς να χρησιμοποιήσετε το Meta Llama 3.2;

Η πιο πρόσφατη έκδοση του μοντέλου AI ανοιχτού κώδικα, Llama 3.2, είναι τώρα διαθέσιμη στο Ιστοσελίδα Meta Llamaπροσφέροντας βελτιωμένες δυνατότητες για προσαρμογή, τελειοποίηση και ανάπτυξη σε διάφορες πλατφόρμες.

Οι προγραμματιστές μπορούν να επιλέξουν από τέσσερα μεγέθη μοντέλων: 1B, 3B, 11B και 90B ή να συνεχίσουν να χρησιμοποιούν το προηγούμενο Llama 3.1.

Η Meta δεν κυκλοφορεί απλώς αυτά τα μοντέλα στη φύση. Είναι πρόθυμοι να διασφαλίσουν ότι οι προγραμματιστές έχουν όλα όσα χρειάζονται για να αξιοποιήσουν αποτελεσματικά το Llama 3.2. Αυτή η δέσμευση περιλαμβάνει την κοινή χρήση πολύτιμων εργαλείων και πόρων για να βοηθήσει τους προγραμματιστές να χτίσουν υπεύθυνα. Με τη συνεχή ενημέρωση των βέλτιστων πρακτικών της και τη δέσμευση με την κοινότητα ανοιχτού κώδικα, η Meta ελπίζει να εμπνεύσει την καινοτομία προάγοντας παράλληλα τη χρήση ηθικής τεχνητής νοημοσύνης.

“Είμαστε ενθουσιασμένοι που συνεχίζουμε τις συζητήσεις που κάνουμε με τους συνεργάτες μας και την κοινότητα ανοιχτού κώδικα και όπως πάντα, ανυπομονούμε να δούμε τι δημιουργεί η κοινότητα χρησιμοποιώντας το Llama 3.2 και το Llama Stack.”

δήλωσε ο Μέτα.

Αυτή η συλλογική προσέγγιση όχι μόνο ενισχύει τις δυνατότητες του Llama 3.2 αλλά ενθαρρύνει επίσης ένα ζωντανό οικοσύστημα. Είτε για ελαφριές λύσεις αιχμής είτε για πιο σύνθετες πολυτροπικές εργασίες, η Meta ελπίζει ότι τα νέα μοντέλα θα παρέχουν την ευελιξία που απαιτείται για την κάλυψη των διαφορετικών απαιτήσεων των χρηστών.


Πιστώσεις εικόνας: Μετα





VIA: DataConomy.com

Dimitris Troktikos
Dimitris Troktikoshttps://www.troktiko.net
Αφοσιωμένος λάτρης κινητών Samsung, ο Δημήτρης έχει εξελίξει μια ιδιαίτερη σχέση με τα προϊόντα της εταιρίας, εκτιμώντας τον σχεδιασμό, την απόδοση και την καινοτομία που προσφέρουν. Γράφοντας και διαβάζοντας τεχνολογικά νέα από όλο τον κόσμο.
RELATED ARTICLES

Απάντηση

Most Popular

Lastest Articles