Διαφάνεια δεδομένων στην AI ανοιχτού κώδικα

29 Οκτωβρίου, 2024

Η Πρωτοβουλία για το Ανοικτό Λογισμικό (Open Source Initiative – OSI) δημοσίευσε τον επίσημο ορισμό της για την «ανοιχτή» τεχνητή νοημοσύνη, σε μια εξέλιξη που μπορεί οδηγεί σε αντιπαράθεση με μεγάλες τεχνολογικές εταιρείες όπως η Meta, της οποίας τα μοντέλα δεν πληρούν τους νέους κανόνες.

Η OSI αποτελεί εδώ και χρόνια τον κύριο οργανισμό για τον καθορισμό των προδιαγραφών του ανοικτού λογισμικού, αλλά τα συστήματα τεχνητής νοημοσύνης περιλαμβάνουν στοιχεία που δεν καλύπτονται από τις συμβατικές άδειες, όπως τα δεδομένα εκπαίδευσης των μοντέλων. Στο εξής, για να θεωρείται ένα σύστημα τεχνητής νοημοσύνης πραγματικά ανοιχτό, πρέπει να παρέχει πρόσβαση σε λεπτομέρειες σχετικά με τα δεδομένα που χρησιμοποιήθηκαν για την εκπαίδευσή του -ώστε να μπορούν άλλοι να το κατανοήσουν και να το αναπαραγάγουν- τον πλήρη κώδικα που χρησιμοποιείται για την κατασκευή και τη λειτουργία του, καθώς και τις ρυθμίσεις από την εκπαίδευση, τα οποία συμβάλλουν στην παραγωγή των αποτελεσμάτων του.

Αυτός ο ορισμός έρχεται σε άμεση αντίθεση με το μοντέλο Llama της Meta, το οποίο προωθείται ως το μεγαλύτερο ανοιχτό μοντέλο τεχνητής νοημοσύνης. Αν και το Llama είναι διαθέσιμο για λήψη και χρήση, περιλαμβάνει περιορισμούς για εμπορική χρήση (για εφαρμογές με πάνω από 700 εκατομμύρια χρήστες) και δεν παρέχει πρόσβαση στα δεδομένα εκπαίδευσης, γεγονός που το αποκλείει από τα πρότυπα της OSI για την ανεμπόδιστη χρήση, τροποποίηση και διανομή.

Η εκπρόσωπος της Meta, Faith Eischen, δήλωσε στο Verge ότι «συμφωνούμε με την OSI σε πολλά», αλλά η εταιρεία διαφωνεί με αυτόν τον ορισμό. «Δεν υπάρχει ένας μοναδικός ορισμός για την ανοιχτή τεχνητή νοημοσύνη, και είναι πρόκληση να διατυπωθεί, καθώς οι προηγούμενοι ορισμοί του ανοικτού λογισμικού δεν καλύπτουν τις πολυπλοκότητες των σημερινών ταχέως εξελισσόμενων μοντέλων τεχνητής νοημοσύνης.» «Θα συνεχίσουμε να συνεργαζόμαστε με την OSI και άλλους κλάδους της βιομηχανίας για να κάνουμε την τεχνητή νοημοσύνη πιο προσβάσιμη και ελεύθερη, ανεξάρτητα από τους τεχνικούς ορισμούς», πρόσθεσε η Eischen.

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ: Η παρακολούθηση των χρηστών στα social media - Εμπλοκή εταιρειών μέσων κοινωνικής δικτύωσης σε επιτήρηση

Για 25 χρόνια, ο ορισμός της OSI για το ανοιχτό λογισμικό ήταν ευρέως αποδεκτός από τους developers που επιθυμούν να βασιστούν στο έργο των άλλων χωρίς φόβο για αγωγές ή παγίδες αδειοδότησης. Τώρα, καθώς η τεχνητή νοημοσύνη επαναπροσδιορίζει το τοπίο, οι τεχνολογικοί κολοσσοί βρίσκονται μπροστά σε μια κρίσιμη επιλογή: να υιοθετήσουν αυτές τις καθιερωμένες αρχές ή να τις απορρίψουν. Το Linux Foundation έχει επίσης επιχειρήσει πρόσφατα να καθορίσει τι σημαίνει «ανοιχτή τεχνητή νοημοσύνη», σηματοδοτώντας έναν αυξανόμενο διάλογο σχετικά με το πώς οι παραδοσιακές αξίες του ανοικτού λογισμικού θα προσαρμοστούν στην εποχή της τεχνητής νοημοσύνης.

«Τώρα που έχουμε έναν σαφή ορισμό, μπορούμε ίσως να αντιταχθούμε πιο δυναμικά σε εταιρείες που “ξεπλένουν” την έννοια του ανοιχτού λογισμικού, δηλώνοντας ότι το έργο τους είναι ανοιχτό όταν στην πραγματικότητα δεν είναι», δήλωσε ο Simon Willison, ανεξάρτητος ερευνητής και δημιουργός του ανοικτού εργαλείου Datasette. Ο διευθύνων σύμβουλος της Hugging Face, Clément Delangue, χαρακτήρισε τον ορισμό της OSI «σημαντικό βήμα για τη διαμόρφωση της συζήτησης γύρω από τη διαφάνεια στην τεχνητή νοημοσύνη, ειδικά σε ό,τι αφορά τον κρίσιμο ρόλο των δεδομένων εκπαίδευσης.»

ΔΙΑΒΑΣΤΕ ΕΠΙΣΗΣ: Αντιμετωπίζοντας τις ψευδαισθήσεις AI: Η στρατηγική του Google DataGemma με το RAG

Ο εκτελεστικός διευθυντής της OSI, Stefano Maffulli, ανέφερε ότι η πρωτοβουλία χρειάστηκε δύο χρόνια για να διαμορφώσει τον συγκεκριμένο ορισμό, σε συνεργασία με εμπειρογνώμονες παγκοσμίως μέσω μιας συνεργατικής διαδικασίας. Αυτή η διαδικασία περιλάμβανε συνεργασία με ειδικούς από την ακαδημαϊκή κοινότητα, στη μηχανική μάθηση και την επεξεργασία φυσικής γλώσσας, φιλοσόφους, δημιουργούς περιεχομένου από τον κόσμο των Creative Commons και άλλους.

Παρόλο που η Meta επικαλείται ανησυχίες για την ασφάλεια για τον περιορισμό της πρόσβασης στα δεδομένα εκπαίδευσής της, οι επικριτές βλέπουν έναν απλούστερο στόχο: την ελαχιστοποίηση της νομικής ευθύνης και την προστασία του ανταγωνιστικού της πλεονεκτήματος. Πολλά μοντέλα τεχνητής νοημοσύνης είναι πιθανότατα εκπαιδευμένα σε υλικό με πνευματικά δικαιώματα. Τον Απρίλιο, οι *New York Times* ανέφεραν ότι η Meta είχε παραδεχτεί εσωτερικά ότι υπήρχε περιεχόμενο με πνευματικά δικαιώματα στα δεδομένα εκπαίδευσης «επειδή δεν υπάρχει τρόπος να το αποφύγουμε». Υπάρχει μια σειρά αγωγών κατά της Meta, OpenAI, Perplexity, Anthropic και άλλων για φερόμενη παραβίαση δικαιωμάτων, αλλά με σπάνιες εξαιρέσεις οι ενάγοντες πρέπει αυτή τη στιγμή να βασίζονται σε ενδείξεις για να αποδείξουν ότι το έργο τους έχει υποστεί λήψη δεδομένων.

Στις 12/11 το InfoCom World 2024!

H Ελλάδα βρίσκεται σε ένα σταυροδρόμι. Έχουν γίνει πολλά για τον ψηφιακό μετασχηματισμό στη χώρα, τόσο σε δημόσιο όσο και σε ιδιωτικό επίπεδο, αλλά η ανάγκη για ακόμα περισσότερα, είναι προφανής. Τι χρειαζόμαστε; Ένα άλμα!!

Μάθετε περισσότερα ΕΔΩ!

VIA: InfoCom.gr

Προηγούμενο άρθρο

Κατανόηση και χρήση του Adaptive Sound στην τηλεόρασή Samsung

Επόμενο άρθρο

Νέο iMac με τσιπ M4, Apple Intelligence και νέα χρώματα

Διαφάνεια δεδομένων στην AI ανοιχτού κώδικα

“Αναζητώντας τις διαφορές: Πεταλούδα σε 15 δευτερόλεπτα” – FOXreport.gr

Νέα ηλεκτρική σκούπα τροφίμων Xiaomi με super κουπόνι τιμής!

Έλλειψη WoW Tokens λόγω Mount στο World of Warcraft

ΑπάντησηΑκύρωση απάντησης

Most Popular

Τέλος εποχής για τα σούπερ μάρκετ ΑΒ Βασιλόπουλος: “Σεισμός” στην αγορά μετά από 85 χρόνια

Έκρηξη έντασης στο Survivor

Ανίχνευση υδραργύρου σε κονσέρβες τόνου

Greek Live Channels και Live Streaming – Δωρεάν Live Αγώνες

Lastest Articles

Κρούση μηνιγγίτιδας σε γυμνάσιο του Βύρωνα

ΗΠΑ καταδικάζουν πολύνεκρη επίθεση στο Σουδάν

Διακυμάνσεις στη Wall Street

Το Φόντο των Ναζί στην Αθήνα: Η επίσκεψη Σταϊνμάιερ