Η AI σε τροχιά σύγκρουσης με την ανθρώπινη εξειδίκευση

Νέα μελέτη της OpenAI αποκαλύπτει επιταχυνόμενη υπεροχή σε επαγγελματικές δεξιότητες

 
Μια νέα, πρωτοποριακή μελέτη της OpenAI έρχεται να ταράξει τα νερά της παγκόσμιας αγοράς εργασίας, αποκαλύπτοντας ότι τα κορυφαία μοντέλα Τεχνητής Νοημοσύνης (AI) όχι μόνο πλησιάζουν, αλλά σε πολλές περιπτώσεις αρχίζουν να ξεπερνούν τις δεξιότητες των ανθρώπων επαγγελματιών σε σύνθετες εργασίες γραφείου. Η έρευνα εισάγει ένα νέο εργαλείο αξιολόγησης, το GDPval, το οποίο καταδεικνύει ότι ο ρυθμός βελτίωσης των AI bots είναι «υπερ-γραμμικός», δηλαδή τα κέρδη στην απόδοσή τους επιταχύνονται με πρωτοφανή ρυθμό.

Γιατί αυτό έχει σημασία: Η ανάγκη για μετρήσιμα αποτελέσματα

Σε μια εποχή που οι ηγέτες επιχειρήσεων προσπαθούν να δικαιολογήσουν τις τεράστιες επενδύσεις στην Τεχνητή Νοημοσύνη, η έλλειψη αποτελεσματικών εργαλείων για τη μέτρηση της απόδοσης αποτελεί κρίσιμο πρόβλημα. Μια πρόσφατη μελέτη του MIT, η οποία έδειξε ότι τα περισσότερα έργα AI αποτυγχάνουν, υπογράμμισε ακριβώς αυτή την πρόκληση στη μέτρηση της επιστροφής αυτών των επενδύσεων. Σε αυτό το κενό έρχεται να απαντήσει η OpenAI, προσφέροντας μια απτή μέθοδο σύγκρισης της απόδοσης των μηχανών με την ανθρώπινη εργασία.

GDPval: Ένα νέο εργαλείο αξιολόγησης με βάση την πραγματική οικονομία

Η OpenAI παρουσίασε το GDPval-v0, έναν νέο τρόπο μέτρησης της απόδοσης των μοντέλων AI σε αυτό που ονομάζει «αυθεντικά παραδοτέα εργασίας», όπως η δημιουργία νομικών εγγράφων, μηχανολογικών σχεδίων και σχεδίων νοσηλευτικής φροντίδας.

  • Οικονομική Βάση: Το “GDP” στο όνομα του εργαλείου προέρχεται από το Ακαθάριστο Εγχώριο Προϊόν (Gross Domestic Product), καθώς οι ερευνητές χρησιμοποίησαν αυτόν τον δείκτη για να επιλέξουν τις εργασίες προς αξιολόγηση.
  • Μεθοδολογία: Οι ερευνητές ανέλυσαν περίπου 1.300 εργασίες από 44 διαφορετικά επαγγέλματα, σε εννέα επιχειρηματικούς τομείς που συνεισφέρουν ο καθένας πάνω από το 5% του ΑΕΠ των ΗΠΑ. Στη συνέχεια, ειδικοί αξιολογητές συνέκριναν τα παραδοτέα της Τεχνητής Νοημοσύνης με τα αντίστοιχα των ανθρώπων, χρησιμοποιώντας λεπτομερείς οδηγίες για να αποφασίσουν ποιο ήταν καλύτερο.

Η ερευνήτρια της OpenAI, Tejal Patwardhan, δήλωσε στο Axios: «Επιτέλους έχουμε έναν τρόπο να μετράμε πώς αποδίδουν τα μοντέλα μας στον πραγματικό κόσμο, όχι μόνο σε ακαδημαϊκά τεστ».

Τα ευρήματα: Εντυπωσιακή απόδοση και επιταχυνόμενη πρόοδος

Τα αποτελέσματα της μελέτης είναι αποκαλυπτικά για την ταχύτητα με την οποία εξελίσσεται η τεχνολογία.

  • Κορυφαίες Επιδόσεις: Τα σημερινά κορυφαία μοντέλα πλησιάζουν την ισοτιμία με τους ανθρώπους επαγγελματίες σε πολλές εργασίες. Σε τυφλές δοκιμές 220 εργασιών, το Claude Opus 4.1 της Anthropic ξεχώρισε ελαφρώς, με τα αποτελέσματά του να κρίνονται ισάξια ή καλύτερα από εκείνα των ανθρώπων ειδικών στο 47,6% των περιπτώσεων. Το GPT-5 της OpenAI ακολούθησε σε πολύ μικρή απόσταση, διαπρέποντας σε εργασίες που απαιτούσαν εξειδικευμένες γνώσεις. Η έρευνα περιλάμβανε επίσης αξιολογήσεις για τα μοντέλα Gemini της Google και Grok της xAI.
  • Ταχύτητα και Κόστος: Διαπιστώθηκε ότι τα κορυφαία μοντέλα μπορούν να ολοκληρώσουν τις εργασίες του GDPval περίπου εκατό φορές γρηγορότερα και φθηνότερα από τους ανθρώπους ειδικούς. Ωστόσο, η ίδια η έρευνα επισημαίνει ότι αυτοί οι αριθμοί βασίζονται στον χρόνο επεξεργασίας και τις χρεώσεις των API, και δεν συνυπολογίζουν το κόστος της ανθρώπινης επίβλεψης και κρίσης που απαιτείται σε πραγματικές συνθήκες.
  • Εκπληκτικό Στατιστικό: Η απόδοση υπερδιπλασιάστηκε από το μοντέλο GPT-4o (που κυκλοφόρησε την άνοιξη του 2024) στο GPT-5 (που κυκλοφόρησε το καλοκαίρι του 2025). «Διαπιστώνουμε ότι ο ρυθμός βελτίωσης είναι υπερ-γραμμικός· με άλλα λόγια, τα κέρδη επιταχύνονται», αναφέρει η OpenAI στην έκθεσή της.

Ο αντίκτυπος στην αγορά εργασίας: Συνεργασία αντί για αντικατάσταση

Παρά τα εντυπωσιακά ευρήματα, ο επικεφαλής οικονομολόγος της OpenAI, Ronnie Chatterji, εμφανίζεται καθησυχαστικός, τονίζοντας ότι το γεγονός πως τα μοντέλα AI μπορούν να εκτελέσουν αυτές τις εργασίες καλύτερα, φθηνότερα και γρηγορότερα, δεν σημαίνει ότι θα εκτοπίσουν μαζικά τους ανθρώπους από το εργατικό δυναμικό σύντομα.

«Η δουλειά σας θα είναι διαφορετική, ίσως με ένα διαφορετικό σύνολο καθηκόντων από ό,τι ήταν χθες», αναφέρει ο Chatterji. «Τα δεδομένα δείχνουν ότι τα μοντέλα AI είναι όλο και περισσότερο ικανά να κάνουν μεγάλο μέρος της δουλειάς που κάνουν οι άνθρωποι σήμερα». Καταλήγει λέγοντας: «Εκεί πιστεύω ότι προέρχεται η οικονομική αξία, ως συμπλήρωμα στους εργαζόμενους». Η πρόκληση, όπως σημειώνει, είναι ότι θα είναι δύσκολο να παρακολουθηθεί ο άμεσος αντίκτυπος στην αγορά εργασίας.

Πηγή: Axios

mywaypress.gr –Περιεχόμενο αξίας με την υποστήριξη  υβριδικής νοημοσύνης.

Για  αναγνώστες με μεγάλο εύρος προσοχής.

Σχετικά Άρθρα