Το GPT-4, η νέα έκδοση του γλωσσικού μοντέλου στο οποίο βασίζεται η μηχανή διαλόγου ChatGPT, πέτυχε βαθμολογία 297 σε προσομοίωση που οργάνωσαν δύο καθηγητές Νομικής και δύο στελέχη της εταιρείας νομικής τεχνολογίας Casetest.
H βαθμολογία αυτή κατατάσσει το σύστημα στο κορυφαίο 10% των πραγματικών εξεταζόμενων, αναφέρουν οι ερευνητές σε μελέτη που δημοσιεύτηκε αυτή την εβδομάδα στο SSRN.
Οι διήμερες εξετάσεις για το επάγγελμα του δικηγόρου εξετάζουν τις γνώσεις στο Δίκαιο και τον νομικό συλλογισμό και περιλαμβάνουν τεστ που προσομοιώνουν νομικές εργασίες, δοκίμια και τεστ πολλαπλών επιλογών.
«Τα μεγάλα γλωσσικά μοντέλα πετυχαίνουν τις προδιαγραφές που ισχύουν για τους δικηγόρους σχεδόν σε όλες τις περιοχές δικαιοδοσίας των Ηνωμένων Πολιτειών» γράφουν οι συντάκτες της μελέτης.
Tα μοντέλα GPT (Γενετικός Προεκπαιδευμένος Μετασχηματιστής), δημιουργία της εταιρείας OpenAI στην οποία έχει επενδύσει δισεκατομμύρια η Microsoft, είναι αλγόριθμοι τεχνητής νοημοσύνης που εκπαιδεύτηκαν με δεδομένα στο Διαδίκτυο για να απαντούν ερωτήματα διατυπωμένα σε φυσική γλώσσα.
Εκτός από κείμενα, μπορούν να γράφουν θεατρικά έργα, μουσική, ακόμα και προγράμματα υπολογιστή σύμφωνα με τις οδηγίες του χρήστη.
Πριν από δύο μήνες, δύο μέλη της ίδιας ερευνητικής ομάδας είχαν υποβάλλει στις ίδιες εξετάσεις το ChatGPT της OpenAI, βασισμένο στο προηγούμενο μοντέλο GPT-3.5. Η μηχανή είχε τότε περάσει μετά βίας την βάση, ένδειξη της ταχύτητας με την οποία εξελίσσεται η τεχνολογία.
Ο Ντάνιελ Μάρτιν Κατζ, καθηγητής στη Νομική Σχολή Σικάγου-Κεντ, δήλωσε στο Reuters πως εντυπωσιάστηκε περισσότερο με τις επιδόσεις του μοντέλου στη συγγραφή δοκιμίων.
«Είχα ακούσει πολλούς να λένε ‘Εντάξει, μπορεί να τα πάει καλά με τα τεστ επιλογών αλλά δεν θα τα καταφέρει ποτέ στα δοκίμα’» είπε.
Τον Φεβρουάριο, η προηγούμενη βερσιόν του ChatGPT άγγιξε τη βάση και στις εξετάσεις USMLE που πρέπει να περνούν οι αμερικανοί γιατροί για να ασκήσουν το επάγγελμα.