23 Απρ 2025
READING

Οι παλαιότερες εκδοχές των μοντέλων ΑΙ πάσχουν από πρώιμη… άνοια!

4 MIN READ

Οι παλαιότερες εκδοχές των μοντέλων ΑΙ πάσχουν από πρώιμη… άνοια!

Οι παλαιότερες εκδοχές των μοντέλων ΑΙ πάσχουν από πρώιμη… άνοια!

Με χιουμοριστική διάθεση, αλλά πάντα επιστημονικά τεκμηριωμένα, το The British Medical Journal, ή BMJ, ένα από τα πιο παλιά και γνωστά ιατρικά επιστημονικά περιοδικά στον κόσμο, δημοσίευσε, πριν λίγους μήνες, τα αποτελέσματα μιας έρευνας σε τέσσερα κύρια μοντέλα ΑΙ και έκανε παγκόσμια αίσθηση.

Οι ειδικοί της αξιόπιστης, επιστημονικής επιθεώρησης, που ετοιμάζουν έρευνες, ανασκοπήσεις και κριτικές σχετικά με την ιατρική, τη δημόσια υγεία και τις κλινικές πρακτικές, σ αυτή την περίπτωση αποκάλυψαν σημαντικές αδυναμίες σε δημοφιλή μοντέλα τεχνητής νοημοσύνης), τα οποία παρουσίασαν συμπτώματα ανάλογα με ήπια γνωσιακή έκπτωση, το προκλινικό στάδιο, δηλαδή, που μπορεί να προηγηθεί άνοιας. Η έρευνα, που πραγματοποιήθηκε από νευρολόγους από το Ισραήλ και τη Βρετανία, χρησιμοποίησε τυποποιημένα γνωσιακά τεστ για να αξιολογήσει την απόδοση των μοντέλων σε τομείς όπως η χωρική αντίληψη, η μνήμη και οι εκτελεστικές λειτουργίες. Επέλεξαν και μελέτησαν τέσσερα κύρια μοντέλα ΑΙ, το ChatGPT-4 και το ChatGPT-4o της OpenAI, το Gemini 1 και το Gemini 1.5 της Google και το Claude 3.5 της Anthropic. Τα μοντέλα υποβλήθηκαν στο Montreal Cognitive Assessment ή MoCA, ένα τεστ που χρησιμοποιείται κλινικά για την ανίχνευση γνωσιακής εξασθένησης. Το τεστ περιλαμβάνει ερωτήσεις, που μετρούν την προσοχή και τη συγκέντρωση, τη βραχυπρόθεσμη μνήμη, τις γλωσσικές δεξιότητες, τη χωρική αντίληψη, όπως τη σχεδίαση ενός ρολογιού σε συγκεκριμένη ώρα και τις εκτελεστικές λειτουργίες, όπως η ταξινόμηση αριθμών και γραμμάτων. Το μεγαλύτερο δυνατό σκορ είναι 30, με τις τιμές κάτω από 26 να υποδηλώνουν πιθανή γνωσιακή δυσλειτουργία.

Τα αποτελέσματα προκάλεσαν μεγάλη εντύπωση, με το ChatGPT-4o να παίρνει την υψηλότερη βαθμολογία με 26 στα 30.  Δεύτερο σε σκορ βρέθηκε το ChatGPT-4 με 25 στα 30. Αντίθετα, το Gemini 1.5 είχε τη χειρότερη επίδοση με μόλις 16 στα 30, παρουσιάζοντας ιδιαίτερες δυσκολίες στη χωρική αντίληψη και την απομνημόνευση λέξεων. Όλα τα μοντέλα απέτυχαν σε βασικές εργασίες, όπως τη σωστή τοποθέτηση των δεικτών σε ένα τεστ ρολογιού, την ταξινόμηση αριθμών και γραμμάτων σε αύξουσα σειρά, την ερμηνεία οπτικά πολύπλοκων εικόνων. Απέτυχαν, όπως ήταν αναμενόμενο και στην έκφραση ενσυναίσθησης, αφού λειτουργούν με βάση στατιστικά μοτίβα και προ-εκπαιδευμένα δεδομένα, χωρίς, βέβαια, κατανόηση των συναισθημάτων ή αυτεπίγνωση. Οι επιστήμονες περίμεναν στις προσομοιώμενες απαντήσεις τους, που φαίνονται ας πούμε συμπονετικές βάσει του εκπαιδευτικού τους υλικού, καλύτερες απαντήσεις και υψηλότερα σκορ. Εννοείται πως η ενσυναίσθηση είναι κρίσιμη στην ιατρική γιατί η θεραπευτική σχέση βασίζεται στην ικανότητα του γιατρού να κατανοεί τον συναισθηματικό πόνο του ασθενούς, να προσαρμόζει την επικοινωνία του και να δημιουργεί εμπιστοσύνη και χωρίς μια αποτελεσματική προσομοίωση της, η ΑΙ κινδυνεύει να δώσει ψυχρές ή ακατάλληλες απαντήσεις σε ευαίσθητες καταστάσεις, όπως η διάγνωση σοβαρών ασθενειών ή η ψυχολογική υποστήριξη, όπου η ανθρώπινη σύνδεση είναι απαραίτητη.

Οι ερευνητές στη χιουμοριστικά εκφρασμένη, σε μεγάλο μέρος δημοσίευση τους, υπογράμμιζαν πως τα γλωσσικά μοντέλα διαφέρουν σημαντικά από τον ανθρώπινο εγκέφαλο, καθώς δεν λειτουργούν με βιολογικές διεργασίες, κάτι που εξηγεί τις αδυναμίες τους σε καθήκοντα που απαιτούν διαισθητική κατανόηση ή πραγματογνωσία. Τα ευρήματα τους, αμφισβητούν την ικανότητα της τεχνητής νοημοσύνης να αντικαταστήσει γιατρούς, ειδικά σε ευαίσθητους τομείς όπως η νευρολογία. Παρατηρήθηκε επίσης, ότι παλαιότερες εκδόσεις μοντέλων, όπως το Gemini 1 σε σύγκριση με το 1.5, είχαν χειρότερες επιδόσεις, κάτι που θυμίζει τη γνωσιακή εξασθένηση σε ηλικιωμένους ασθενείς, όπου η ηλικία μειώνει την ταχύτητα επεξεργασίας και την απομνημόνευση. Έτσι, όπως οι παλαιότερες εκδόσεις ΑΙ δείχνουν υπολειτουργία σε σχέση με τα νεότερα μοντέλα, έτσι και ο ανθρώπινος εγκέφαλος μπορεί να χάνει ακρίβεια με τα χρόνια.

Η μελέτη καταλήγει στην πρόταση να υπάρξει μεγαλύτερη διερεύνηση για τη βελτίωση της χωρικής αντίληψης και την ενσωμάτωση συναισθηματικής νοημοσύνης στα μοντέλα ΑΙ, ώστε να μπορούν να αλληλοεπιδρούν πιο αποτελεσματικά με τους ανθρώπους. Επίσης, υποδεικνύει τη σύγκριση ανά γενεές μοντέλων για την παρακολούθηση τυχόν “γνωσιακής υποβάθμισης” σε τεχνητά συστήματα. Τα αποτελέσματα δείχνουν ότι η ΑΙ δεν είναι έτοιμη να αναλάβει κρίσιμους ρόλους στην ιατρική και ότι ίσως χρειαστούν νέες προσεγγίσεις για τη διάγνωση και τη θεραπεία των ίδιων των αδυναμιών της τεχνητής νοημοσύνης, όπως σχολίασε η ερευνητική ομάδα. Οι ερευνητές, κατέληξαν πως τα αποτελέσματα της έρευνα «δείχνουν ότι, παρόλο που τα γλωσσικά μοντέλα μπορούν να μιμηθούν ιατρικές γνώσεις, η έλλειψη πραγματικής κατανόησης, ενσυναίσθησης και διαισθητικής λογικής τα καθιστά επικίνδυνα για αυτόνομη κλινική χρήση…».

Οι νευρολόγοι και ειδικοί στη γνωσιακή υγιεινή, κατέληξαν πως «… η ΑΙ μπορεί να παράγει ακριβείς πληροφορίες, αλλά χωρίς την ανθρώπινη κρίση και τη συναισθηματική νοημοσύνη, δεν μπορεί να διαχειριστεί την πολυπλοκότητα ενός ασθενή. Αυτό δεν είναι απλώς ένα τεχνικό ζήτημα -είναι ένα θεμελιώδες όριο στην τρέχουσα τεχνολογία».

Συνδεθείτε παρακάτω
ή αποκτήστε ετήσια συνδρομή εδώ.