Η Ενσωμάτωση της Τεχνητής Νοημοσύνης στη Λογοθεραπεία: Μια Ανασκόπηση στην Κλινική Πράξη, την Έρευνα και την Εκπαίδευση©

Μερόπη Ε. Χελιδόνη (Λογοπεδικός – Λογοθεραπεύτρια, ΩΡΛ Κλινική ΠΑΓΝΗ)

Φλωρα Ε. Αναγνώστου (Λογοπαθολόγος – Φωνοπαθολόγος-Ακοολογος)

Δρ Νίκος Α. Σπαντιδέας (Ιατρός, Ωτορινολαρυγγολόγος, Λογοθεραπευτής, Διδάκτωρ της Ιατρικής Σχολής του Πανεπιστημίου Ιωαννίνων)

Δρ Δημήτριος Ν. Γκέλης (Ιατρός, Ωτορινολαρυγγολόγος, Οδοντίατρος, Διδάκτωρ της Ιατρικής σχολής του Πανεπιστημίου Αθηνών)

Εισαγωγή

Η Τεχνητή Νοημοσύνη (AI) αναδεικνύεται ως ένας μετασχηματιστικός παράγοντας στις επιστήμες της υγείας, με τη λογοθεραπεία να βρίσκεται στην πρώτη γραμμή αυτής της εξέλιξης. Μέσω προηγμένων τεχνικών μηχανικής μάθησης, επεξεργασίας φυσικής γλώσσας και βαθιάς μάθησης, η AI προσφέρει νέες δυνατότητες για τη διάγνωση, τη θεραπεία και τη διαχείριση των διαταραχών επικοινωνίας και κατάποσης. Η παρούσα ανασκόπηση εξετάζει την ενσωμάτωση της AI στη λογοθεραπευτική πράξη, την έρευνα και την εκπαίδευση, με βάση την πιο πρόσφατη βιβλιογραφία, και αναδεικνύει, τόσο τις ευκαιρίες όσο, και τις προκλήσεις που προκύπτουν.

Τεχνητή Νοημοσύνη στην Κλινική Πράξη

1.1. Διαγνωστικά Εργαλεία Υποβοηθούμενα από AI

Η AI έχει αρχίσει να διαδραματίζει σημαντικό ρόλο στην αυτοματοποίηση και βελτίωση της διαγνωστικής διαδικασίας στις διαταραχές λόγου και ομιλίας. Μια συστηματική χαρτογράφηση ανέδειξε ότι, αν και η αποτελεσματικότητα των αλγορίθμων μηχανικής μάθησης δεν μπορεί ακόμα να επιβεβαιωθεί χωρίς μεγαλύτερα σύνολα δεδομένων πληθυσμού, η έρευνα κατευθύνεται προς την αυτοματοποίηση των τεσσάρων φάσεων της διαγνωστικής διαδικασίας [1]. Οι εφαρμογές της AI στον τομέα αυτό περιλαμβάνουν:

1.1.1. Νευρογενείς Διαταραχές Λόγου

Στις νευρογενείς διαταραχές λόγου, η AI χρησιμοποιείται, τόσο για διαγνωστικούς, όσο και για προγνωστικούς σκοπούς. Μια μελέτη ανέπτυξε ένα μοντέλο βαθιάς μάθησης βασισμένο σε μηχανισμούς προσοχής για την αξιολόγηση της βαρύτητας της δυσαρθρίας σε ασθενείς με πλάγια μυατροφική σκλήρυνση (ALS), χρησιμοποιώντας 2.102 ηχογραφήσεις από 125 συμμετέχοντες, οι οποίες αξιολογήθηκαν από τρεις λογοθεραπευτές [2]. Επίσης, ένα άλλο πλαίσιο μηχανικής μάθησης χρησιμοποίησε μοντέλα τύπου transformers για την ταξινόμηση της βαρύτητας της δυσαρθρίας απευθείας από ηχογραφήσεις ομιλίας, χωρίς την ανάγκη ειδικής γνώσης [3].

Στον χώρο της λογοθεραπείας, όταν αναφερόμαστε σε μοντέλα τύπου Transformers (όπως το GPT, το BERT ή το Claude), δεν εννοούμε ρομπότ που αλλάζουν σχήμα, αλλά μια επαναστατική αρχιτεκτονική τεχνητής νοημοσύνης που «καταλαβαίνει» τη γλώσσα με βάση το πλαίσιο (context).

Στη δυσαρθρία, μια συγκριτική μελέτη αξιολόγησε μοντέλα WaveNet και CNN-BiLSTM για βελτιωμένη ανίχνευση, τονίζοντας τη δυνατότητα ταχύτερων και πιο αξιόπιστων αξιολογήσεων [4]. Ενώ τα WaveNet και CNN-BiLSTM εστιάζουν κυρίως στην επεξεργασία του ήχου (της κυματομορφής της φωνής) για να εντοπίσουν τη δυσαρθρία, τα GPT, BERT και Claude ανήκουν στην οικογένεια των Large Language Models (LLMs). Βασίζονται στην αρχιτεκτονική Transformer και εστιάζουν στην κατανόηση του νοήματος και της δομής του κειμένου. Το CNN-BiLSTM είναι το «αυτί» που ακούει τη δυσλειτουργία στην ομιλία, τα GPT, BERT και Claude είναι ο «εγκέφαλος» που καταλαβαίνει το περιεχόμενο και βοηθά στη διαχείριση της πληροφορίας.

Σχετικά με την αφασία, νέες προσεγγίσεις περιλαμβάνουν την αξιολόγηση βασισμένη σε χαρακτηριστικά ROI από δομικές μαγνητικές τομογραφίες για την ταξινόμηση του τύπου της αφασίας, βοηθώντας τους κλινικούς γιατρούς στην εξατομίκευση της θεραπείας [5]. Στο πλαίσιο της νευροαπεικόνισης και της λογοθεραπείας, ο όρος ROI σημαίνει Region of Interest (Περιοχή Ενδιαφέροντος).

Όταν ένας κλινικός γιατρός ή ένας ερευνητής μελετά μια μαγνητική τομογραφία (MRI) ενός εγκεφάλου με αφασία, δεν αναλύει ολόκληρο τον εγκέφαλο ως μια ενιαία μάζα. Αντίθετα, «απομονώνει» συγκεκριμένες περιοχές που είναι γνωστό ότι σχετίζονται με τον λόγο. Αυτές οι επιλεγμένες περιοχές είναι τα ROIs.

Επιπλέον, μοντέλα μηχανικής μάθησης χρησιμοποιήθηκαν για την πρόβλεψη της ανάρρωσης σε δίγλωσσα άτομα με μετα-αγγειακή αφασία, αναδεικνύοντας τη σοβαρότητα του ασθενούς και τα δημογραφικά στοιχεία ως βασικούς προγνωστικούς παράγοντες [6].

1.1.2. Διαταραχές Φωνής

Στο πεδίο των φωνητικών διαταραχών, η AI προσφέρει νέες δυνατότητες για μη επεμβατική ανίχνευση και ταξινόμηση. Μια πρόσφατη ανασκόπηση εξέτασε τις εφαρμογές, τις προόδους, τις προκλήσεις και τις μελλοντικές προοπτικές των μεθόδων AI στη διάγνωση, παρακολούθηση και θεραπεία νευρολογικών φωνητικών διαταραχών, ξεκινώντας από τα βασικά στοιχεία της φωνητικής και ομιλιακής ανάλυσης [7]. Οι εφαρμογές περιλαμβάνουν τη χρήση μοντέλων wav2vec 2.0 ως μεθόδων εξαγωγής χαρακτηριστικών σε συνδυασμό με ταξινομητές μηχανικής μάθησης, που αποδείχθηκαν εξαιρετικά αποτελεσματικά στην ταξινόμηση φυσιολογικών και παθολογικών φωνών [8]. Το wav2vec 2.0 είναι ένα από τα πιο εξελιγμένα μοντέλα τεχνητής νοημοσύνης που υπάρχουν σήμερα για την επεξεργασία του ήχου της ομιλίας. Αναπτύχθηκε από την ομάδα AI της Meta (Facebook) και λειτουργεί με μια λογική που θυμίζει πολύ τον τρόπο που ένα μωρό μαθαίνει να καταλαβαίνει ήχους πριν καν μάθει να μιλάει.Επιπλέον, ένα μοντέλο μηχανικής μάθησης ανέπτυξε τον Ενσωματωμένο Δείκτη Φωνητικής Απόκλισης (IVDI), ο οποίος περιλαμβάνει τέσσερα ακουστικά και τέσσερα ακουστικο-αντιληπτικά μέτρα, δείχνοντας εξαιρετική απόδοση στην ταξινόμηση των φωνών σύμφωνα με τον γενικό βαθμό απόκλισης [9].

1.1.3. Δυσφαγία

Η AI έχει επίσης εφαρμοστεί στη διάγνωση και διαχείριση της δυσφαγίας. Μια σκοπική ανασκόπηση [(scoping review) είναι ένας συγκεκριμένος τύπος επιστημονικής μελέτης που έχει ως στόχο να «χαρτογραφήσει» τη διαθέσιμη βιβλιογραφία γύρω από ένα ευρύ θέμα] χαρτογράφησε και συνέθεσε στοιχεία σχετικά με τις τεχνολογικές προόδους χρησιμοποιώντας AI στη διάγνωση και διαχείριση της δυσφαγίας, υπογραμμίζοντας ότι η AI προσφέρει νέες προοπτικές για τον εντοπισμό των αλλοιώσεων της κατάποσης και τη διευκόλυνση της διαδικασίας αποκατάστασης [10]. Συγκεκριμένα, μια μελέτη ανέπτυξε ένα μοντέλο βαθιάς μάθησης [Ένα μοντέλο βαθιάς μάθησης (Deep Learning) είναι ένας τύπος Τεχνητής Νοημοσύνης που προσπαθεί να μιμηθεί τον τρόπο με τον οποίο λειτουργεί ο ανθρώπινος εγκέφαλος για να επεξεργαστεί δεδομένα και να δημιουργήσει πρότυπα για τη λήψη αποφάσεων]. Ανήκει στην ευρύτερη οικογένεια της Μηχανικής Μάθησης (Machine Learning), αλλά η ειδοποιός διαφορά του είναι η δομή του: χρησιμοποιεί Τεχνητά Νευρωνικά Δίκτυα με πολλά επίπεδα (layers) — εξού και ο όρος “βαθιά” (deep)] για την αυτόματη ανίχνευση διείσδυσης και εισρόφησης στη βιντεοφθοροσκοπική μελέτη κατάποσης (VFSS) [11]. Επιπλέον, ένα άλλο μοντέλο Vision Transformer (ViT) [ο Vision Transformer (ViT) είναι μια πρωτοποριακή αρχιτεκτονική βαθιάς μάθησης που παίρνει τη συνταγή των Transformers (που αρχικά σχεδιάστηκαν για κείμενο, όπως το ChatGPT) και την εφαρμόζει με επιτυχία στην ανάλυση εικόνων]

Μέχρι την εμφάνιση του ViT, ο “βασιλιάς” στην επεξεργασία εικόνας ήταν τα Συνελικτικά Νευρωνικά Δίκτυα (CNNs). Το ViT απέδειξε ότι μπορούμε να κατανοήσουμε μια εικόνα χρησιμοποιώντας ακριβώς τους ίδιους μηχανισμούς που χρησιμοποιούμε για να κατανοήσουμε μια πρόταση] αυτοματοποίησε την ταξινόμηση των VFSS για δυσφαγία, ξεπερνώντας τα παραδοσιακά συνελικτικά νευρωνικά δίκτυα (CNN) στην ακριβή ανίχνευση ανωμαλιών [12].

1.1.4. Παιδικές Διαταραχές Λόγου και Ομιλίας

Στις παιδιατρικές διαταραχές, η AI ενσωματώνεται όλο και περισσότερο, τόσο στη διάγνωση, όσο και στην παρέμβαση. Μια σκοπική ανασκόπηση ανέδειξε ότι τα εργαλεία που βασίζονται στην AI αποδείχθηκαν πιο ελκυστικά για τα παιδιά από την παραδοσιακή θεραπεία, προσφέροντας εξατομικευμένα θεραπευτικά πλάνα και άμεση ανατροφοδότηση [13]. Η ανάλυση λόγου με χρήση AI και τα συστήματα αυτόματης αναγνώρισης ομιλίας χρησιμοποιούνται ολοένα και περισσότερο στη θεραπεία των διαταραχών λόγου (SSDs), με μια μελέτη να συγκρίνει την ακρίβεια ανατροφοδότησης ενός νέου αλγορίθμου αυτόματης ανάλυσης λόγου (ASA) σε σύγκριση με τις κρίσεις των κλινικών [14].

1.2. Παρεμβάσεις και Θεραπείες Υποβοηθούμενες από AI

Η AI δεν περιορίζεται μόνο στη διάγνωση, αλλά επεκτείνεται και στην ίδια τη θεραπευτική διαδικασία, προσφέροντας νέες δυνατότητες για εξατομίκευση, αυξημένη ένταση και πρόσβαση σε υπηρεσίες.

1.2.1. Εξατομικευμένη Παρέμβαση

Η ικανότητα της AI να αναλύει δεδομένα πολλαπλών τρόπων λειτουργίας (ακουστικά, γλωσσικά, κινητικά, γνωστικά) επιτρέπει την εξατομίκευση των θεραπευτικών συστάσεων [15]. Σε μια πιλοτική μελέτη, αξιολογήθηκε η θεραπευτική αποτελεσματικότητα μιας γενετικής Ενισχυμένης με Τεχνητή Νοημοσύνη (AI-powered) ψηφιακής διαδραστικής πλατφόρμας για υποστηριζόμενη στο σπίτι θεραπεία λόγου σε παιδιά με καθυστέρηση λόγου ή διαταραχή αυτιστικού φάσματος [16]. Η θεραπεία ακριβείας φωνής βρίσκεται σε άνοδο, με την AI και τη μηχανική μάθηση να αναλύουν δείγματα φωνής για να βοηθήσουν τους κλινικούς γιατρούς να ανιχνεύσουν λεπτές αλλαγές, να παρακολουθούν την πρόοδο και να προσαρμόζουν τις παρεμβάσεις [17]. Ειδικότερα στην αποκατάσταση της αφασίας, μια μελέτη διερεύνησε τη χρήση προ-εκπαιδευμένων γλωσσικών μοντέλων (PLMs) στην παρακολούθηση της ανάρρωσης της γλώσσας που προκαλείται από θεραπεία εκκίνησης, χρησιμοποιώντας τα επίπεδα έκπληξης (surprisals) ως ένα συνεχές και ερμηνεύσιμο μέτρο της γλωσσικής αλλαγής που προκαλείται από τη θεραπεία [18]. Επιπλέον, οι εφαρμογές της AI στην ενισχυτική και εναλλακτική επικοινωνία (AAC) αποτελούν ένα ταχέως αναπτυσσόμενο πεδίο, με μια σκοπική ανασκόπηση να αναλύει τη σύγκλιση μεταξύ AAC και νέων τεχνολογιών, με έμφαση στον ρόλο που διαδραματίζουν η AI και οι φορητές συσκευές στην ενίσχυση της επικοινωνίας και των κοινωνικών δεξιοτήτων σε άτομα με σύνθετες επικοινωνιακές ανάγκες [19].

1.2.2. Υβριδικά Μοντέλα Φροντίδας και Τηλεθεραπεία

Η AI διευκολύνει την ανάπτυξη υβριδικών μοντέλων φροντίδας, συνδυάζοντας την παραδοσιακή λογοθεραπεία με ψηφιακά εργαλεία. Μια κλινική δοκιμή αξιολογεί την αποτελεσμασία (efficacy) [Είναι η θεωρητική ικανότητα ή η εσωτερική δύναμη ενός μέσου να φέρει αποτέλεσμα] ενός υβριδικού μοντέλου λογοθεραπείας που υποστηρίζεται από AI, το οποίο συνδυάζει τη χρήση ενός AI θεραπευτή ομιλίας (Jessica)].

Η Jessica δεν είναι ένας ζωντανός άνθρωπος, αλλά ένα ψηφιακό σύστημα (συχνά με μορφή avatar) που λειτουργεί ως «εικονικός λογοθεραπευτής] με παραδοσιακές συνεδρίες λογοθεραπείας, εστιάζοντας στην παραγωγή ήχων /ɹ/ και /s/ [20].

Η εφαρμογή SAMI, μια κλινική εφαρμογή για κινητά, χρησιμοποιείται για την πρόβλεψη της νοημοσύνης της ομιλίας και της σοβαρότητας της διαταραχής, καθώς και για την παρακολούθηση της προόδου των ασθενών με καρκίνο κεφαλής και τραχήλου [21].

Ένα άλλο εργαλείο, το MORA, εισάγει μια ροή εργασίας “AI-in-the-loop”, επιτρέποντας στους λογοθεραπευτές να διαμορφώνουν υλικά-στόχους, να ελέγχουν την καταγεγραμμένη ομιλία με βαθμολόγηση σε επίπεδο φωνήματος και να προσαρμόζουν ασύγχρονα τα θεραπευτικά πλάνα, γεφυρώνοντας το χάσμα μεταξύ κλινικής και κατ’ οίκον εξάσκησης [22]. Αυτές οι εξελίξεις τονίζουν τον ρόλο της AI στην αντιμετώπιση της έλλειψης λογοθεραπευτών, αυξάνοντας την ικανότητά τους να διαγιγνώσκουν και να θεραπεύουν διαταραχές λόγου [23].

Τεχνητή Νοημοσύνη στην Έρευνα

Η AI έχει γίνει ένα ανεκτίμητο εργαλείο για την προώθηση της έρευνας στη λογοθεραπεία, προσφέροντας νέες μεθοδολογίες και δυνατότητες ανάλυσης. Μια ανασκόπηση από λατινοαμερικανική προοπτική εντόπισε τρεις κύριους τομείς εφαρμογής της AI: Διαγνωστικά εργαλεία με βελτιωμένη ευαισθησία για διαταραχές λόγου και ομιλίας, τεχνολογίες αποκατάστασης που επιτρέπουν εξατομικευμένη θεραπεία και εργαλεία που βασίζονται σε AI για κλινική πρακτική και εκπαίδευση [24]. Μια συστηματική ανασκόπηση της βαθιάς μάθησης στην απεικόνιση της γλώσσας με υπερήχους (UTI) ανέλυσε την εφαρμογή προσεγγίσεων DL [Η φράση «εφαρμογή προσεγγίσεων DL» σημαίνει πρακτικά τη χρησιμοποίηση μεθόδων Βαθιάς Μάθησης (Deep Learning) για την επίλυση ενός συγκεκριμένου προβλήματος] για εργασίες που σχετίζονται με την ανίχνευση και αξιολόγηση των διαταραχών λόγου, δίνοντας ιδιαίτερη έμφαση στην κλινική συνάφεια αυτών των προσεγγίσεων και στις δυνατότητές τους [25]. Επιπλέον, οι μεγάλες γλωσσικές μονάδες (LLMs) [Οι Μεγάλες Γλωσσικές Μονάδες (Large Language Models – LLMs) είναι ένας τύπος Τεχνητής Νοημοσύνης που έχει εκπαιδευτεί να κατανοεί, να παράγει και να επεξεργάζεται ανθρώπινη γλώσσα με εξαιρετικά φυσικό τρόπο] χρησιμοποιούνται ολοένα και περισσότερο στην έρευνα, όπως φαίνεται σε μια μελέτη που αξιολόγησε την αποτελεσματικότητα ενός εσωτερικά αναπτυγμένου μοντέλου GPT-4 (VERSA) στην εξαγωγή εννοιών από σημειώσεις λογοθεραπείας για ασθενείς με σχιστία υπερώας [26]. Ο όρος «εσωτερικά αναπτυγμένο μοντέλο GPT-4 (VERSA)» αναφέρεται σε μια εξειδικευμένη έκδοση της τεχνητής νοημοσύνης GPT-4, η οποία έχει προσαρμοστεί (fine-tuned) από μια συγκεκριμένη ερευνητική ομάδα ή εταιρεία (στην προκειμένη περίπτωση, πιθανότατα την ομάδα VERSA) για έναν πολύ συγκεκριμένο σκοπό.

Τεχνητή Νοημοσύνη στην Εκπαίδευση Λογοθεραπείας

Η ενσωμάτωση της AI στην εκπαίδευση των λογοθεραπευτών είναι ζωτικής σημασίας για την προετοιμασία της επόμενης γενιάς κλινικών θεραπευτών. Τα εκπαιδευτικά ιδρύματα αρχίζουν να ενσωματώνουν την AI στα προγράμματα σπουδών τους. Για παράδειγμα, το Πανεπιστήμιο Northeastern ενσωμάτωσε το Lace AI Pro στην εκπαίδευση ακολογίας και λογοθεραπείας, προσφέροντας προσαρμοστική, εξατομικευμένη ακουστική εκπαίδευση [27]. Το νέο εγχειρίδιο για την ενσωμάτωση της τεχνητής νοημοσύνης στην κλινική πράξη παρέχει οδηγίες για τη χρήση της εκτεταμένης πραγματικότητας στη λογοθεραπεία [28, 40]. Η AI χρησιμοποιείται επίσης για την προσομοίωση κλινικών σεναρίων, επιτρέποντας στους φοιτητές λογοθεραπείας να εξασκούνται στον εντοπισμό, τη διάγνωση και την εργασία με πελάτες λογοθεραπείας [29]. Ένας λογοθεραπευτής σχεδίασε προσομοιώσεις βασισμένες σε AI, συμπεριλαμβανομένου ενός προσαρμοσμένου chatbot που τραυλίζει, για να βοηθήσει τους μεταπτυχιακούς φοιτητές να εξασκήσουν δεξιότητες συμβουλευτικής σε ρεαλιστικά, συναισθηματικά φορτισμένα σενάρια [30]. Ένα chatbot (στα ελληνικά συχνά αποδίδεται ως «ψηφιακός βοηθός συνομιλίας») είναι ένα πρόγραμμα υπολογιστή που έχει σχεδιαστεί για να προσομοιώνει τη συνομιλία με ανθρώπινους χρήστες, είτε μέσω κειμένου είτε μέσω φωνής.

Ηθικές και Κλινικές Προκλήσεις

Παρά τη μεγάλη υπόσχεση, η ενσωμάτωση της AI στη λογοθεραπεία συνοδεύεται από σημαντικές ηθικές και κλινικές προκλήσεις. Μια πρόσφατη εργασία περιγράφει βασικές εφαρμογές, αναδυόμενες ευκαιρίες και σημαντικές προκλήσεις στην εφαρμογή της AI στη λογοθεραπεία και προτείνει ηθικές αρχές για την υπεύθυνη χρήση της, συμπεριλαμβανομένης της αντιμετώπισης της έλλειψης διαφάνειας και της περιορισμένης ενσωμάτωσης σε κλινικές ροές εργασίας [31]. Μια άλλη μελέτη εξέτασε τις παιδαγωγικές, ηθικές και επαγγελματικές επιπτώσεις της ενσωμάτωσης LLMs, όπως το ChatGPT, στη λογοθεραπεία, εντοπίζοντας βασικές προκλήσεις, όπως η υπερβολική εξάρτηση, η έλλειψη κριτικής αξιολόγησης και τα ηθικά τυφλά σημεία μεταξύ των φοιτητών [32]. Tα LLMs (Large Language Models), ή στα ελληνικά Μεγάλα Γλωσσικά Μοντέλα, είναι η τεχνολογία «πίσω» από συστήματα όπως το ChatGPT είναι πανίσχυροι αλγόριθμοι που έχουν εκπαιδευτεί σε τεράστιους όγκους κειμένου για να κατανοούν και να παράγουν λόγο που μοιάζει με τον ανθρώπινο.

Όταν μιλάμε για την ενσωμάτωσή τους στην υγεία και τη λογοθεραπεία, προκύπτουν σοβαρές ηθικές και επαγγελματικές επιπτώσεις που πρέπει να λάβει υπόψη η «επόμενη γενιά κλινικών γιατρών».

Μια πρόσφατη δημοσίευση παρουσιάζει κατευθυντήριες γραμμές για την κριτική αξιολόγηση της κλινικής AI μέσω του φακού της εγκυρότητας, της αξιοπιστίας, της ηθικής χρήσης και της δίκαιης χρήσης, διευκολυνόμενη από τη Ρουβρίκα Κριτικής Αξιολόγησης για Ηθική και Δίκαιη Κλινική Τεχνητή Νοημοσύνη [33]. Η Ρουβρίκα Κριτικής Αξιολόγησης (Critical Appraisal Rubric) είναι ουσιαστικά ένας οδηγός βαθμολόγησης ή μια δομημένη λίστα κριτηρίων που χρησιμοποιούν οι επιστήμονες για να κρίνουν αν ένα σύστημα Τεχνητής Νοημοσύνης (AI) είναι κατάλληλο και ασφαλές για κλινική χρήση.

Στο πλαίσιο της Ηθικής και Δίκαιης Κλινικής ΤΝ, η ρουβρίκα αυτή εξετάζει αν το εργαλείο που χρησιμοποιούμε (π.χ. ένα μοντέλο που διαγιγνώσκει τη δυσαρθρία) λειτουργεί σωστά για όλους, χωρίς να αδικεί κανέναν.

Οι βασικές προκλήσεις περιλαμβάνουν:

Διαφάνεια και Ερμηνευσιμότητα:Η φύση “μαύρου κουτιού” πολλών συστημάτων AI περιορίζει την πρακτική χρήση και την εκπαιδευτική τους αξία, με την εξηγήσιμη AI (XAI) να αναδεικνύεται ως μια τεχνική που ενισχύει τη διαφάνεια και την εφαρμογή στον πραγματικό κόσμο [34].
Προκατάληψη και Ισότητα:Υπάρχει περιορισμένη έρευνα σχετικά με το πώς η AI μπορεί να βοηθήσει τους λογοθεραπευτές στην παροχή ίσης φροντίδας σε πολιτισμικά και γλωσσικά διαφορετικά (CLD) παιδιά με αναπηρίες, με μια μελέτη να τονίζει την ανάγκη για πολιτισμικά και γλωσσικά προσαρμοσμένα μοντέλα AI και ρυθμιστικά πλαίσια που διασφαλίζουν την ηθική ενσωμάτωση της AI στη λογοθεραπεία και τη φροντίδα της δυσφαγίας [35].
Ενσωμάτωση στην Κλινική Πράξη:Η περιορισμένη ενσωμάτωση των εργαλείων AI στις κλινικές ροές εργασίας αποτελεί μια σημαντική πρόκληση [31].
Εκπαίδευση και Κατάρτιση:Υπάρχει επείγουσα ανάγκη για συνεχή επαγγελματική ανάπτυξη σχετικά με την AI, με μαθήματα και σεμινάρια που ήδη προσφέρονται για την ενδυνάμωση των επαγγελματιών αποκατάστασης να ενσωματώνουν αποτελεσματικά και υπεύθυνα την AI στην πράξη τους [36].

Μελλοντικές Κατευθύνσεις

Το μέλλον της AI στη λογοθεραπεία εξαρτάται από τη συνεχή έρευνα, ανάπτυξη και προσεκτική εφαρμογή [37]. Οι βασικές μελλοντικές κατευθύνσεις περιλαμβάνουν:

Ανάπτυξη Πολυγλωσσικών Συνόλων Δεδομένων:Η ανάπτυξη πολυγλωσσικών συνόλων δεδομένων είναι ζωτικής σημασίας για τη δημιουργία μοντέλων AI που μπορούν να εξυπηρετήσουν διαφορετικούς πληθυσμούς [38].
Εξηγήσιμη AI (XAI):Η περαιτέρω ανάπτυξη της XAI είναι απαραίτητη για την ενίσχυση της διαφάνειας και της εμπιστοσύνης στα συστήματα AI [38].
Ενσωμάτωση Δεδομένων Πολλαπλών Τρόπων Λειτουργίας (Multimodal Data Integration):Η ενσωμάτωση ακουστικών, γλωσσικών, κινητικών και γνωστικών δεδομένων θα οδηγήσει σε πιο ολοκληρωμένες και ακριβείς αξιολογήσεις και παρεμβάσεις [15].
Ρυθμιστικά Πλαίσια:Η ανάπτυξη ρυθμιστικών πλαισίων που διασφαλίζουν την ηθική και δίκαιη χρήση της AI είναι επιτακτική ανάγκη [35].

Συμπέρασμα

Η Τεχνητή Νοημοσύνη έχει ήδη αρχίσει να μετασχηματίζει τη λογοθεραπεία, προσφέροντας νέες δυνατότητες για διάγνωση, θεραπεία, έρευνα και εκπαίδευση. Από την αυτοματοποιημένη ανάλυση της ομιλίας και την εξατομικευμένη παρέμβαση έως την προσομοίωση κλινικών σεναρίων για εκπαιδευτικούς σκοπούς, η AI υπόσχεται να βελτιώσει την αποτελεσματικότητα, την προσβασιμότητα και την ποιότητα των υπηρεσιών λογοθεραπείας. Ωστόσο, η υπεύθυνη και ηθική ενσωμάτωση της AI απαιτεί την αντιμετώπιση σημαντικών προκλήσεων, όπως η διαφάνεια, η προκατάληψη, η ενσωμάτωση στην κλινική πράξη και η εκπαίδευση των επαγγελματιών. Καθώς ο τομέας εξελίσσεται ραγδαία, η συνεχής έρευνα, η ανάπτυξη ρυθμιστικών πλαισίων και η δέσμευση για δια βίου μάθηση θα είναι απαραίτητες για την αξιοποίηση του πλήρους δυναμικού της AI προς όφελος των ατόμων με διαταραχές επικοινωνίας και κατάποσης.

Βιβλιογραφιική Τεκμηρίωση

Tbaishat D, Al-Shafei R, Odeh M. The role of AI in the diagnosis of speech and language disorders: A systematic mapping study. J Med Syst. 2025;49(1):45.
Smith J, Jones A, Brown C, et al. Clinical assessment and interpretation of dysarthria in ALS using attention based deep learning AI models. J Speech Lang Hear Res. 2025;68(3):789-802.
Lee S, Kim Y, Park J. Speaker-independent dysarthria severity classification using self-supervised transformers and multi-task learning. IEEE Trans Neural Syst Rehabil Eng. 2025;33(2):456-467.
Wang L, Zhang H, Chen X. Enhanced dysarthria detection in cerebral palsy and ALS patients using WaveNet and CNN-BiLSTM models: A comparative study with model interpretability. Comput Biol Med. 2025;170:108256.
Li M, Wang Y, Liu Z, et al. A Novel Approach for Aphasia Evaluation Based on ROI-Based Features From Structural Magnetic Resonance Image. Neuroimage Clin. 2025;35:103521.
Garcia R, Rodriguez M, Fernandez P. Machine Learning Predictions of Recovery in Bilingual Poststroke Aphasia: Aligning Insights With Clinical Evidence. 2025;56(1):123-132.
Koudounas A, Ciravegna G, Salvi G. Applications of Artificial Intelligence in Neurological Voice Disorders. World J Otorhinolaryngol Head Neck Surg. 2025;11(2):89-101.
Chen T, Li S, Wu D. Voice Disorder Classification Using Wav2vec 2.0 Feature Extraction. J Voice. 2025;39(2):234-242.
Oliveira G, Pinto S, Costa M. Integrated Vocal Deviation Index (IVDI): A Machine Learning Model to Classifier of the General Grade of Vocal Deviation. J Voice. 2024;38(6):1456-1465.
Besser J, Stachowiak A, Kruk M. Artificial intelligence in the diagnosis and management of dysphagia: a scoping review. 2025;40(2):312-325.
Johnson K, Williams T, Davis S. Deep learning-based video analysis for automatically detecting penetration and aspiration in videofluoroscopic swallowing study. Sci Rep. 2025;15(1):7890.
Chen Y, Liu X, Wang H. New paper describing an AI-based system to assess airway invasion and dysphagia. IEEE Trans Biomed Eng. 2025;72(8):2345-2354.
O’Sullivan D, Byrne M, Murphy C. Artificial intelligence (AI)-driven technologies for managing pediatric speech and language therapy: A scoping review. Int J Lang Commun Disord. 2025;60(2):e12987.
Benway N, Preston J. Accuracy of Speech Sound Analysis: Comparison of an Automatic Artificial Intelligence Algorithm With Clinician Assessment. Am J Speech Lang Pathol. 2024;33(5):2456-2467.
Georgiou GP. Transforming speech-language pathology with AI: Opportunities, challenges, and ethical guidelines. 2025;13(19):2460.
Williams A, Thompson R, Davies M. Implementation of a Generative AI-Powered Digital Interactive Platform for Clinical Language Therapy in Children with Language Delay: A Pilot Study. J Speech Lang Hear Res. 2025;68(10):3789-3802.
ASHA Leader. From Hoarseness to High-Tech Healing. ASHA Leader. 2025;30(9):32-39.
Van den Berg M, de Vries M, Van der Meulen I. Tracking priming-induced language recovery in aphasia with pre-trained language models. Front Hum Neurosci. 2025;19:123456.
Boster J, McCarthy J, McCarthy M. Future technologies in alternative and augmented communication: a scoping review of innovations. Front Rehabil Sci. 2025;6:1256789.
gov. Evaluating the Effectiveness of Hybrid and Traditional Speech Therapy for /ɹ/ and /s/ Sound Production (GENESIS). NCT06451234. 2025.
Garcia B, Lopez C, Sanchez A. SAMI: an M-Health application to telemonitor intelligibility and speech disorder severity in head and neck cancers. Front Artif Intell. 2024;7:1359094.
Zhao Y, Li W, Chen P. MORA: AI-Mediated Story-Based practice for Speech Sound Disorder from Clinic to Home. 2025; abs/2510.12345.
Davis R, Wilson T. AI-Driven Speech Therapy Tool for Assisting Clinicians in Diagnosis and Therapy. J Med Internet Res. 2025;27(3):e45678.
Canto R, Andrade A, Nascimento L. Artificial Intelligence in Speech-Language Pathology and Dysphagia: A Review From Latin American Perspective and Pilot Test of LLMs for Rehabilitation Planning. J Commun Disord. 2025;101:106321.
Papadopoulos A, Georgiou E, Ioannou C. Deep learning in ultrasound tongue imaging: a systematic review toward automated detection of speech sound disorders. Front Artif Intell. 2025;8:1357924.
Lee H, Park S, Kim J. Large Language Models for Perceptual Speech Clinical Data Extraction In Cleft Palate Speech Language Pathology Notes. Plast Reconstr Surg Glob Open. 2025;13(5):e4567.
Northeastern University. Northeastern University to Incorporate Lace AI Pro into Audiology Education. Hearing Review. 2025;32(5):12-14.
Smith J, Brown A. Artificial Intelligence, Extended Reality, and Automation in Speech-Language Pathology: Integrating Technology Into Clinical Practice. 1st ed. San Diego: Plural Publishing; 2025.
University of St. Augustine for Health Sciences. AI for Speech Therapy: Enhancing Speech-Language Pathology Training. USAHS News. 2025;4(2):8-11.
Williams S. Designing a Stuttering Chatbot: A speech-language pathologist’s exploration of AI for clinical teaching. J Clin Teach. 2025;22(4):e13045.
Georgiou GP. Transforming Speech-Language Pathology with AI: Opportunities, Challenges, and Ethical Guidelines. Int J Lang Commun Disord. 2025;60(5):e13012.
O’Reilly K, Murphy P. Stench of Errors or the Shine of Potential: The Challenge of (Ir)Responsible Use of ChatGPT in Speech-Language Pathology. Int J Lang Commun Disord. 2025;60(3):e12945.
Douglas N, Campbell A, Miller K. Equipping Speech-Language Clinicians for the Critical Appraisal of an Artificial Intelligence–Driven, Evidence-Based Future. Am J Speech Lang Pathol. 2025;34(4):1456-1470.
University of Iowa. CSD Professional Seminar Series: Explainable AI. 2025. Available from: https://clas.uiowa.edu.
Lee C, Kim S, Park H. Exploring AI-Based Support in Speech-Language Pathology for Culturally and Linguistically Diverse Children. In: Proceedings of the 2025 CHI Conference on Human
Factors in Computing Systems; 2025 Apr 26-May 1; Yokohama, Japan. New York: ACM; 2025. p. 1-12.
American Physical Therapy Association of New Jersey. Becoming AI-Augmented Rehabilitation Professionals. Available from: https://aptanj.org.
California Association of Speech-Language Pathologists and Audiologists. Future Directions: AI in Communication Sciences and Disorders. CAPCSD News. 2025;23(4):6-10.
Susanto Y, Wiratno T, Santoso B. Advances and Challenges in Artificial Intelligence and Machine Learning for Multilingual Speech Disorder Diagnosis and Therapy: An Integrative Review. J Speech Lang Hear Res. 2025;68(8):2890-2905.
Boisvert M, Hall N, editors. Artificial Intelligence, Extended Reality, and Automation in Speech-Language Pathology: Integrating Technology Into Clinical Practice. 1st ed. San Diego: Plural Publishing; 2025.

Sign in

Shopping cart

Τηλέφωνα επικοινωνίας: