Τεχνητή νοημοσύνη που αναλύει τις ακτινογραφίες των πνευμόνων όπως ένας ακτινολόγος
Κάθε μέρα, οι ακτινολόγοι εξετάζουν τεράστιο αριθμό αξονικών τομογραφιών, αναζητώντας κάτι που θα μπορούσε εύκολα να τους διαφύγει. Ένα μικρό οζίδιο. Μια ανεπαίσθητη σκιά. Κάτι που θα μπορούσε να είναι καρκίνος του πνεύμονα σε πρώιμο στάδιο, ή μπορεί και να μην είναι τίποτα.
Ο καρκίνος του πνεύμονα προκαλεί περισσότερους θανάτους παγκοσμίως από οποιονδήποτε άλλο καρκίνο. Η επιβίωση εξαρτάται σε μεγάλο βαθμό από το πόσο νωρίς διαγνωστεί η νόσος. Ωστόσο, ο φόρτος εργασίας στα περισσότερα ακτινολογικά τμήματα δεν αφήνει περιθώρια για τη συνεχή και διπλή εστίαση που απαιτεί στην πραγματικότητα η ανίχνευση μιας μικρής ύποπτης βλάβης.
Μια μελέτη που μόλις δημοσιεύθηκε στο περιοδικό Scientific Reports, από μια διεθνή ερευνητική ομάδα στην οποία συμμετέχουν ερευνητές από το Τεχνολογικό Πανεπιστήμιο του Κάουνας στη Λιθουανία, έχει αναπτύξει ένα σύστημα τεχνητής νοημοσύνης σχεδιασμένο να επιτελεί κάτι με το οποίο τα υπάρχοντα εργαλεία αντιμετώπιζαν συνεχώς δυσκολίες. Το σύστημα αυτό αναλύει τη σάρωση με δύο τρόπους ταυτόχρονα.
Ο τρόπος με τον οποίο ένας ακτινολόγος εξετάζει στην πράξη μια απεικόνιση
Όταν ένας ακτινολόγος εξετάζει μια αξονική τομογραφία, αλλάζει συνεχώς οπτική γωνία. Μεγεθύνει μια περιοχή ενδιαφέροντος για να εξετάσει τις λεπτομέρειες. Απομακρύνεται για να κατανοήσει πώς η συγκεκριμένη περιοχή σχετίζεται με τον πνεύμονα στο σύνολό του. Δεν είναι το ένα ή το άλλο. Είναι και τα δύο, επανειλημμένα, καθ’ όλη τη διάρκεια της εξέτασης.
Τα περισσότερα συστήματα τεχνητής νοημοσύνης που έχουν αναπτυχθεί για αυτό το σκοπό αναγκάστηκαν να επιλέξουν. Είτε είναι ικανά να αποτυπώνουν λεπτομερείς τοπικές λεπτομέρειες, είτε είναι ικανά να κατανοούν το ευρύτερο δομικό πλαίσιο. Η ταυτόχρονη επίτευξη και των δύο αποτελεί ένα επίμονο τεχνικό πρόβλημα.
Η λύση της ομάδας είναι ένα μοντέλο που ονομάζουν C-Swin. Συνδυάζει δύο διαφορετικούς τύπους αρχιτεκτονικής νευρωνικών δικτύων που λειτουργούν από κοινού. Ένα συνελικτικό νευρωνικό δίκτυο χειρίζεται τα λεπτομερή τοπικά χαρακτηριστικά, δηλαδή τον τύπο λεπτομερούς αναγνώρισης προτύπων που εντοπίζει μικρές αλλοιώσεις και λεπτές υφές. Ένας Swin Transformer, μια αρχιτεκτονική που χρησιμοποιεί μια προσέγγιση μετακινούμενου παραθύρου για την ανάλυση χωρικών περιοχών της εικόνας, χειρίζεται το ευρύτερο πλαίσιο. Τα δύο συστατικά λειτουργούν παράλληλα, με τα αποτελέσματά τους να ενσωματώνονται μεταξύ τους και όχι να ακολουθούν διαδοχική σειρά.
Ο ερευνητής Inzamam Mashood Nasir, που εργάζεται στο KTU, το περιγράφει με απλά λόγια. Ένα μέρος του μοντέλου εστιάζει σε μικρές λεπτομέρειες, όπως μικροσκοπικά σημεία ή υφές στους πνεύμονες, ενώ ένα άλλο εξετάζει τη συνολική εικόνα και κατανοεί το ευρύτερο πλαίσιο. Μπορείτε να το φανταστείτε σαν να έχετε ταυτόχρονα ένα μεγεθυντικό φακό και μια πλήρη εικόνα της αξονικής τομογραφίας.
Τι έδειξαν τα αποτελέσματα
Το μοντέλο δοκιμάστηκε στο σύνολο δεδομένων IQ-OTH/NCCD, μια δημόσια διαθέσιμη συλλογή αξονικών τομογραφιών, ταξινομώντας τις τομογραφίες σε τρεις κατηγορίες: φυσιολογικές, καλοήθεις και κακοήθεις.
Η διάκριση μεταξύ καλοήθων (μη καρκινικών) οζιδίων και κακοήθων όγκων αποτελεί μία από τις πιο δύσκολες εργασίες στην ακτινολογία· ένα λάθος σε αυτό το θέμα μπορεί να οδηγήσει είτε σε παράλειψη της διάγνωσης καρκίνου είτε σε περιττές, επεμβατικές βιοψίες.
Τα αποτελέσματα ήταν εξαιρετικά. Το C-Swin πέτυχε ακρίβεια 96,26%, με ακρίβεια 97,48% και δείκτη F1 97,42%. Σε σύγκριση με τις υπάρχουσες μεθόδους, η βελτίωση στην ακρίβεια κυμάνθηκε από 2,31% έως 6,81%, ανάλογα με τη σύγκριση.
Στην ιατρική, αυτά τα περιθώρια δεν είναι μικρά. Μια ποσοστιαία μονάδα στη διαγνωστική ακρίβεια, όταν εφαρμόζεται σε χιλιάδες ασθενείς και εκατοντάδες χιλιάδες εξετάσεις, μεταφράζεται σε πραγματικά αποτελέσματα.
Οι ερευνητές είναι προσεκτικοί ως προς τα συμπεράσματά τους. Το μοντέλο εκπαιδεύτηκε σε ένα μόνο σύνολο δεδομένων. Δεν έχει ακόμη δοκιμαστεί με συσκευές διαφορετικών κατασκευαστών, διαφορετικά πρωτόκολλα απεικόνισης ή διαφορετικούς πληθυσμούς ασθενών. Ο Nasir είναι σαφής ως προς αυτό. Σε πραγματικές συνθήκες υπάρχουν πολλές μεταβλητές, και το σύστημα πρέπει να δοκιμαστεί σε όλες αυτές πριν από την κλινική χρήση.
Αυτή η επιφύλαξη δεν υποβαθμίζει το εύρημα. Αποτελεί την ειλικρινή περιγραφή του σταδίου στο οποίο βρίσκεται μια καλή έρευνα πριν μετατραπεί σε κλινική πρακτική. Τα επόμενα βήματα είναι η κλινική επικύρωση, οι δοκιμές σε νοσοκομειακό περιβάλλον και η ενσωμάτωσή της στα υπάρχοντα συστήματα ιατρικής απεικόνισης.
Γιατί ο σωστός συγχρονισμός είναι καθοριστικός
Ο καρκίνος του πνεύμονα εξακολουθεί να διαγιγνώσκεται συνήθως σε προχωρημένο στάδιο, όταν οι θεραπευτικές επιλογές είναι πιο περιορισμένες και η πρόγνωση πιο δυσμενής. Το χάσμα μεταξύ του τι είναι βιολογικά εφικτό και του τι φτάνει τελικά εγκαίρως στους ασθενείς αποτελεί ένα από τα βασικά προβλήματα της ογκολογίας.
Τα εργαλεία τεχνητής νοημοσύνης που μειώνουν ουσιαστικά τις περιπτώσεις που διαφεύγουν και τα ποσοστά ψευδών θετικών, με αποτέλεσμα να μειώνεται ο αριθμός των ασθενών που υποβάλλονται σε περιττές διαδικασίες και το άγχος που αυτές συνεπάγονται, αντιμετωπίζουν και τις δύο πτυχές αυτού του προβλήματος ταυτόχρονα.
Ο Nasir επισημαίνει ότι η αρχιτεκτονική αυτή δεν περιορίζεται στον καρκίνο του πνεύμονα. Οποιαδήποτε εργασία ιατρικής απεικόνισης που απαιτεί τόσο λεπτομερή τοπική ανάλυση όσο και ευρύτερη δομική κατανόηση θα μπορούσε να επωφεληθεί από την ίδια προσέγγιση. Ως πιθανές εφαρμογές αναφέρονται οι όγκοι του εγκεφάλου, ο καρκίνος του μαστού και οι οφθαλμικές παθήσεις.
Η ευρύτερη εικόνα
Αυτή την εβδομάδα, ο Διευθύνων Σύμβουλος της Google DeepMind, Ντέμις Χασάμπις, παραχώρησε δύο σημαντικές συνεντεύξεις: μία στο podcast «20VC» με τον Χάρι Στέμπινγκς και μία με την επιστημονική επικοινωνιολόγο Κλέο Άμπραμ, στις οποίες μίλησε για το όραμά του σχετικά με τις δυνατότητες της τεχνητής νοημοσύνης στην ιατρική. Το σταθερό του μήνυμα ήταν ότι ο σημαντικότερος ρόλος της τεχνητής νοημοσύνης δεν βρίσκεται στα καταναλωτικά προϊόντα, αλλά στην καταπολέμηση των ασθενειών. Έχει εκφράσει την επιθυμία να δει τη δεκαετή διαδικασία ανακάλυψης φαρμάκων να συμπιέζεται σε λίγους μήνες. Σχετικά με το ότι η τεχνητή νοημοσύνη θα φτάσει σε ένα σημείο όπου η ιατρική δεν θα μοιάζει με αυτό που γνωρίζουμε σήμερα.
Η μελέτη για το C-Swin δεν έχει τόσο μεγάλες φιλοδοξίες. Πρόκειται για ένα μοντέλο, ένα σύνολο δεδομένων, ένα προσεκτικά οριοθετημένο σύνολο αποτελεσμάτων που αναμένει κλινική επικύρωση. Αλλά ακριβώς έτσι καλύπτεται η απόσταση από εδώ μέχρι εκεί. Όχι με μεμονωμένα άλματα, αλλά με μελέτες όπως αυτή, που διεξάγονται με προσοχή, δημοσιεύονται ανοιχτά και αποτελούν τη βάση για την επόμενη ομάδα.
Η βιολογία του καρκίνου του πνεύμονα γίνεται όλο και πιο κατανοητή. Οι θεραπείες αρχίζουν να προσαρμόζονται ανάλογα. Και τώρα, σιγά-σιγά, το ίδιο συμβαίνει και με τα μέσα διάγνωσης.
Πηγή: Yousafzai SN, Nasir IM, Mansour S κ.ά. Μια υβριδική προσέγγιση βαθιάς μάθησης που συνδυάζει CNN και μετασχηματιστή για την ταξινόμηση του καρκίνου του πνεύμονα με χρήση αξονικών τομογραφιών. Scientific Reports. 2026. doi:10.1038/s41598-026-41161-7
Εικόνα: Εικονογράφηση που δημιουργήθηκε με τεχνητή νοημοσύνη