Radyografik Yorumlamanın İyileştirilmesinde Yapay Zekanın Rolü

Bir hasta 20 farklı diş hekimine yakın zamanda çekilmiş tam ağız röntgenlerini e-posta ile göndererek şunları belirtiyor: “Önceki diş hekimim bunları ben şehre taşınmadan hemen önce çekmişti. Taşınma ani oldu (işle ilgili), bu yüzden diş hekimimin bana hangi işlerin yapılması gerektiğini söyleme şansı olmadı. İki yıllık bir görev için buradayım ve yeni bir diş hekimi arıyorum. Lütfen ekteki röntgenleri inceleyin ve herhangi bir tedavi gerekip gerekmediğini ve ne zaman randevu alabileceğimi bana bildirin.” Yirmi diş hekiminin de sadece teşhis görüntülerine dayanarak geçici bir tedavi planı sunmayı kabul ettiğini varsayalım (tabii ki çalışmaya başlamadan önce hastayı muayene etmeleri şartıyla). Sizce 20 diş hekiminin planları ne kadar tutarlı olacaktır?

Yukarıdaki senaryo size tanıdık geliyorsa, CBC’nin 2012’deki gizli soruşturmasını hatırlayabilirsiniz. Marketplace bölümü, Money Where Your Mouth Is, aynı tam ağız radyografi serileri sunulduğunda, diş hekimlerinin teşhis konusunda büyük farklılıklar gösterdiğini ortaya koymuştu. Gerçekten de, 20 masum diş hekiminden oluşan bir grup tarafından sunulan tedavi planlarının %40’ı CBC’nin işe aldığı uzmanlarla önemli ölçüde uyumsuzken, geri kalan %60’ında çeşitli “zararsız tutarsızlıklar” mevcuttu. Tanısal tutarsızlığa rağmen, tam ağız serisinin özellikle karmaşık olduğuna dair bir belirti yoktu. dizinin uzmanı, “Ne yazık ki diş hekimliğinde”, bir hastanın teşhisi “büyük ölçüde diş hekiminin kişisel deneyimine bağlıdır” dedi Programın yapımcıları, çelişkili görüşleri açıklayabilecek eğitim yeri, tedavi felsefesi (konservatif ve agresif) ve sağlayıcılar tarafından kullanılan malzeme türleri gibi faktörlere işaret etti. CBC, bazı diş hekimlerinin muhtemelen “kendi mali çıkarlarını hastanın çıkarlarının önüne koyduğunu” belirtirken, programın bahsetmediği bir faktör vardı: insan hatası.

Tıpta gürültü

Hızlı ve Yavaş Düşünme kitabıyla tanınan Nobel Ekonomi Ödülü sahibi yazar Daniel Kahneman, geçtiğimiz bahar yeni bir kitap yayınladı: Gürültü: Gürültü’de Kahneman hukuk, tıp ve finans gibi alanlardaki sistemik hataları tanımlayan iki geniş olguyu açıklıyor: önyargı ve kitabın başlığından da anlaşılacağı üzere gürültü. Önyargı, ahlaki sonuçları olabilecek ya da olmayabilecek tutarlı bir sapma modelinden oluşur. Yeni başlayan çürüklerle karşılaştığında erken müdahaleye yönelik önyargısı olan bir diş hekiminin “agresif bir tedavi felsefesine” sahip olduğu düşünülebilir Hastaların sigorta kapsamı olduğunda sürekli olarak daha kapsamlı tedavi planları sunan bir diş hekimi ise başka tür bir önyargı sergilemektedir. Öte yandan, aynı radyografi setinde çürüğü teşhis etmeleri istenen ve doğru yanıt vermekten başka bir teşviki olmayan 10 diş hekimi, net bir yönlendirme olmaksızın 10 farklı yanıt verirse, yanıtları “gürültülü” olarak tanımlanacaktır Teşhisleri ne kadar farklı olursa, gürültü seviyesi de o kadar artar.

Kahneman gerçek dünyayı “skandal derecede” gürültülü olarak tanımlar ve gürültülü bir sistemin A örneği tıptır:

Aynı hastayla karşılaşan farklı doktorlar, hastaların cilt kanseri, göğüs kanseri, kalp hastalığı, tüberküloz, zatürre, depresyon ve bir dizi başka rahatsızlığı olup olmadığı konusunda farklı yargılarda bulunur. Gürültü özellikle psikiyatride yüksektir…[h]Bununla birlikte, X-ışınlarının okunması gibi beklenmeyecek alanlarda da önemli ölçüde gürültü bulunur.

Gerçekten de radyologlar tanısal çeşitliliği Aşil topuğu olarak adlandırırlar. Radyografideki gürültünün gösterilmesi kolay olduğundan, bu alandaki araştırmalar çarpıcı bulgular ortaya koymuştur. Örneğin, meme kanseri teşhisi üzerine yapılan bir çalışmaya katılan radyologların hata oranı, mükemmel bir skordan (yani %0 hata), %50 gibi şaşırtıcı bir yanlış negatif ve %64 gibi şaşırtıcı bir yanlış pozitif oranına kadar değişmektedir[ii]

Hekimlerin zaman içindeki yargılarının da gürültülü olduğu gösterilmiştir. Bilmeden aylar arayla aynı zorlu teşhis görüntüleri sunulduğunda, 22 doktor daha önceki teşhisleriyle %63 ila %92 oranında aynı fikirde olmamıştır.[iii] Diğer araştırmalar, teşhislerin doğruluğunun günün saatine veya günün ne kadar yoğun olduğuna bağlı olarak değişebileceğini göstermektedir. Çok geniş bir veri setini inceleyen bir çalışma, sabah 8:00’de incelenen testlerin %63,7’sinin ek tarama için yönlendirildiğini, buna karşılık akşam 5:00’te incelenen benzer testlerin yalnızca %47,8’inin yönlendirildiğini ortaya koymuştur.[iv] Radyoloji departmanlarının günün ilerleyen saatlerinde geride kalma eğiliminde olduğu ve bu nedenle klinisyenlerin yetişmek için acele ettikleri için atlanan tanı oranının arttığı tahmin edilmektedir. Bu mantıklı bir açıklama olsa da, tam olarak güven verici değildir.

Diş hekimliğinde gürültü

Yukarıda özetlenen araştırmaların diş hekimliği ile nasıl ilişkili olduğunu hayal etmek kolay olurdu, ancak buna gerek yok. Dental radyografinin yorumlanmasındaki gürültü kapsamlı bir şekilde incelenmiş ve gürültünün artmasına katkıda bulunan birden fazla faktör bulunmuştur. En yakından incelenen faktör, oral radyografilerin teşhis edilmesinin karmaşıklığı ve çoğu durumda yeterli eğitimin olmaması ile ilgilidir. Amerika Birleşik Devletleri’ndeki bir dişhekimliği fakültesinden aşağıdakileri ele alalım:

Missouri-Kansas City Üniversitesi (UMKC) Dişhekimliği Fakültesi, kapsamlı objektif yapılandırılmış klinik muayenesinde (OSCE) radyografik yorumlamanın değerlendirilmesini içerir… Son sınıf dişhekimliği öğrencileri, üçüncü ve dördüncü yıllar arasındaki yaz döneminde çok istasyonlu OSCE’ye katılırlar. Pilot uygulama sırasında, öğrencilerin OSCE’nin radyoloji istasyonundaki performansı, ilk denemede çok düşük bir yüzdeyle (%2,9), tüm OSCE istasyonlarının en düşüğüyle sonuçlanmıştır.

Dişhekimliği öğrencilerinin %97’sinin ilk denemede radyografik yorumlama sınavında başarısız olması, yeterli eğitim eksikliğini açıkça göstermiştir. Okulun röntgen yorumlama eğitimine yaklaşımını yenilemesinden birkaç yıl sonra bu sayı %73’e düşmüştür.[v] Yine de sonuçlar, iki boyutlu görüntülerden patolojilere tanı koyarken hata yapmanın kolay olduğunu göstermektedir. Deneyimli klinisyenlerin daha iyi performans göstereceği makul bir şekilde iddia edilebilir; ancak gerçek dünya, sınava giren bir öğrencinin karşılaşmayacağı bir dizi zorluk ortaya koymaktadır. Personel ve hastaların zaman baskısı altındaki yoğun bir diş hekimi, bir dizi periapikal ve bitewings bulgularına ulaşmak ve bunları belgelemek için önemli ölçüde daha az zaman harcayabilir. Günlük muayenehane stresiyle uğraşan diş hekimleri tüm görüş alanını inceleyecek zamanları olmadığını düşünebilir; tünel görüşünün tehlikeleri iyi bilinmektedir. Diğerleri ise doğru teşhise ulaşabilir ancak notları girmeye vakit bulamadan bunu unutabilirler.

Gürültü, dişhekimliği uzmanları arasında olduğu kadar acemiler arasında da gözlemlenmiştir. Bir çalışmada, ABD’deki başka bir diş hekimliği okulundaki klinik eğitmenlerinden “dijitalleştirilmiş radyografik görüntüleri izlerken belirtilen dişler için yüzde kemik kaybını aşağıdaki kategorilerden birini seçerek derecelendirmeleri” istenmiştir: <15 percent, 15-30 and>Yüzde 30.[vi] Yanıtlar, Amerikan Diş Hekimliği Birliği (ADA) ve Amerikan Periodontoloji Akademisi (AAP) kılavuzlarına göre kalibre edilmiştir. Test görüntülerine ilk kez maruz kalındığında, “klinik eğitmenlerinin doğru seçeneğe katılımı yüzde 64,5’ti.” Bu, fakülte eğitmenlerinin değerlendirmesinin %35,5 oranında yanlış olduğu anlamına gelmektedir. Çalışmada “klinik eğitmenler arasında radyografik yorumlama yanlışlıkları ve tutarsızlıkları” kaydedilmiş ve “eğitmenlerin daha fazla eğitilmesi ve kalibre edilmesi gerektiği, böylece derecelendirmelerinin doğruluğunun ve tutarlılığının artırılabileceği” sonucuna varılmıştır.”

Yetersiz eğitimin ötesinde, ortam ışığı da dahil olmak üzere dental radyografinin yorumlanmasında hataya katkıda bulunan başka faktörler de gösterilmiştir (diş hekimi görüntüyü karanlık bir odada gözlerinin alışması için zaman verdikten sonra incelediğinde teşhisler daha doğru olmuştur).[vii] Araştırmalar ayrıca radyografik görüntülerin kalitesinin bir görüntüleme sisteminden diğerine değişebildiğini ve bunun da hata sıklığının artmasına yol açtığını ve “yansıtılan anatominin, özellikle görüntülerdeki düşük kontrastlı nesneleri tespit ederken gürültüye önemli ölçüde katkıda bulunduğunu ortaya koymuştur.”[viii] Diğer disiplinlerde yorgunluk, açlık ve hatta ruh halinin karmaşık yargıların kalitesini etkilediği gözlemlenmiştir.

Gürültünün sonuçları

Nedeni ne olursa olsun, röntgenlerin hatalı değerlendirilmesinin yanlış teşhis, eksik ve gecikmiş teşhis, aşırı veya yetersiz tedavi, hastaların periodontal durumlarının zaman içinde hatalı değerlendirilmesi ve nihayetinde kötü tedavi sonuçları, memnuniyetsiz hastalar ve sorumluluk gibi çeşitli optimal olmayan sonuçlara yol açabileceğini biliyoruz. Yukarıdakiler de klinisyenlerin mali refahını, stres seviyelerini ve kariyer memnuniyetini olumsuz etkileyebilir. Gerçek diş hekimliği pratiğinde tam hata (veya gürültü) oranı bilinmese de, araştırmaya aşina olan ve Denning-Kruger etkisinden muzdarip olmayan klinisyenler, radyografik görüntülerden oral patolojilerin teşhisinde hatayı azaltmak için motive olmalıdır.

Gürültüyü azaltmak ve radyografik yorumlama kalitesini artırmak

Hasta güvenliği uzmanları ve pratisyen klinisyenler, sağlık hizmetlerinde gürültüyü ele almak için çeşitli yollar önermiştir. Yukarıda bahsedilen çalışmalardan ikisi, titizlikle uygulanan ve iyi yapılandırılmış eğitim programlarının kaliteyi artırmanın anahtarı olduğunu savunmaktadır. Protokollerin ve kontrol listelerinin uygulanması gibi süreç iyileştirmelerinin tanı hatalarını azaltma potansiyeli olduğu görülmüştür. Organizasyonel düzeyde, hasta güvenliğine güçlü bir şekilde odaklanan hasta merkezli kültürlerin zaman içinde advers olayları ve diğer hasta güvenliği vakalarını azalttığı bilinmektedir. Sağlık hizmeti sağlayıcıları aşamalı iyileştirmelerden asla vazgeçmemelidir; ancak dental radyoloji muazzam ve hızlı bir teknolojik değişimin eşiğindedir.

Tıp mesleğinde yapay zeka (AI) programlarının uygulanması son on yılda popülerlik kazanmıştır ve diş hekimliğindeki uygulamaları baş döndürücü bir hızla gelişmektedir. Yakın zamana kadar, bir bilgisayarın bir dişhekimi muayenehanesinin tüm röntgen veritabanında arama yapabileceği, gözden kaçmış olası teşhisleri belirleyebileceği ve bir düğmeye basarak çok çeşitli oral patolojilerin tespit edilmesine yardımcı olabileceği fikri hayal gibi görünüyordu. Ama artık gerçekleşiyor. Aslında, çok sayıda ürün piyasaya sürüldü ve erken benimseyenler – genel diş hekimleri ve özel muayenehanelerdeki diş uzmanları – YZ çözümlerini günlük rutinlerine dahil ettiler. Yapay zeka, derin öğrenme algoritmaları ve bilgisayar destekli teşhis, diş hekimliği dokusunun bir parçasını oluşturuyor ve bu teknolojinin gelişmişliği her geçen saat artıyor. Bu alandaki değişimin hızı beş kelimeyle özetlenebilir: gözünüzü kırparsanız kaçırırsınız.

Yapay zeka programları, sefalometrik işaretleri izleyerek; çürükleri, alveolar kemik kaybını ve periapikal patozu tespit ederek; inferior alveolar siniri işaretleyerek; yüz büyümesini analiz ederek ve diğer benzer görevleri yerine getirerek klinisyenlere yardımcı olur. Ağız kanseri ve lenf nodu metastazını taramak için yapay zekanın kullanımı, diğer çeşitli yaygın orofasiyal hastalıkların teşhis ve tedavi planlaması gibi aktif olarak geliştirilmektedir. Çok uzak olmayan bir gelecekte, derin ve meta öğrenme algoritmaları nadir görülen hastalıkları bile tespit edebilecektir. Bu teknolojinin en uç noktasında yer alan araştırmacılar, sadece ağızda değil tüm vücutta (ve hatta beyinde) “evrensel lezyon tespiti” yapabilecek bir algoritma üzerinde çalışmaktadır.

Diş hekimliğinin ekmek ve tereyağı alanlarında, yapay zeka zaten diş hekimlerinden daha iyi performans gösteriyor; bir çalışmada “derin [öğrenme] algoritması çürük lezyonları %75,5-93,3 doğruluk ve %74,5-97,1 duyarlılıkla tespit edebildi.[ix] Bu, klinisyenlerin yalnızca radyografileri kullanarak teşhis koymasına göre önemli bir gelişmedir ve duyarlılık %19 ila %94 arasında değişmektedir.” Başka bir algoritma kullanılarak, “[periodontal olarak riskli diş] teşhisinin doğruluğu %76,7-81,0 olarak kanıtlanırken, çekim ihtiyacını tahmin etme doğruluğu %73,4-82,8 olmuştur.”[x] Açıkça iyileştirme için yer vardır; ancak testler %35,5’lik hata oranları göstermiştir ve bu algoritmalara beslenen her ek radyograf ile doğrulukları ve faydaları artacaktır.

Çığır açan bir teknoloji olsa da, AI henüz diş hekimlerinin yerini almaya hazır değildir. “Daha ziyade, radyografik yorumlama alanını uzun süredir rahatsız eden gürültüyü en aza indirmek amacıyla diş hekimlerine ve uzmanlara yardımcı olmak için yapay zeka kullanımı tamamlayıcı bir varlık olarak görülmelidir”. Teknolojinin diş hekimliği uygulamalarını büyük ölçüde sekteye uğratabileceğini biliyoruz – Invisalign’ın algoritmasının ve Smile Direct Club gibi şirketlerin yarattığı etkilere bir bakın. Onu kucaklamak bizim elimizde.

Referanslar

[i] Kahneman, Daniel, Olivier Sibony, and Cass R. Sunstein. Noise: a flaw in human judgment (Gürültü: insan muhakemesinde bir kusur). Little, Brown, 2021.

[ii] ABD radyologları tarafından tarama mamogramlarının yorumlanmasında değişkenlik. Findings from a national sample, C A Beam, P M Layde, D C Sullivan, 1996: https://pubmed.ncbi.nlm.nih.gov/8546556/.

[iii] Kaza ve acil durum radyografilerinin yorumlanmasında deneyimli gözlemciler arasındaki farklılıklarP J Robinson 1, D Wilson, A Coral, A Murphy, P Verow, Br J Radiol, 1999: https://pubmed.ncbi.nlm.nih.gov/10474490/.

[iv] Birinci Basamak Klinik Randevu Süresinin Klinisyenin Meme ve Kolorektal Kanser Taramasını İstemesi ve Hastanın Tamamlaması ile İlişkisi, Esther Y. Hsiang, BA1,2; Shivan J. Mehta, MD, MBA3; Dylan S. Small, PhD2; et alCharles A. L. Rareshide, MS4; Christopher K. Snider, MPH4; Susan C. Day, MD, MPH3; Mitesh S. Patel, MD, MBA, MS2,3,4,5, Author Affiliations Article Information, JAMA Netw Open. 2019;2(5):e193403. doi:10.1001/jamanetworkopen.2019.3403

[v] OSCE Sonuçlarına Dayalı Dental Radyografik Yorumlama Yetkinliği için Predoktoral Müfredat Revizyonu, Kumar, Vandana ; Gadbury–Amyot, Cynthia C, Journal of dental education, 2019-10, Vol.83 (10), p.1233-1239

[vi] Accuracy and Consistency of Radiographic Interpretation Among Clinical Instructors Using Two Viewing Systems, Lanning, Sharon K ; Best, Al M ; Temple, Henry J ; Richards, Philip S ; Carey, Allison ; McCauley, Laurie K, Journal of dental education, 2006-02, Vol.70 (2), p.149-159

[vii] Kawai, Taisuke, Kenji Sato, and Takashi Yosue. “Görüntüleme koşullarının ağız içi radyografilerde kontrast detayların algılanması üzerindeki etkileri.” Oral Radyoloji 21.1 (2005): 23-29.

[viii] Ağız içi radyografilerde anatomik gürültünün düşük kontrast algısına etkisi: in vitro bir çalışmaOlsson, Lars ; Nilsson, Mats ; Svenson, Björn ; Hellén-Halme, KristinaDento-maxillo-facial radiology, 2016, Vol.45 (4), p.20150402-20150402

[ix] Bader JD, Shugars DA, Bonito AJ. Seçilmiş diş çürüğü teşhis ve yönetim yöntemlerinin sistematik incelemeleri. J Dent Educ. 2001;65(10):960-8.

[x] Lee JH, Kim DH, Jegon SN, Choi SH. Derin öğrenme tabanlı bir konvolüsyonel sinir ağı algoritması kullanarak periodontal olarak tehlikeye atılmış dişlerin teşhisi ve tahmini. J Periodontal Implant Sci. 2018;48(2):of114-23.

Radyografik Yorumlamanın İyileştirilmesinde Yapay Zekanın Rolü

Tıpta gürültü

Diş hekimliğinde gürültü

Gürültünün sonuçları

Gürültüyü azaltmak ve radyografik yorumlama kalitesini artırmak

Paylaş

Son Makaleler

En İyi Yorumcu İncelemeleri

En İyi Kullanıcı İncelemeleri

En Çok İncelenen