Görür, Abdül KadirBuktash, Ali Abdulameer Buktash2025-06-052025-06-052025https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=htlyhJG97gjBTPjAeWRhPo3h9lfDUivsm90IZGy6Svm6dYPf3LMkXAr5XBXmMXThhttps://hdl.handle.net/20.500.12416/10014Arka Plan: Alkolik olmayan yağlı karaciğer hastalığı, karaciğerle ilişkili morbiditenin önde gelen nedenlerinden biridir ve erken teşhis edilip tedavi edilmemesi durumunda karaciğer fibrozisi, siroz ve karaciğer kanseri gibi ciddi karaciğer hasarlarına ilerleyebilir. Ultrason görüntüleme, teşhis için yaygın olarak kullanılan girişimsel olmayan bir tanı aracıdır. Ancak, görüntüleme cihazlarındaki farklılıklar ve etiketlenmiş veri setlerinin yetersizliği, otomatik teşhis için genelleştirilebilir makine öğrenimi modellerinin geliştirilmesini zorlaştırmaktadır. Amaç: Bu tez, etiketli verilere olan bağımlılığı en aza indirirken tanısal doğruluğu artırmak amacıyla, Öz-Denetimli Öğrenme (Self-Supervised Learning, SSL) yöntemlerinden özellikle Bootstrap Your Own Latent (BYOL) ve Simple Contrastive Learning of Visual Representations (SimCLR) yöntemlerinin kullanımını araştırmayı amaçlamaktadır. Bu sayede radyologların görüntüleri etiketlemek için harcadığı zaman ve maliyet düşürülebilecektir. Yöntemler: BYOL ve SimCLR, etiketlenmemiş görüntülerden iyi kaliteli görüntü temsilleri öğrenmek için kullanılmıştır. Model boyutunun sınıflandırma performansına etkisini ölçmek için ResNet-50 ve ResNet-101 mimarilerkullanılmıştır. Ayrıca, varsayılan ve uyarlanmış veri artırma (augmentation) yöntemleri, dengeli ve dengesiz sınıf dağılımı protokolleri ve farklı mini yığın (batch) boyutları ile birlikte, değişen yüzdelerde etiketli veriler kullanılarak hem doğrusal (linear) hem de hassas ayar (fine-tuning) değerlendirmeleri gerçekleştirilmiştir. Bulgular: BYOL ve ResNet-50 kullanılarak önerilen özel veri artırma yöntemi ve dengeli sınıf dağılımı protokolü ile en yüksek doğruluk elde edilmiştir. Üç farklı rastgele alt küme üzerinde yapılan doğrusal değerlendirme sonucunda, etiketlerin sırasıyla %100, %10 ve %1'i kullanıldığında ortalama doğruluk oranları %91.71, %90.91 ve %86.64 olarak elde edilmiştir. Bu, etiketlerin küçük bir kısmı ile eğitilen denetimli öğrenme modeline kıyasla istatistiksel olarak anlamlı bir farktır (P < 0.05). Ayrıca, %10 ve %1 etiket kullanıldığında, denetimli öğrenme modeline kıyasla %10.47 ve %16.47 daha yüksek doğruluk sağlanmıştır. Bunun yanı sıra, biri-dışarıda çapraz doğrulama yöntemi kullanıldığında, tam etiketli veri ile BYOL modeli ortalama %97.81 doğruluk ve 0.971 AUC değerlerine ulaşmıştır. Çalışmanın önemli bir bulgusu, önerilen özel veri artırma yönteminin performansı önemli ölçüde artırmasıdır; test edilen tüm yöntemler arasında en yüksek doğruluk ve AUC değerleri bu yöntemle elde edilmiştir. Ayrıca, BYOL'un sınıf dengesizliğinin üstesinden gelme konusunda SimCLR'den daha başarılı olduğu gözlemlenmiştir. Sonuç: Özel veri artırma yöntemiyle kullanılan BYOL, etiketlere bağımlı olmadan yüksek kaliteli görüntü temsilleri öğrenebilir. Bu durum, özellikle sınırlı anotasyona sahip veri setleri için, tıbbi görüntüleme uygulamalarında öz-denetimli öğrenmenin potansiyelini ortaya koymaktadır.Background: Non-alcoholic fatty liver disease is one of the leading causes of liver-related morbidity that can progress to severe liver damage such as liver fibrosis, cirrhosis, and liver cancer if not diagnosed and treated early. Ultrasound imaging is a non-invasive diagnostic tool that is commonly used for diagnosis. However, differences in imaging devices and the lack of labeled datasets hinder the development of generalizable machine-learning models for automated diagnosis. Objective: This thesis aims to investigate the use of Self-Supervised Learning (SSL) methods, specifically Bootstrap Your Own Latent (BYOL) and Simple Contrastive Learning of Visual Representations (SimCLR), to improve diagnostic accuracy while minimizing reliance on labeled data. Thus, reducing the time and cost required by radiologists to annotate the images. Methods: BYOL and SimCLR have been employed to learn good image representations from unlabeled images, utilizing ResNet-50 and ResNet-101 architectures to evaluate the impact of model size on classification performance. In addition, default and custom augmentation with balanced and imbalanced class distribution protocols with different batch sizes have been tested using both linear and fine-tuning evaluation with varying percentages of labeled data. Results: BYOL with ResNet-50 achieved the highest accuracy, utilizing the proposed custom augmentation set and balanced class distribution protocol, average accuracies of 91.71, 90.91, and 86.64 were achieved using 100%, 10%, and 1% of the labels with linear evaluation, respectively over three shuffled subsets. This is a statistically significant difference (P < 0.05) compared to its supervised learning counterpart with a small portion of labels. It is higher than its supervised learning counterpart by 10.47 and 16.47 using 10% and 1% of the labels, respectively. Moreover, using leave-one-out cross-validation, the same method achieved average accuracy and AUC of 97.81 and 0.971, respectively, with full label utilization. A key finding of this research is that the proposed custom augmentation set significantly improved performance, achieving the highest accuracy and AUC among all methods tested. Furthermore, BYOL shows a higher ability to handle class imbalance than SimCLR. Conclusion: BYOL, with the custom augmentation, can learn high-quality image representation without relying on labels, highlighting the potential of self-supervised learning in medical imaging applications, particularly for datasets with limited annotations.enBilgisayar Mühendisliği Bilimleri-bilgisayar ve KontrolComputer Engineering and Computer Science and ControlUltrason Görüntüleme ile Alkolik Olmayan Yağlı Karaciğer Hastalığı Teşhisinde Öz-Denetimli ÖğrenmeSelf-Supervised Learning for Non-alcoholic Fatty Liver Disease Diagnosis Using Ultrasound ImagingMaster Thesis114934257