Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/20.500.12416/15956

Browse

Search Results

Now showing 1 - 6 of 6
  • Master Thesis
    An Adaptive and Context-Aware Text Segmentation Method for Information Retrieval
    (2026) Şirin, Burçe; Arslan, Serdar
    Günümüzde dijital uygulamaların artmasıyla birlikte metinsel verilerin hacmi artmakta; ayrıca dil, yapı, içerik, uzunluk gibi özellikler bakımından giderek daha çeşitlenmekte ve karmaşıklaşmaktadır. Böyle geniş bir bilgi havuzunda bireylerin ihtiyaç duydukları bilgiye doğru ve etkin bir şekilde erişmeleri giderek zorlaşmakta; bu da bilgi erişim sistemlerini vazgeçilmez hale getirmektedir. Ancak bu sistemlerde, özellikle uzun ve içerik açısından zengin metinlerin tek parça halinde ele alınması anlamsal kayma ve işlem maliyetinin artması sorunlarına yol açabilmektedir. Bu sorunların çözümü için, metinlerin anlam bütünlüğü korunarak daha küçük parçalara ayrılmasını amaçlayan çeşitli metin segmentasyon yöntemleri geliştirilmiştir. Bununla birlikte, mevcut çalışmalar segmentasyon başarısının veri seti özellikleri ve görev gereksinimlerine bağlı olarak değiştiğini ve tüm senaryolar için geçerli tek bir yaklaşım bulunmadığını göstermektedir. Bu durum, yeni ve uyarlanabilir yöntemlere olan ihtiyacı ortaya koymaktadır. Bu tezde, bu ihtiyaçtan yola çıkarak, veriye ve bağlama duyarlı bir segmentasyon yöntemi önerilmekte ve bilgi erişimi açısından verimliliği ve etkinliği değerlendirilmektedir. Önerilen yöntemde öncelikle metinler cümlelere ayrılmakta ve her cümle için yoğun vektör temsilleri oluşturulmaktadır. Ardışık cümleler arasındaki anlamsal ilişkiler, bu vektörleri kullanan bir maliyet fonksiyonu ile modellenmekte ve dinamik programlama yaklaşımı ile küresel maliyeti en aza indiren segment sınırları belirlenmektedir. Önerilen yöntem, farklı veri kümeleri ve vektör temsili oluşturma stratejileri kullanılarak bir bilgi erişim hattı üzerinde bir referans yöntemle karşılaştırılmıştır. Değerlendirmeler, ortalama segment boyutlarına, segmentasyon süresine ve MRR, DCG ve nDCG bilgi erişim metriklerine göre yapılmıştır. Deneysel bulgular, önerilen yöntemin verimlilik açısından başarılı olduğunu ortaya koymaktadır. İyileşmeler sınırlı düzeyde olmakla birlikte, etkin bilgi erişimi konusunda da tutarlı kazanımlar sağlandığı gözlemlenmiştir.
  • Master Thesis
    Improving File Security through an Optimized Auto-Classification Approach Using Learning Models
    (2024) Açıkgöz, Zeliha; Arslan, Recep Sinan; Arslan, Serdar
    PDF dosyalarını hedef alan kötü amaçlı yazılımlar dijital güvenlik açısından ciddi bir tehdit oluşturmaktadır. Bu çalışmada PDF dosyalarının sınıflandırılması için kapsamlı bir yöntem önerilmiştir. Çalışma kapsamında PyPDF2, PDFMiner ve PyMuPDF kütüphaneleri kullanılarak PDF'lerden 43 farklı genel ve yapısal özellik çıkarılmıştır. Çalışmada iki faklı aşama bulunmaktadır. İlk aşamada kullanılan veriseti tek sütun olacak şekilde TF-IDF, N-gram Count Vectorizer ve Word2Vec yöntemleri ile sayısallaştırılarak özellik seçimi yapılmadan model eğitimlerinde kullanılmıştır. İkinci aşamada ise metin içeren sütunlar Word2Vec ile sayısallaştırıldıktan sonra özellik seçim yöntemleri uygulanarak model eğitimlerinde kullanılmıştır. İlk aşamada yedi farklı makine öğrenmesi ve dört farklı derin öğrenme modeli uygulanmıştır. İkinci aşamada ise makine öğrenme modellerine ek özgün tasarlanmış Çok Dallı CNN modeli kullanılmıştır. Özellik seçiminde SelectKBest, Recursive Feature Elimination (RFE) ve Lasso yöntemleri uygulanmıştır. Önerilen Çok Dallı CNN mimarisi özellik seçimi yöntemlerinin sonuçlarına uygulanmıştır. Çok Dallı CNN modeli yapılan test sonucunda Lasso özellik seçimiyle 0.9982 doğruluk değeri elde edilmiştir. Makine öğrenimi modelleriyle yapılan deneyler, özellik çıkarımı olan ve olmayan veri setleri üzerinde değerlendirilmiş ve karşılaştırmalı olarak doğruluk, kesinlik, geri çağırma oranı ve F1 puanı gibi metrikler her iki aşama için de analiz edilmiştir. Çalışma, yaklaşık 30.000 PDF dosyasından oluşan kapsamlı bir veri seti üzerinde test edilmiştir. Elde edilen sonuçlar, PDF tabanlı kötü amaçlı yazılımların tespiti için etkili bir yaklaşım sağlamayı amaçlamaktadır.
  • Master Thesis
    Çeşitli Türkçe Metinlerin Gelişmiş Duygu Sınıflandırması İçin Hiyerarşik Kapılı Dikkat Ağı ve Yinelemeli Sinir Ağının Birleştirilmesi
    (2024) Eke, Simay; Arslan, Serdar
    Duygu sınıflandırması, metinlerdeki bağlamları ve eğilimleri belirlemede önemli bir süreçtir. Doğal dil işleme ve derin öğrenmedeki son gelişmeler nedeniyle sinir ağları gibi yöntemler duygu sınıflandırmasında çok daha fazla önem kazanmıştır. Bu çalışma özellikle gömme yöntemlerini, dikkat ağlarını ve mekanizmalarını, Yinelemeli Sinir Ağlarını vurgulamaktadır. Çalışma karakter ve kelime gömmelerinin modelleri ve metin analizini nasıl geliştirdiğini, dikkat mekanizmalarının bilginin belirli bölümlerine nasıl vurgu yaptığını ve daha fazla dikkat ettiğini, Uzun Kısa Süreli Bellek ağlarının metindeki uzun vadeli bağımlılıkları ve zamansal değişimleri nasıl oldukça etkili bir şekilde yakaladığını incelemektedir. Hem kısa, yapılandırılmamış hem de uzun, yapılandırılmış Türkçe metinlerin duygularını tek bir modelde analiz etmek amacıyla Uzun Kısa Süreli Bellek ve Hiyerarşik Kapılı Dikkat Ağı birleştirilerek bir hibrit model geliştirilmiştir. Ayrıca önerilen modelin performansını değerlendirmek için Twitter verisi kullanılarak yeni bir Türkçe veri seti oluşturulmuş ve etiketlenmiştir. Hiyerarşik Kapılı Dikkat Ağı, hem kelime hem de cümle düzeylerinde temel bilgileri önceliklendirerek ikili bir rol oynar ve böylece metnin hiyerarşik yapısını daha etkili bir şekilde yakalar. Bu yaklaşım, Uzun Kısa Süreli Bellek Ağlarının güçlü yetenekleriyle birleştiğinde duygu sınıflandırması için sağlam bir çerçeve oluşturur. Deney sonuçları, bu yöntemlerin birleştirilmesinin duygu sınıflandırmasının performansını artırdığını ve Türkçe metinlerdeki bağlamların daha kapsamlı bir şekilde anlaşılmasını sağladığını göstermektedir. Çalışma, bu tekniklerin nasıl uygulandığını ve bu uygulamaların modelin duygu sınıflandırması üzerindeki etkilerini ayrıntılı olarak inceler ve bunları diğer yapılandırmalar, yöntemler ve modellerle karşılaştırır.
  • Master Thesis
    Attention Mekanizmaları ve Hibrit ViT-ResNet Mimarisi ile Gemi Görüntülerinin Çok Sınıflı Sınıflandırılması
    (2025) Ergün, Berkay; Arslan, Serdar
    Bu tezde, gemi görüntülerinin çok sınıflı sınıflandırılması için Vision Transformer (ViT) ve ResNetRS50 tabanlı hibrit bir model geliştirilmiştir. ViT yüksek seviyeli anlamsal bilgileri, ResNetRS50 ise düşük ve orta seviyeli mekânsal özellikleri çıkarmakta; bu iki yapı, dikkat (attention) mekanizmaları ve Gated Fusion katmanı ile birleştirilmektedir. Eğitim sürecinde MixUp ve CutMix veri artırma yöntemleri, Focal Loss ile bilgi aktarımı (distillation) kaybı, OneCycleLR zamanlayıcı, otomatik karma hassasiyet (AMP) ve model ağırlıklarının üssel hareketli ortalaması (EMA) kullanılmıştır. Sekiz gemi sınıfından oluşan veri kümesi üzerinde yapılan deneyler, önerilen mimarinin hem doğruluk hem F1 skoru açısından tek başlı CNN veya ViT modellerinden daha yüksek performans gösterdiğini ortaya koymuştur. Sonuçlar, hibrit mimariler ve dikkat tabanlı füzyon stratejilerinin gemi sınıflandırma problemlerinde etkin bir çözüm sunduğunu göstermektedir.
  • Master Thesis
    Derin Öğrenme ve Çok Boyutlu İndeksleme Kullanılarak İçerik Tabanlı Görüntü Alma
    (2024) Uzel, Ömer; Arslan, Serdar
    Son yıllarda yaşanan teknolojik gelişmeler ile donanım ve yazılım maliyetlerindeki düşüş, görsel arama uygulamalarını hem popüler hem de vazgeçilmez bir hale getirdi. Dolayısıyla, görsel sorgular aracılığıyla görüntülerin geniş veri tabanlarından hızlı ve hassas bir şekilde alınması kritik bir görev haline geldi. Video karesi düzeyinde veri tabanı aramaları yürütülen sistemlerle karşılaştırıldığında, arama performansını önemli ölçüde artıran yeni bir system sunuyoruz. Önceden eğitilmiş bir Evrişimli Sinir Ağı (CNN) modelinden yararlanarak, verimli indeksleme için düşük seviyeli özellikleri çıkarmak ve depolamak amacıyla denetimsiz görüntü alma süreçlerini kullanıyoruz. Hızlı ve etkili erişimi kolaylaştırmak için, Bakış Noktası Ağacı (VP Tree) olarak bilinen düşük seviyeli özelliklerden yararlanan bir indeksleme yapısı uyguluyoruz. Bu özelliklerden faydalanabilmek için, onları daha düşük boyutlu bir alanda temsil edecek boyut küçültme tekniklerini kullanıyoruz. Karşılaştırmalı görüntü veri kümesi üzerinde gerçekleştirilen deneylerimiz, bu yaklaşımın, K-En Yakın Komşu (KNN) araması olarak bilinen bir arama yöntemiyle karşılaştırıldığında daha hızlı ve doğru erişime yol açtığını göstermektedir. Ayrıca, önerilen tekniği iki gerçek video veri kümesini kullanarak KNN'e karşı değerlendiriyoruz ve bu teknik, sürekli olarak KNN'den daha iyi performans gösteriyor.
  • Master Thesis
    Çevre Bilimleri Alanında Sıfır-Örnekli ve Az-Örnekli Adlandırılmış Varlık Tanıma
    (2024) Demirtaş, Kerem Mert; Arslan, Serdar
    Doğal dil işlemede yeni mimariler, modelin bilgisini farklı görevlere aktarabilmeyi sağlar. Bu aktarımlı öğrenme sayesinde modeli bazı görevler için yeniden eğitme ihtiyacı ortadan kalkmıştır. Aktarımlı öğrenme, önceden eğitilmiş bir Büyük Dil Modeli'ni ince ayar yaparak sağlanabilir. Bu çalışmada sonraki cümleyi tahmin etmek için eğitilmiş bir model olan BERT'in daha sade bir versiyonu olan DistilBERT üzerinde ince ayar yapılarak, metinsel veriler üzerinde önemli bir bilgi erişim görevi olan Adlandırılmış Varlık Tanıma görevinin yapılması sağlanmıştır. Aktarımlı öğrenme, modelin daha önceden edindiği bilgileri daha önce görmediği alanlara aktarabilmeyi de sağlar. Bu bağlamda, çevre bilimleri alanına özgü bir veri kümesi oluşturduk. Ayrıca, belirli varlıkları tanımak için çevre bilimleri alanındaki varlıklar için özel varlık etiketleri tanımlanmıştır. Modelin transfer öğrenme yeteneğini değerlendirmek için oluşturulan veri kümesi üzerinde sıfır atışlı, bir atışlı ve on atışlı öğrenme prosedürleri gerçekleştirilmiştir. Transfer öğrenimini iyileştirmek için modeli genel bir Türkçe veri kümesi üzerinde önceden eğittik. Son olarak, modelin sıfır atışlı ve birkaç atışlı kurulumlardaki tahmin performansını iyileştirmek için bir büyük dil modeli kullanılarak oluşturulan çevre bilimleri alanına özgü veriler, oluşturduğumuz veri kümesiyle birleştirilmiştir. Çalışmada, modeli genel veri kümesiyle önceden eğitme işlemi ve yapay olarak oluşturulan veri kümesini tanıtma işlemi ayrı ayrı ve birlikte değerlendirilmiştir. Ayrıca, eğitim veri kümesinde anlamsal olarak ilişkili varlıkların, modelin tahmin yeteneği üzerindeki etkisi incelenmiş olup, ilişkili varlıkların eğitim verisine eklenmesi sonucu tüm atış seçeneklerinde tahmin performansının iyileştiği görülmüştür. Testlerin değerlendirmesi umut verici sonuçlar göstermekte ve transfer öğrenimi açısından iyileştirmelere ışık tutmaktadır.