Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/20.500.12416/15956

Browse

Search Results

Now showing 1 - 10 of 199
  • Master Thesis
    Content-based lecture video retrieval
    (2023) Şahin, Yiğit
    Günümüzde e-öğrenme veya çevrimiçi öğrenme olarak sıklıkla karşımıza çıkan uzaktan eğitim, eğitim-öğretim sırasında eğitmen ile öğrencinin fiziksel olarak yan yana olmadığı ve öğrenci-eğitmen iletişimini kolaylaştırmak için çeşitli teknolojilerin kullanıldığı yeni nesil bir eğitim yaklaşımıdır. Bu yaklaşım koronavirüs pandemisi (COVID-19) ile dünya çapındaki ağda (www) özellikle ders-eğitim içerikli videolar ile daha yaygın ve kullanılabilir hale gelmiştir. Ancak internet ortamında bulunan video sayılarındaki yüksek artış hızı, belirli bir içeriğe sahip videoya ulaşmak isteyen kullanıcıların video içeriklerine erişimini oldukça zorlaştırmıştır. Bahsedilen bu zorluklara bir öneri geliştirmek bağlamında bu araştırmada kullanıcıların belirli eğitim içerikleri ile ilgili videolara erişimini amaçlayan içerik tabanlı erişim yöntemi ele alınmıştır. Kullanıcıların aradıkları video içeriklerine daha kolay ulaşması için videoların doğru sınıflandırılması gerekmektedir. Teknik açıdan sınıflandırılmanın yapılabilmesi için ise öncelikle videoların metin bilgilerine ulaşılmalıdır. Bu çerçevede araştırmada videoların metin bilgilerini çıkarmak için optik karakter tanıma (OCR) ve otomatik konuşma tanıma (ASR) isimli iki farklı indeksleme yöntemi kullanılmıştır. Bu iki yöntem ve bu iki yöntemin birlikte kullanıldığı bir analiz, bu tezde belirli bir veri kümesi üzerinden ele alınmıştır. Veri kümesi olarak ise 110 videolu bir eğitim koleksiyonu kullanılmıştır. Bu kapsamda aynı veriyi kullanarak OCR ile analiz yapmış bir tez referans alınarak, bu kez de ASR yöntemi ile aynı metrik analizler yapılmıştır. Son olarak ise, hem OCR hem de ASR yöntemi kullanılarak çeşitli metrik değerler hesaplanmıştır. Verilerin sınıflandırma analizi için 3 farklı geleneksel makine öğrenme yöntemi kullanılmıştır. Kullanılan geleneksel makine öğrenme yöntemleri Support Vector Machine (SVM), Naïve Bayes ve Random Forest yöntemleridir. Bu doğrultuda farklı makine öğrenme yöntemleri ve farklı indeksleme yöntemlerinin aynı veri kümesi üzerinde metrik analizleri karşılaştırılmıştır. Yapılan analizler sonucunda ders videolarının içerik tabanlı erişimde kullanılabilmesi için günümüzde mümkün olan geleneksel makine öğrenme yöntemleri ile indeksleme yöntemlerinin güçlü ve zayıf yönlerinin açıklaması yapılmıştır. Bununla birlikte aynı konuda yapılacak gelecek çalışmalar için yöntemin geliştirilebilecek yönleri vurgulanmış ve bu konudaki öneriler sunulmuştur. Bu tez, yapılan karşılaştırmalı araştırmanın hem eğitim hem de yazılım sektörünü nasıl etkileyebileceği tartışması ile noktalanmaktadır.
  • Master Thesis
    Classification of darknet activities using neural networks
    (2023) Aktan Ten, Büşra
    Tehditlere maruz kalmadan önce ağı karakterize ederek analiz yapmak oldukça önemlidir. Bu çalışmada darknet ağ trafiği analizi yapılarak darknet ağı 2 katmanlı yapay sinir ağı modellerinde inceleme gerçekleştirilerek tespit ve karekterize edilmiştir. İlk katmanda verinin iyi huylu mu yoksa darknet verisi trafiğimi ayırt edilmekte, ikinci katmanda ise trafiğin oluşturduğu Browsing, P2P, Chat, Email, Transfer, Audio Stream, Video Stream ve VOIP kategorilerinden hangisine ait olduğu tespiti yapılmaktadır. RNN, LSTM ve MLP veri algoritma modelleri ile deneyler yapılmıştır. GAN ile yeni veri setleri üretilerek diğer yöntemlerin eğitim verisi olarak kullanılmıştır. LSTM ve MLP algoritmaları ikinci katmanda hem çoklu kategori hem de ikili kategorili olarak tekrar kurgulanmıştır. MLP model de özellik seçimi algoritması uygulanmıştır. CICDarknet2020 veri seti kullanılmıştır. Model doğruluk değerlerine göre RNN darknet trafiği tespitinde 0.98, ikinci katmanda ise 0.86 oranında başarı elde edilmiştir. LSTM modelinde sırasıyla 0.99 ve 0.71 doğruluk değerleri elde edilmiştir. Ayrı ayrı modellenen kategorilerin ortalama doğruluk değerleri 0.92 olarak elde edilmiştir. MLP modelinde, sırasıyla 0.99 ve 0.78 değerleri gözlemlenmiştir. Özellik seçimi algoritma modeli ile aynı çıktılar elde edilmiştir. ikili kategori modelinde ortalama olarak %96 doğruluk değerleri sağlanmıştır.
  • Master Thesis
    Stance detection in Turkish dataset on Russia-Ukraine war
    (2023) Fırat, Eray
    Sosyal medya son yıllarda çeşitli konulardaki kamuoyu görüşlerini anlamak için temel bir bilgi kaynağı haline gelmiştir. Bu nedenle, sosyal medyadan elde edilen verilerden otomatik bilgi çıkarmanın önemi artmıştır. Doğal dil işleme alt görevlerinden biri olan duruş tespiti de, otomatik bilgi çıkarımı için önemli bir konudur. Duruş tespiti, kullanıcının belirli bir konu, olay veya kişiye karşı tutumunu otomatik olarak belirler. Bu çalışmada, Rusya-Ukrayna Savaşı'na ilişkin sosyal medya kullanıcılarının duruşlarını tespit etmeye odaklanan Türkçe etiketlenmiş veri seti oluşturulmuş ve bu veri seti üzerinde çeşitli makine öğrenimi yöntemleri test edilmiştir. Bu çalışma için Twitter'dan toplanmış Türkçe metinler içinden Rusya ve Ukrayna olmak üzere iki hedefle etiketlenmiş 8215 tane metin-hedef çifti ile yeni bir veri seti oluşturulmuştur. Bu veri setine Destek Vektör Makineleri, Rastgele Orman, k-En Yakın Komşu, XGBoost, Uzun-Kısa Süreli Bellek (LSTM) ve Kapı Özyinelemeli Geçitler (GRU) modelleri GloVe ve Fastext kelime gömme yöntemi ile uygulanmıştır. Veri seti hedefler arasında dengesiz olduğu için, bu algoritmalarla eksik örnekleme ve aşırı örnekleme yöntemleri de kullanılmıştır. Destek Vektör Makineleri yöntemi ile, Rusya için 0.73 ve Ukrayna için 0.81 F1 puanıyla en iyi sonuçlaın alındığı görülmüştür. Bu sonuçlara ek olarak, LSTM ve GRU yöntemlerinden elde edilen sonuçlar Destek Vektör Makineleri algoritmasının sonuçlarına oldukça yakındır. Yeni oluşturulan bu Türkçe veri seti, duruş tespiti araştırma alanı için değerli bir kaynak olarak değerlendirilebilir ve gelecek çalışmalarda bu veri seti ile transformer tabanlı yaklaşımlar kullanılabilir. Genel olarak, bu çalışma Türkçe metin kullanarak duruş tespiti araştırma alanını katkıda bulunmaktadır.
  • Master Thesis
    Predictive modeling for botnet detection: A new dataset and machine learning approach
    (2023) Budak, Kadir İlker
    Teknolojinin gelişmesiyle birlikte çevrimiçi hizmetlerin önemi giderek artmıştır. Saldırganlar, botnet'lerden oluşan zombi ağını yöneterek, sistem ve ağlara kapasitelerinden fazla istekte bulunur, böylece hizmetlerin yavaşlamasını veya kesintiye uğramasını hedefler. Bu tür saldırılara DDOS (Dağıtılmış Hizmet Reddi saldırısı) adı verilir. DDOS saldırılarının tespiti ve önlenmesi için literatür çalışması yapılmış ve birçok farklı teknikle karşılaşılmıştır. Yapılan araştırmalar sonucunda Makine Öğrenmesi ve DDOS davranış tespiti konularına ağırlık verilmiştir. Machine Learning ile Davranış tabanlı DDOS tespiti için yapılan bu çalışmada, CTU-13 veri seti ve yerel ortamda oluşturulan sanal veri seti kullanılmıştır. Veri setleri üzerine normalizasyon işlemleri uygulanarak çalışma için hazır hale getirilmiştir. Makine Öğrenemsi için 5 farklı algoritma kullanılmış ve algoritmalar üzerinde parametre ayarı yapılmıştır. Çoklu regresyon, topluluk öğrenimi ve özellik çeşitleme gibi farklı yöntemlerin sonuca etkisi değerlendirilmiştir. İyileştirmelerin sonuçlar üzerindeki etkileri tartışılmıştır. Genel olarak Random Forest ve Decision Tree başarılı algoritmalar olarak öne çıkmaktadır. Naive Bayes ve Support Vector Machine, bu senaryo için başarısız olmuştur. Topluluk öğrenim yönteminde birlikte çalışan iki algoritmanın sonuca olumlu etkisi olmuştur. Sanal veri setinin en önemli sonucu, ip adresi özelliğinin kullanımının sonuca olumlu bir katkısının olmamasıdır.
  • Master Thesis
    An autoML tool for software vulnerability prediction
    (2023) Gürcan, Tarık
    Özellikle son yıllarda büyük miktarda verinin daha erişilebilir hale gelmesi ve finans, sağlık, lojistik ve teknoloji gibi sektörlere önemli faydalar sağlaması nedeniyle makine öğreniminin yaygınlaşması kaçınılmaz olmuştur. Farklı sektörlerde kullanılmaya başlayan makine öğrenmesi uygulamalarının hayata geçirilmesi ihtiyacı hızlı ve verimli bir şekilde artmaktadır. Ancak geleneksel yöntemleri kullanarak bir makine öğrenimi modeli oluşturmak için gereken derin teknik bilgi ve kodlama becerilerine herkes yetkin olmayabilir. Bu nedenden dolayı kodsuz veya az kodlu platformlar daha fazla ilgi görmeye başlamıştır. Bu platformlar, kullanıcıların veri kümelerini yüklemesine, modeli oluşturmaya yönelik özellikleri tanımlamasına ve hatta teknik olmayan arayüzlerle modeli eğitmesine ve değerlendirmesine olanak tanır. Bu sayede karmaşık kod yazma ihtiyacını ortadan kaldırarak daha geniş bir kitlenin makine öğrenimi projelerine dahil olmasını mümkün kılar. Bu tezde, diğer kodsuz platformlara ek olarak çalışma zamanı sınırlama ve model bozulma analizi gibi temel özellikleri sunan, yazılım zafiyet analizi için kodsuz makine öğrenimi tahmin modellerinin gerçekleştirilmesine olanak sağlayan bir platform geliştirilmiştir. Bu platform, PPDaaS (Prediction Platform as a Service) olarak adlandırılmıştır ve "Yazılım Güvenlik Açığı" ve "OpenML" veri kümeleriyle tahmin modellerini eğitmek için kullanılmıştır. Başlangıçta platform, AutoML platformları için kullanılan kıyaslama verileriyle test edildi. Sınıflandırma algoritmalarının performansı, makine öğrenimi algoritmaları arasında adil bir karşılaştırma yapmak için "OpenML yetişkin" veri kümesine bir zaman sınırı konularak değerlendirildi. Platform, amaçlanan AutoML işlevleri açısından test edildikten sonra Yazılım Güvenlik Açığı verilerindeki model bozulmasını bulmak için kullanıldı. Son olarak geliştirilen PPDaaS platformuna ilişkin geri bildirimler son kullanıcılardan da toplandı. Sonuçlar geliştirilen PPDaaS platformunun yazılım sektöründe kendine yer bulabileceğini göstermektedir.
  • Master Thesis
    Multi-objective software project cost estimation using recent machine learning approaches
    (2023) Derya, Doğay
    Yazılım projeleri, çeşitli sektörlerdeki şirketlerin günlük operasyonlarında dahi günden güne stratejik önem kazanmaktadır. Artan ihtiyaçla birçok şirket gerek kendi bünyesinde, gerekse farklı sektörlerin ihtiyacına yönelik olarak projeler yaratarak yazılımlar geliştirmektedir. Yazılım projeleri için ihtiyaç duyulan işgücünü doğru tahmin etmek, proje maliyetlerini doğru tahmin etmek ve zamanında tamamlanmasını sağlamak için çok önemlidir. 1970'lerden bu yana, yazılım efor tahmini alanı, literatürde kapsamlı araştırmaların konusu olmuştur. Başlangıçta uzman görüşü gibi algoritmik olmayan yöntemler kullanılırken, sorunlar karmaşıklaştıkça, teknoloji ve donanım özellikleri çeşitlendikçe farklı çözüm yaklaşımlarına olan ihtiyaç da ortaya çıkmıştır. Bu zorlukların üstesinden gelmek için regresyon ve model tabanlı tahmin gibi algoritmik yöntemler geliştirilmiştir. Son yıllarda ise, özellikle son on yılda olmak üzere teknolojideki gelişmelerle birlikte, Makine Öğrenimi tabanlı modelleri ve Yapay Zekayı yazılım maliyet tahminine uygulamaya yönelik artan bir ilgi olmuştur. Bu çalışmanın odak noktası, yazılım projeleri bağlamında Makine Öğrenimi tabanlı tahmin yöntemlerini keşfetmektir. Amaç, bu yöntemlerin yazılım maliyet tahminini nasıl iyileştirebileceğini araştırarak, etkinliklerini analiz etmektir.
  • Master Thesis
    Analyzing multi-objective software test effort estimation techniques
    (2023) Derya, Osman Berkcan
    Yazılım test efor tahmini, bir mühendisin yazılım projesinin test aşamasında ihtiyaç duyduğu yaklaşık süre ve kaynakların tahminidir. Yazılım test efor tahmini, yazılım projesinin test eforunu belirlemek için yazılım geliştirme sürecindeki en önemli aşamalardan birisidir. Gerçek efora en yakın efor tahminini yapmak yazılım test sorumluları başta olmak üzere hem bu hizmeti veren firma hem de hem de müşteriler için çok önemlidir. Çünkü yanlış yapılan yazılım test efor tahminleri projelerin tamamlanamamasına ya da geniş bir zaman dilimine yayılmasına neden olmaktadır.Bu yüzden yazılım test efor tahmini için literatürde farklı yöntemler geliştirilmiştir. Bu tez çalışmasında, yazılım test projelerinin eforu, Makine Öğrenmesi (MÖ) algoritmaları kullanılarak ve farklı methodlarla öznitelik seçimi yapılarak tahmin edilmeye çalışılmıştır. Yazılım test eforunun tahmini, WEKA (Waikato Environment for Knowledge Analaysis – Bilgi Analizi için Waikato Ortamı) veri madenciliği aracında bulunan algoritmaların çalıştırlması sonucu bulunmuştur. Algoritmalar 10 kat çapraz doğrulama tekniği ile PROMISE (Yazılım Mühendisliğinde Tahmin Modelleri) veri deposundan alınan 3 adet veri setine (CocomoNasa, CocomoNasa-2, Cocomo-81) uygulanmıştır. Performans ölçütü olarak korelasyon katsayısı, Ortalama Mutlak Hata ve Bağıl Mutlak Hata, baz alınarak sonuçlar değerlendirilmiştir.
  • Master Thesis
    Exploring the trends, challenges, and opportunities of regulatory technology (RegTech) in the financial industry: A systematic literature review
    (2023) Yıldırım, Ufuk
    Bu sistematik literatür incelemesi, düzenleyici teknolojinin (RegTech) finans sektöründe artan önemini keşfederken, araştırmaları ve gelişmeleri sentezleyerek eğilimlerin, zorlukların ve fırsatların kapsamlı ananilizini sunmayı amaçlamaktadır. RegTech, Fintech'in bir alt kategorisi olarak, yapay zeka, makine öğrenimi ve block-chain gibi gelişmiş teknolojileri kullanarak, sektör düzenlemelerine uyum süreçlerini kolaylaştırmayı ve ilişkili maliyetleri azaltmayı hedeflemektedir. 2016 ve 2023 yılları arasında yayınlanan ilgili makaleleri belirlemek için Scopus ve Web of Science verita-banlarında sistemli bir arama yapılmıştır. Titiz bir tarama ve seçim sürecinden sonra, inceleme için 48 makale uygun bulunmuştur. RegTech, finansal sektör için birçok fırsat sunmaktadır. İnceleme, gelişmiş düzenleyici verimlilik, azaltılmış maliyetler ve iyileştirilmiş risk yönetimi potansiyeline dikkat çekmektedir. RegTech'nin benimsen-mesi, finansal katılımı teşvik edebilir ve düzenleyici zorlukları ele almak için daha yenilikçi çözümler sağlayabilir. RegTech'in merkezi olmayan finans (DeFi) gibi yükselen teknolojileri desteklemedeki rolünü keşfetmek ve finansal istikrar ve tüketici koruması üzerindeki etkisini anlamak için daha fazla araştırma önerilmektedir.
  • Master Thesis
    Development of tool for managing semantic text content
    (2009) Karakaynak, Samet
    Bu çalışma çoklu dokümanlardan saklı anlamsal analiz yöntemi kullanılarak sanal merkeze dayalı özet çıkarılması amacıyla gerçekleştirilmiştir. İlk olarak saklı anlamsal analiz yöntemi kullanılarak anahtar terimler çıkarılır. Anahtar terimler cümle çıkarmaya başlamadan önce anlama katkısı olmayan cümlelerin filtrelenmesi için kullanılır. Daha sonra özet cümleler, anahtar terimleri barındıran cümlelerden sırasıyla saklı anlam indeksleme ve kümeleme ile sanal merkeze dayalı yöntem kullanılarak çekilir.
  • Master Thesis
    Optimization the training algorithms of machine learning using GAN networks
    (2022) Akel, Sedat
    Yapay zekâ, son birkaç on yılda hayatımızda çok farklı yönleriyle yer bulmaya başladı. Bazı özelliklerinde yapay zekanın yer almadığı yeni bir ürün, günümüz dünyasında pek yer edinemez durumdadır. Bu, makine öğrenmesi algoritmalarında derin öğrenme tekniklerinin kullanılması ile mümkün olmuştur. Geleneksel makine öğrenmesi, ham veriyi algoritmalarda kullanılabilecek özelliklere çevirebilmek için insan akılının yer aldığı tasarım ve kodlamalara ihtiyaç duymaktadır. Fakat derin öğrenme ile doğrudan ham veriyi kullanarak özellikleri öğrenmek mümkündür. Bu da makine öğrenmesi sırasında alan uzmanı ihtiyacını oldukça azaltmaktadır. GANlar derin öğrenme alanında oldukça yeni bir ilerleme alanıdır. GANlar 2014'ten önce yoklardı. Onların makine üretmesi alanındaki kapasiteleri ve üretimdeki kaliteleri diğer üretici makine öğrenmesi tekniklerinden çok daha iyi durumdadır. Felsefeleri, verideki özellikleri tanımlamayı otomatik olarak öğrenen ve kendi kendini eleştirerek bunu yapan bir mantığa dayanmaktadır. GANlar, fotoğraf kalitesinde resimler üretmek, siyah-beyaz resimleri renklendirmek, basit bir çizimi gerçekçi bir resime dönüştürmek, resimlerin çözünürlüğünü artırmak, resimlerdeki hatalı-eksik yerleri onarmak, videolarda sonraki kareyi tahmin etmek, makine öğrenmesinde kullanmak üzere veri üretmek, geçekçi yazılar üretmek, gerçekçi müzik ve sesler üretmek için kullanılabilmektedir. GANların mimarisi derin öğrenme teknikleri arasında oldukça orijinaldir. Temel olarak birbiriyle yarışan iki sinir ağından oluşmaktadır. Yapıları oldukça zeki tasarlanmış ve oldukça ilginçtir. Fakat bu durum makine öğrenmesini oldukça zorlu ve kırılgan yapmaktadır. GANlar oldukça zor öğretilen, hataya açık ve optimizasyonu oldukça zor olarak tanınmaktadır. Bu tezde GANların optimizasyonuna odaklandık. GANların felsefeleri zorluklarda anahtar konumdadır. Bu sebeple öncelikle GANların eğitimindeki potansiyel zorlukları açıkladık. Daha sonra iyi olarak bilinen bazı GAN mimarilerini, bazı veri setleri ile eğitim sonuçlarını karşılaştırdık. Son olarak bazı temel yapısal öneriler ve optimizasyon parametreleri önerdik.