Yüksek Lisans Tezleri

Permanent URI for this collectionhttps://hdl.handle.net/20.500.12416/15956

Browse

Search Results

Now showing 1 - 10 of 19
  • Master Thesis
    An autoML tool for software vulnerability prediction
    (2023) Gürcan, Tarık
    Özellikle son yıllarda büyük miktarda verinin daha erişilebilir hale gelmesi ve finans, sağlık, lojistik ve teknoloji gibi sektörlere önemli faydalar sağlaması nedeniyle makine öğreniminin yaygınlaşması kaçınılmaz olmuştur. Farklı sektörlerde kullanılmaya başlayan makine öğrenmesi uygulamalarının hayata geçirilmesi ihtiyacı hızlı ve verimli bir şekilde artmaktadır. Ancak geleneksel yöntemleri kullanarak bir makine öğrenimi modeli oluşturmak için gereken derin teknik bilgi ve kodlama becerilerine herkes yetkin olmayabilir. Bu nedenden dolayı kodsuz veya az kodlu platformlar daha fazla ilgi görmeye başlamıştır. Bu platformlar, kullanıcıların veri kümelerini yüklemesine, modeli oluşturmaya yönelik özellikleri tanımlamasına ve hatta teknik olmayan arayüzlerle modeli eğitmesine ve değerlendirmesine olanak tanır. Bu sayede karmaşık kod yazma ihtiyacını ortadan kaldırarak daha geniş bir kitlenin makine öğrenimi projelerine dahil olmasını mümkün kılar. Bu tezde, diğer kodsuz platformlara ek olarak çalışma zamanı sınırlama ve model bozulma analizi gibi temel özellikleri sunan, yazılım zafiyet analizi için kodsuz makine öğrenimi tahmin modellerinin gerçekleştirilmesine olanak sağlayan bir platform geliştirilmiştir. Bu platform, PPDaaS (Prediction Platform as a Service) olarak adlandırılmıştır ve "Yazılım Güvenlik Açığı" ve "OpenML" veri kümeleriyle tahmin modellerini eğitmek için kullanılmıştır. Başlangıçta platform, AutoML platformları için kullanılan kıyaslama verileriyle test edildi. Sınıflandırma algoritmalarının performansı, makine öğrenimi algoritmaları arasında adil bir karşılaştırma yapmak için "OpenML yetişkin" veri kümesine bir zaman sınırı konularak değerlendirildi. Platform, amaçlanan AutoML işlevleri açısından test edildikten sonra Yazılım Güvenlik Açığı verilerindeki model bozulmasını bulmak için kullanıldı. Son olarak geliştirilen PPDaaS platformuna ilişkin geri bildirimler son kullanıcılardan da toplandı. Sonuçlar geliştirilen PPDaaS platformunun yazılım sektöründe kendine yer bulabileceğini göstermektedir.
  • Master Thesis
    Multi-objective software project cost estimation using recent machine learning approaches
    (2023) Derya, Doğay
    Yazılım projeleri, çeşitli sektörlerdeki şirketlerin günlük operasyonlarında dahi günden güne stratejik önem kazanmaktadır. Artan ihtiyaçla birçok şirket gerek kendi bünyesinde, gerekse farklı sektörlerin ihtiyacına yönelik olarak projeler yaratarak yazılımlar geliştirmektedir. Yazılım projeleri için ihtiyaç duyulan işgücünü doğru tahmin etmek, proje maliyetlerini doğru tahmin etmek ve zamanında tamamlanmasını sağlamak için çok önemlidir. 1970'lerden bu yana, yazılım efor tahmini alanı, literatürde kapsamlı araştırmaların konusu olmuştur. Başlangıçta uzman görüşü gibi algoritmik olmayan yöntemler kullanılırken, sorunlar karmaşıklaştıkça, teknoloji ve donanım özellikleri çeşitlendikçe farklı çözüm yaklaşımlarına olan ihtiyaç da ortaya çıkmıştır. Bu zorlukların üstesinden gelmek için regresyon ve model tabanlı tahmin gibi algoritmik yöntemler geliştirilmiştir. Son yıllarda ise, özellikle son on yılda olmak üzere teknolojideki gelişmelerle birlikte, Makine Öğrenimi tabanlı modelleri ve Yapay Zekayı yazılım maliyet tahminine uygulamaya yönelik artan bir ilgi olmuştur. Bu çalışmanın odak noktası, yazılım projeleri bağlamında Makine Öğrenimi tabanlı tahmin yöntemlerini keşfetmektir. Amaç, bu yöntemlerin yazılım maliyet tahminini nasıl iyileştirebileceğini araştırarak, etkinliklerini analiz etmektir.
  • Master Thesis
    Analyzing multi-objective software test effort estimation techniques
    (2023) Derya, Osman Berkcan
    Yazılım test efor tahmini, bir mühendisin yazılım projesinin test aşamasında ihtiyaç duyduğu yaklaşık süre ve kaynakların tahminidir. Yazılım test efor tahmini, yazılım projesinin test eforunu belirlemek için yazılım geliştirme sürecindeki en önemli aşamalardan birisidir. Gerçek efora en yakın efor tahminini yapmak yazılım test sorumluları başta olmak üzere hem bu hizmeti veren firma hem de hem de müşteriler için çok önemlidir. Çünkü yanlış yapılan yazılım test efor tahminleri projelerin tamamlanamamasına ya da geniş bir zaman dilimine yayılmasına neden olmaktadır.Bu yüzden yazılım test efor tahmini için literatürde farklı yöntemler geliştirilmiştir. Bu tez çalışmasında, yazılım test projelerinin eforu, Makine Öğrenmesi (MÖ) algoritmaları kullanılarak ve farklı methodlarla öznitelik seçimi yapılarak tahmin edilmeye çalışılmıştır. Yazılım test eforunun tahmini, WEKA (Waikato Environment for Knowledge Analaysis – Bilgi Analizi için Waikato Ortamı) veri madenciliği aracında bulunan algoritmaların çalıştırlması sonucu bulunmuştur. Algoritmalar 10 kat çapraz doğrulama tekniği ile PROMISE (Yazılım Mühendisliğinde Tahmin Modelleri) veri deposundan alınan 3 adet veri setine (CocomoNasa, CocomoNasa-2, Cocomo-81) uygulanmıştır. Performans ölçütü olarak korelasyon katsayısı, Ortalama Mutlak Hata ve Bağıl Mutlak Hata, baz alınarak sonuçlar değerlendirilmiştir.
  • Master Thesis
    Optimization the training algorithms of machine learning using GAN networks
    (2022) Akel, Sedat
    Yapay zekâ, son birkaç on yılda hayatımızda çok farklı yönleriyle yer bulmaya başladı. Bazı özelliklerinde yapay zekanın yer almadığı yeni bir ürün, günümüz dünyasında pek yer edinemez durumdadır. Bu, makine öğrenmesi algoritmalarında derin öğrenme tekniklerinin kullanılması ile mümkün olmuştur. Geleneksel makine öğrenmesi, ham veriyi algoritmalarda kullanılabilecek özelliklere çevirebilmek için insan akılının yer aldığı tasarım ve kodlamalara ihtiyaç duymaktadır. Fakat derin öğrenme ile doğrudan ham veriyi kullanarak özellikleri öğrenmek mümkündür. Bu da makine öğrenmesi sırasında alan uzmanı ihtiyacını oldukça azaltmaktadır. GANlar derin öğrenme alanında oldukça yeni bir ilerleme alanıdır. GANlar 2014'ten önce yoklardı. Onların makine üretmesi alanındaki kapasiteleri ve üretimdeki kaliteleri diğer üretici makine öğrenmesi tekniklerinden çok daha iyi durumdadır. Felsefeleri, verideki özellikleri tanımlamayı otomatik olarak öğrenen ve kendi kendini eleştirerek bunu yapan bir mantığa dayanmaktadır. GANlar, fotoğraf kalitesinde resimler üretmek, siyah-beyaz resimleri renklendirmek, basit bir çizimi gerçekçi bir resime dönüştürmek, resimlerin çözünürlüğünü artırmak, resimlerdeki hatalı-eksik yerleri onarmak, videolarda sonraki kareyi tahmin etmek, makine öğrenmesinde kullanmak üzere veri üretmek, geçekçi yazılar üretmek, gerçekçi müzik ve sesler üretmek için kullanılabilmektedir. GANların mimarisi derin öğrenme teknikleri arasında oldukça orijinaldir. Temel olarak birbiriyle yarışan iki sinir ağından oluşmaktadır. Yapıları oldukça zeki tasarlanmış ve oldukça ilginçtir. Fakat bu durum makine öğrenmesini oldukça zorlu ve kırılgan yapmaktadır. GANlar oldukça zor öğretilen, hataya açık ve optimizasyonu oldukça zor olarak tanınmaktadır. Bu tezde GANların optimizasyonuna odaklandık. GANların felsefeleri zorluklarda anahtar konumdadır. Bu sebeple öncelikle GANların eğitimindeki potansiyel zorlukları açıkladık. Daha sonra iyi olarak bilinen bazı GAN mimarilerini, bazı veri setleri ile eğitim sonuçlarını karşılaştırdık. Son olarak bazı temel yapısal öneriler ve optimizasyon parametreleri önerdik.
  • Master Thesis
    Defect product estimation using customer reviews, Amazon use case
    (2022) Eyerci, Tarkan
    Teknoloji her alanı etkilediği gibi ticareti de çok etkiledi. Günümüzde artık, üreticiler, perakendeciler, hizmet sağlayıcılar gibi son kullanıcıya hitap eden tüm işletmeler e-ticaret siteleri ve mobil uygulamaları gibi yöntemlerle internet üzerinden müşterilerine hızlıca ulaşabiliyorlar. Diğer yandan, müşteriler ise artık birçok seçenek arasından seçim yapma şansına sahipler. Kullanıcılar genellikle seçimlerini yaparken daha önce aynı tecrübeyi paylaşmış diğer kullanıcıların yorumlarından faydalanırlar. Bu açıdan kullanıcı yorumları çok değerli bilgiler içerir. Fakat yoğun kullanılan sitelerde bir insanın tek tek inceleyemeyeceği kadar çok yorum birikir. Biz bu çalışmada, ürünlerin belli bir özelliğine, yani kusurlu özelliklerine odaklandık. Kusur bilgisi içeren milyonlarca yorum içinden ilgili yorumları filtre edebilmek için bir yöntem öneriyoruz. Kusur ile ilgili kelimeleri sözlük yardımı ile elle oluşturup bu kelimeler geçen yorumları filtrelemek bir çözüm önerisi olabilir. Fakat bu kelime listesini elle oluşturmak verimli olmayacaktır. Bunun için sadece ilgili ürün gruplarına ait yorumları kullanarak kendi kelime temsil modelimizi eğitip, bu modelle birlikte kelime yakınlıklarını kullanarak daha verimli bir kusur kelimeleri listesi oluşturduk. Kullanıma hazır önceden eğitilmiş bir kelime temsil modelini indirip, bu modelle kendi modelimizi kıyasladık. Genel konularda hazır modelin daha başarılı olurken, özel bir konuda kendi modelimizin kelime listesi oluşturmada daha başarılı olduğunu gördük.
  • Master Thesis
    Evaluation of cryptocurrency investment with fuzzy logic in on-chain analysis
    (2022) Türeli, Engin
    Son zamanlarda herhangi bir otorite ya da merkeze ihtiyaç duymayan bir teknoloji olan kripto para birimlerinin, benzeri görülmemiş bir ilgiyle her boyutta incelemesi artmaktadır. Özellikle Covid-19 pandemisi ile kripto para birimlerinin aktif olarak işlem görme hacmi arttığı gözlemlenmiş ve literatürde de bu bağlamda çalışmaların nitel ve nicel uygulamaları da tespit edilmiştir. Bu nedenle bu çalışma piyasada aktif olarak işlem gören 4 kripto varlığın (Bitcoin, Ethereum, Chainlink, Maker) iki blok arasında yapılan matematiksel işlemlerin yorumlanması diğer bir deyişle on-chain analizinin literatürden bilindiği kadarıyla henüz çalışılmamış bir karar problemi olarak ele almaktadır. Önerilen metodoloji kripto para birimlerinin bir dizi karşılaştırma ile veri setinin tahmin hatasında olağanüstü performans sergileyen "Random Forest Regression" algoritmasının bulanık mantıkta karar biliminin çok kriterli karar verme dalında güçlü ve geniş ölçek sunan Pisagor bulanık setlerle kombinasyonunu içermektedir. Bu kavramsal çerçevede yatırım kararına etki edecek metrikleri önceliklendirirken bulanık mantık yöntemi kullanılmasının yanı sıra bu metriklerin güçlü sıralamasının TOPSIS algoritması ile elde edilmesi de sağlanmaktadır. Buna ek olarak stabil sıralamalar elde etmek için yapılan duyarlılık analizleri piyasalarda işlem gören kripto varlıkların yatırımcılar tarafındaki yüksek belirsizliği, rasyonel kılarak literatüre önemli projeksiyon sunacaktır. Elde edilen sonuçlar göstermektedir ki nispeten yeni olan veya analiz yapacak kadar geçmiş verisine ulaşılamayan bir kripto varlık için yatırım tercihi yapılması gerektiğinde bile kripto varlığa ait Borsa Rezervi metriği borsa akış verileri arasındaki en önemli ölçüttür.
  • Master Thesis
    Predicting house prices in Ankara using machine learning
    (2023) Ersoy, Cihan
    Geleneksel gayrimenkul değerleme süreci, bir değerleme uzmanının gayrimenkulü görmesi ve evin sahip olduğu değerlere göre içerisinde ev fiyatının da bulunduğu bir rapor oluşturması üzerine kuruludur. Ancak, bu yöntem zaman alıcı ve yüksek maliyetli olarak nitelendirilebilir. Makine öğrenmesi, bu süreci hızlandırmaya ve maliyetleri azaltmaya yardımcı olabilecek bir araçtır. Bu nedenle, bu tezde amacımız, makine öğrenimi tahminlerinin ev fiyatı değerlemesi sürecinde gerçekçi ve yeterli olup olmadığını araştırmaktır. Bu amaçla, çalışmada biri gayrimenkul web sitesinden toplanmış, diğeri ise değerleme raporlarından oluşturulmuş iki veri seti çeşitli makine öğrenimi yöntemleri kullanılarak karşılaştırılmaktadır. İnşa edilen tüm modellerin hiper parametreleri dikkatli bir şekilde seçilmiş, modellerin başarısı ise kök ortalama kare hatası ve netlik skoru kullanılarak değerlendirilmiştir. Bulgular, yaklaşımın varolan değerleme sürecini iyileştirme potansiyeline sahip olduğunu, ancak uygulanabilirliğini göstermek için daha öteye araştırma gerektiğini öneriyor.
  • Master Thesis
    Multi-label and single-label text classification using standard machine learning algorithms and pre-trained bert transformer
    (2023) Alfigi, Huda
    Doğal dil işleme (DDİ) araştırmaları, dijital belgelerin artan kullanılabilirliği ve bunlara çeşitli şekillerde erişme ihtiyacı nedeniyle son zamanlarda büyük ilgi görmüştür. Dijital metin verilerindeki patlama, çeşitli metin işleme ve sınıflandırma tekniklerinin geliştirilmesi ihtiyacını ortaya koymaktadır. DDİ'deki en temel ve hayati zorluk metin sınıflandırmasıdır. Bu amaçla, belgeleri ve metinleri içeriklerine göre önceden belirlenmiş kategorilere ayırmak için önerilmiştir ve o zamandan beri makine öğrenimini uygulamanın en popüler yöntemlerinden biri haline gelmiştir. Makine öğrenimi (MÖ) yaklaşımı, genel bir tümevarım yaklaşımının bir dizi sınıflandırılmış metin ve ilgi sınıflarının özelliklerini kullanarak özel olarak sınıflandırılmış bir metin oluşturmayı öğrendiği bir yöntemdir. Ayrıca, ilgili bilgilerin keşfedilmesi, fazla bilgi yükünü azaltırken bilgi alma verimliliğini artırmaya yardımcı olabilir. Geleneksel modeller, standart makine öğrenimi algoritmalarını kullanarak sınıflandırmadan önce iyi örnek nitelikleri elde etmek için genellikle yapay yöntemler gerektirir. Bu nedenle, özellik çıkarma yöntemin etkinliğini önemli ölçüde kısıtlar. Öte yandan, derin öğrenme, özellik temsillerinin çıktılara aktarılmasına yardımcı olan bir dizi doğrusal olmayan dönüşüm gerçekleştirerek özellik çıkarma işlemini model oluşturma yaklaşımına dahil ettiği için daha fazla ilgi gören tipik modellerden farklıdır. Ayrıca, derin öğrenme algoritmaları, uzmanların kuralları ve öznitelikleri tanımlama ihtiyacını ortadan kaldırır, bunun yerine metinler için otomatik olarak üst düzey anlamsal temsiller sağlar. Bu nedenle, bu çalışmalarda, BERT gibi önceden eğitilmiş modellerden elde edilen bağlamsal gömme yeteneklerini keşfediyoruz ve küçük bir İngilizce haber veri kümesinde uygulanacak bazı geleneksel makine öğrenimi yöntemlerine ek olarak, büyük bir İngilizce haber veri kümesindeki metin belgelerinin çok etiketli sınıflandırmasından yararlanıyoruz. Son olarak, BERT'in bir başka versiyonu olan Arapça BERT, Arapça bir otel incelemesi veri kümesinden çıkarılan yönlere yönelik duygu eğlimini araştırmaktadır.
  • Master Thesis
    Student academic performance prediction via artificial intelligence using machine learning algorithms
    (2021) Bastem, Hatice Nazlı
    Öğrencilerin okuldaki akademik başarıları hem öğrenciler hem öğretmenler hem de aileler tarafından önemsenmektedir. Bu nedenle performans tahmini, öğrencinin yaşamında önemli bir rol oynamaktadır. Performans tahmini ile başarısız öğrenciler başarılarını artırmaya yönlendirilebilir, çalışma programları oluşturulabilir, destekleyici ders kaynakları önerilebilir veya seçmeli dersler seçilebilir. Bu çalışmada öğrencinin akademik başarısı makine öğrenmesi yöntemleri ile tahmin edilebilmektedir. Bu çalışmada, Kaggle web sitesinden Portekiz'deki iki okuldan öğrencilerin bilgilerinden toplanan veri seti kullanılmıştır. Performans tahmini yapmak için üç farklı algoritma kullandık. Bunlar Karar Ağacı, Rastgele Orman ve Lojistik Regresyondur. Veri setinin %30'u test verisi olarak kullanılmıştır. Kalan %70'lik veri ise eğitim verisi olarak kullanılmıştır. Üç algoritma kullanılarak, karışıklık matrisi, doğruluk, geri çağırma, kesinlik ve auc değerleri elde edilir. Hangi algoritmanın hangi miktarda veri üzerinde daha başarılı olduğu sonucuna varılmıştır. Karar ağacı algoritması, 649 öğrenci verisi için maksimum derinlik 2 değeri ile en iyi doğruluk oranını verir. Rastgele orman algoritması, 649 öğrenci verisi ile en iyi doğruluğu verir. Lojistik regresyon algoritması, 395 öğrenci verisi ile en iyi doğruluğu verir.
  • Master Thesis
    Prediction of the football match results with using machine learning algorithms
    (2019) Çimen, Emre Altuğ
    In this thesis, prediction results of the Spanish La Liga football matches were obtained by using three machine learning algorithms. The dataset includes four season match statistics and the results of these matches. In addition, this thesis investigated which performance parameters of the football game statistics affected the game results. Feature selection techniques were used to reduce the number of attributes. Three different classifiers which are artificial neural network, support vector machine and k- nearest neighborhood were used for prediction. Support vector machine classifier reached better results than the other classifiers when applied for the chosen fifteen attributes in the dataset.