Deep learning methods with pre-trained word embeddings and pre-trained transformers for extreme multi label text classification

dc.contributor.authorErciyes, Necdet Eren
dc.contributor.departmentÇankaya Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Bölümütr_TR
dc.date.accessioned2023-07-19T13:21:54Z
dc.date.available2023-07-19T13:21:54Z
dc.date.issued2022
dc.description.abstractSon yıllarda, çevrimiçi metin belgelerinde dikkat çekici sayısal bir artış olduğu görülmektedir. Bu artış, metni birçok farklı alanda sınıflandırmak için oldukça gelişmiş makine öğrenimi yöntemlerinin oluşturulmasını gerektiriyor. Bu makine öğrenimi yöntemlerinin etkinliği, yapılandırılmamış verilerin karmaşık doğasını ve var olan özelliklerin ilişkilerini anlamak için model kapasitesine bağlıdır. Metin sınıflandırma problemlerini çözmek için uzun süredir SVM, kNN, Rocchio sınıflandırması gibi birçok farklı makine öğrenmesi yöntemi önerilmiştir. Bu sığ öğrenme yöntemleri, pek çok farklı alanda şüphesiz başarıya ulaşmıştır. Metin gibi büyük ve yapılandırılmamış veriler için, herhangi bir özellik çıkarma yöntemi kullanmadan giriş verilerinden temsilleri ve özellikleri öğrenebilen derin öğrenme yöntemleri önemlil çözümlerden biri olarak gösterilmiştir. Bu çalışmada, basit RNN, CNN modellerinden önceden eğitilmiş transformer modellerine kadar çok etiketli metin sınıflandırması için son önerilen derin öğrenme yöntemlerinin doğruluğunu araştırıyoruz. Bu yöntemlerin performanslarını çok etiketli değerlendirme ölçütlerini hesaplayarak değerlendirdik ve sonuçları önceki çalışmalarla karşılaştırdık.tr_TR
dc.description.abstractIn recent years, there appears to be a remarkable increase int the number of textual documents online. This increase requires the creation of highly improved machine learning methods to classify text in many different domains. The effectiveness of these machine learning methods depends on the model capacity to understand the complex nature of the unstructured data and the relations of the features that exist. Many different machine learning methods were proposed for a long time to solve text classification problems, such as SVM, kNN and Rocchio classification. These shallow learning methods have achieved doubtless success in many different domains. For big and unstructured data like text, deep learning methods which can learn representations and features from the input data without using any feature extraction methods have shown to be one of the major solutions. In this study, we explore the accuracy of recent recommended deep learning methods for multi-label text classification starting with simple RNN, CNN models to pre-trained transformer models. We evaluated these methods' performances by computing multi-label evaluation metrics and compared the results with the previous studies.tr_TR
dc.identifier.citationErciyes, Necdet Eren (2022). Deep learning methods with pre-trained word embeddings and pre-trained transformers for extreme multi label text classification / Çoklu etiket sınıflandırması için önceden eğitilmiş kelime vektörleri ve önceden eğitilmiş transformer modelleri ile derin öğrenme yöntemleri. Yayımlanmış yüksek lisans tezi. Ankara: Çankaya Üniversitesi Fen Bilimleri Enstitüsü.tr_TR
dc.identifier.endpage47tr_TR
dc.identifier.startpage1tr_TR
dc.identifier.urihttp://hdl.handle.net/20.500.12416/6543
dc.language.isoengtr_TR
dc.rightsinfo:eu-repo/semantics/openAccesstr_TR
dc.subjectÇok Etiketli Metin Sınıflandırmatr_TR
dc.subjectMakine Öğrenmesitr_TR
dc.subjectDerin Öğrenmetr_TR
dc.subjectKelime Yerleştirmetr_TR
dc.subjectTransformerlartr_TR
dc.subjectMulti-Label Text Classificationtr_TR
dc.subjectMachine Learningtr_TR
dc.subjectDeep Learningtr_TR
dc.subjectWord Embeddingtr_TR
dc.subjectTransformerstr_TR
dc.titleDeep learning methods with pre-trained word embeddings and pre-trained transformers for extreme multi label text classificationtr_TR
dc.title.alternativeÇoklu etiket sınıflandırması için önceden eğitilmiş kelime vektörleri ve önceden eğitilmiş transformer modelleri ile derin öğrenme yöntemleritr_TR
dc.typemasterThesistr_TR

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
thesis.pdf
Size:
1.06 MB
Format:
Adobe Portable Document Format
Description:
Yazar sürümü

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: