Language independent multi document summarization using latent semantic indexing/clustering techniques
Date
2009
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Open Access Color
OpenAIRE Downloads
OpenAIRE Views
Abstract
This thesis discusses our research on language independent multi-document summarization. We used latent semantic indexing and centroid based clustering methods in our summarization process. Firstly, our algorithm uses latent semantic analysis (LSA) to extract key-terms. Secondly, important sentences holding these key-terms are extracted by applying latent semantic indexing (LSI) and centroidbased clustering methods. Our experiments show that LSA improve key-term extraction. Also, our summarization system has achieved good results, compared to some other multi-document summarization systems.
Bu tez dilden bağımsız olarak çoklu dokümanlardan özet çıkarılması üzerine yaptığımız araştırmayı içermektedir. Özetleme işlemimizde saklı anlamsal indeksleme ve sanal merkeze dayalı kümeleme yöntemlerinden yararlandık. Sistemimizde ilk olarak saklı anlamsal analiz yöntemi kullanılarak anahtar terimler çıkarılır. Daha sonra anahtar terimleri içeren özet cümleler saklı anlam indeksleme ve sanal merkeze dayalı kümeleme yöntemleri kullanılarak çıkarılır. Yaptığımız deneyler saklı anlamsal analiz yönteminin anahtar kelimelerin çıkarılmasında başarılı olduğunu ortaya koymaktadır. Ayrıca, özet çıkarma sistemimiz diğer çoklu doküman özetleme sistemleri ile karşılaştırılınca iyi sonuçlar elde etmiştir.
Bu tez dilden bağımsız olarak çoklu dokümanlardan özet çıkarılması üzerine yaptığımız araştırmayı içermektedir. Özetleme işlemimizde saklı anlamsal indeksleme ve sanal merkeze dayalı kümeleme yöntemlerinden yararlandık. Sistemimizde ilk olarak saklı anlamsal analiz yöntemi kullanılarak anahtar terimler çıkarılır. Daha sonra anahtar terimleri içeren özet cümleler saklı anlam indeksleme ve sanal merkeze dayalı kümeleme yöntemleri kullanılarak çıkarılır. Yaptığımız deneyler saklı anlamsal analiz yönteminin anahtar kelimelerin çıkarılmasında başarılı olduğunu ortaya koymaktadır. Ayrıca, özet çıkarma sistemimiz diğer çoklu doküman özetleme sistemleri ile karşılaştırılınca iyi sonuçlar elde etmiştir.
Description
Keywords
Language Independent Multi-document Summarization, Latent Semantic Analysis, Latent Semantic Indexing, Centroid Based Summarization, Dilden Bağımsız Olarak Çoklu Dokümanların Özetlenmesi, Saklı Anlamsal Analiz, Saklı Anlam İndeksleme, Sanal Merkeze Dayalı Özetleme
Turkish CoHE Thesis Center URL
Fields of Science
Citation
ALİM, S. (2009). Language independent multi document summarization using latent semantic indexing/clustering techniques. Yayımlanmamış yüksek lisans tezi. Ankara: Çankaya Üniversitesi Fen Bilimleri Enstitüsü.
WoS Q
Scopus Q
Source
Volume
Issue
Start Page
End Page
Collections
Google Scholar™
Sustainable Development Goals
12
RESPONSIBLE CONSUMPTION AND PRODUCTION
