Yazılım Mühendisliği Bölümü Yayın Koleksiyonu

Permanent URI for this collectionhttps://hdl.handle.net/20.500.12416/2147

Browse

Search Results

Now showing 1 - 5 of 5
  • Article
    Otomatik Konuşma Tanımaya Genel Bakış, Yaklaşımlar ve Zorluklar: Türkçe Konuşma Tanımanın Gelecekteki Yolu
    (2019) Oyucu, Saadin; Polat, Huseyin; Sever, Hayri
    İnsanlar arasındaki en önemli iletişim yöntemi olan konuşmanın, bilgisayarlar tarafından tanınması önemli bir çalışma alanıdır. Bu araştırma alanında farklı diller temel alınarak birçok çalışma gerçekleştirilmiştir. Literatürdeki çalışmalar konuşma tanıma teknolojilerinin başarımının artmasında önemli rol oynamıştır. Bu çalışmada konuşma tanıma ile ilgili bir literatür taraması yapılmış ve detaylı olarak sunulmuştur. Ayrıca farklı dillerde bu araştırma alanında kaydedilen ilerlemeler tartışılmıştır. Konuşma tanıma sistemlerinde kullanılan veri setleri, özellik çıkarma yaklaşımları, konuşma tanıma yöntemleri ve performans değerlendirme ölçütleri incelenerek konuşma tanımanın gelişimi ve bu alandaki zorluklara odaklanılmıştır. Konuşma tanıma alanında son zamanlarda yapılan çalışmaların olumsuz koşullara (çevre gürültüsü, konuşmacıda ve dilde değişkenlik) karşı çok daha güçlü yöntemler geliştirmeye odaklandığı izlenmiştir. Bu nedenle araştırma alanı olarak genişleyen olumsuz koşullardaki konuşma tanıma ile ilgili yakın geçmişteki gelişmelere yönelik genel bir bakış açısı sunulmuştur. Böylelikle olumsuz koşullar altında gerçekleştirilen konuşma tanımadaki tıkanıklık ve zorlukları aşabilmek için kullanılabilecek yöntemleri seçmede yardımcı olunması amaçlanmıştır. Ayrıca Türkçe konuşma tanımada kullanılan ve iyi bilinen yöntemler karşılaştırılmıştır. Türkçe konuşma tanımanın zorluğu ve bu zorlukların üstesinden gelebilmek için kullanılabilecek uygun yöntemler irdelenmiştir. Buna bağlı olarak Türkçe konuşma tanımanın gelecekteki rotasına ilişkin bir değerlendirme ortaya konulmuştur.
  • Article
    Otomatik Konuşma Tanıma Sistemlerinde Kullanılan Gerçek Metin Verisinde Biçimbilimsel-Sözdizimsel Hataların Tespiti ve Düzeltmesi
    (2019) Polat, Hüseyin; Sever, Hayri; Oyucu, Saadin; Tekbaş, Şükran
    Türkçe Otomatik Konuşma Tanıma (ASR: Automatic Speech Recognition) sistemlerinde kullanılan akustik model gürbüz bir dil modeli ile desteklenmediği durumlarda kelime hata oranı yüksek çıkmaktadır. İyi dizayn edilmiş bir dil modeli ile akustik modelin birlikte ASR’de kullanılması kelime hata oranını düşürmektedir. ASR için gerekli dil modelinin eğitiminde düz metin verisi kullanılmaktadır. Kullanılan metin verisinin doğruluğu ASR modellerinin eğitimi için oldukça önemlidir. Bu çalışmada, doğal dil işlemeye dayalı bir yöntem kullanılarak Türkçe ASR sisteminin eğitilmesinde kullanılan metin verisi içerisindeki yazım hatalarının tespiti ve düzeltilmesi gerçekleştirilmiştir. Öncelikle metin verisi içerisinde dil bilgisel olarak yanlış yazılmış olan kelimeler bulunmuştur. Bir kelimedeki karakter eksikliği, karakter fazlalığı, karakterlerin yer değiştirmesi veya karakteri yanlış yazılmış olan kelimeler hatalı olarak kabul edilmiştir. Metin verisi içerisinde hatalı olarak kabul edilen kelimeler morfolojik analiz ile tespit edilmiştir. Yanlış kelimelerin yerine atanacak olan kelimeler belirlenmiştir. Yanlış yazılmış olan kelimeler doğru kelimeler ile değiştirilmiştir. Gerçekleştirilen çalışma hatalı kelimeleri tespit etme ve doğru kelimeler ile yer değiştirme işleminde %93 oranında başarı göstermiştir.
  • Article
    Sessizliğin Kaldırılması ve Konuşmanın Parçalara Ayrılması İşleminin Türkçe Otomatik Konuşma Tanıma Üzerindeki Etkisi
    (2020) Sever, Hayri; Polat, Huseyin; Oyucu, Saadin
    Otomatik Konuşma Tanıma sistemleri temel olarak akustik bilgiden faydalanılarak geliştirilmektedir. Akustikbilgiden fonem bilgisinin elde edilmesi için eşleştirilmiş konuşma ve metin verileri kullanılmaktadır. Bu verilerile eğitilen akustik modeller gerçek hayattaki bütün akustik bilgiyi modelleyememektedir. Bu nedenle belirli önişlemlerin yapılması ve otomatik konuşma tanıma sistemlerinin başarımını düşürecek akustik bilgilerin ortadankaldırılması gerekmektedir. Bu çalışmada konuşma içerisinde geçen sessizliklerin kaldırılması için bir yöntemönerilmiştir. Önerilen yöntemin amacı sessizlik bilgisinin ortadan kaldırılması ve akustik bilgide uzunbağımlılıklar sağlayan konuşmaların parçalara ayrılmasıdır. Geliştirilen yöntemin sonunda elde edilen sessizlikiçermeyen ve parçalara ayrılan konuşma bilgisi bir Türkçe Otomatik Konuşma Tanıma sistemine girdi olarakverilmiştir. Otomatik Konuşma Tanıma sisteminin çıkışında sisteme giriş olarak verilen konuşma parçalarınakarşılık gelen metinler birleştirilerek sunulmuştur. Gerçekleştirilen deneylerde sessizliğin kaldırılması vekonuşmanın parçalara ayrılması işleminin Otomatik Konuşma Tanıma sistemlerinin başarımını artırdığıgörülmüştür.
  • Article
    Citation - WoS: 7
    Citation - Scopus: 13
    A Concept-Based Sentiment Analysis Approach for Arabic
    (Zarka Private Univ, 2020) Sever, Hayri; Nasser, Ahmed
    Concept-Based Sentiment Analysis (CBSA) methods are considered to be more advanced and more accurate when it compared to ordinary Sentiment Analysis methods, because it has the ability of detecting the emotions that conveyed by multi-word expressions concepts in language. This paper presented a CBSA system for Arabic language which utilizes both of machine learning approaches and concept-based sentiment lexicon. For extracting concepts from Arabic, a rule-based concept extraction algorithm called semantic parser is proposed. Different types of feature extraction and representation techniques are experimented among the building prosses of the sentiment analysis model for the presented Arabic CBSA system. A comprehensive and comparative experiments using different types of classification methods and classifier fusion models, together with different combinations of our proposed feature sets, are used to evaluate and test the presented CBSA system. The experiment results showed that the best performance for the sentiment analysis model is achieved by combined Support Vector Machine-Logistic Regression (SVM-LR) model where it obtained a F-score value of 93.23% using the Concept-Based-Features + Lexicon-Based-Features + Word2vec-Features (CBF + LEX+ W2V) features combinations.
  • Article
    Citation - WoS: 1
    Citation - Scopus: 3
    Identifying Criminal Organizations From Their Social Network Structures
    (Tubitak Scientific & Technological Research Council Turkey, 2019) Genc, Burkay; Sever, Hayri; Cinar, Muhammet Serkan
    Identification of criminal structures within very large social networks is an essential security feat. By identifying such structures, it may be possible to track, neutralize, and terminate the corresponding criminal organizations before they act. We evaluate the effectiveness of three different methods for classifying an unknown network as terrorist, cocaine, or noncriminal. We consider three methods for the identification of network types: evaluating common social network analysis metrics, modeling with a decision tree, and network motif frequency analysis. The empirical results show that these three methods can provide significant improvements in distinguishing all three network types. We show that these methods are viable enough to be used as supporting evidence by security forces in their fight against criminal organizations operating on social networks.