Çankaya GCRIS Standart veritabanının içerik oluşturulması ve kurulumu Research Ecosystems (https://www.researchecosystems.com) tarafından devam etmektedir. Bu süreçte gördüğünüz verilerde eksikler olabilir.
 

Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması

dc.contributor.authorTaşel, Faris Serdar
dc.contributor.authorSönmez, Arzu Burçak
dc.contributor.authorID55346tr_TR
dc.date.accessioned2024-03-07T08:47:33Z
dc.date.available2024-03-07T08:47:33Z
dc.date.issued2010
dc.departmentÇankaya Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümüen_US
dc.description.abstractOtomatik Konuşmacı Tanıma Sistemleri önemli bir çalışma alanı olmakla beraber başlıca üç farklı alanda yaygın olarak kullanılmaktadır. Bunlar, kimlik doğrulama, kimlik izleme ve adli uygulamalardır. Otomatik konuşmacı tanıma uygulamaları, konuşma esnasında çıkardığımız seslerden gerekli bilgilerin çıkartılması esasına dayanmaktadır. Geliştirilen uygulamalar, çıkarılan bu bilgiler doğrultusunda, insanları seslerinden tanımaları için eğitilebilirler. Otomatik Konuşmacı Tanıma Sistemlerinde ilk basamak öznitelik çıkarma işlemidir. Bu işlem için MFCC (Mel-frequency Cepstral Coefficients) tabanlı yaklaşımlar yaygın olarak kullanılır. İkinci basamak ise öznitelik sınıflandırma işlemidir. Her konuşmacı bir sınıfa karşılık gelmekte ve bulunduğu sınıfın özelliklerini belirlemektedir. VQ (Vector Quantization - Vektörel Nicemleme) ve GMM (Gaussian Mixture Models - Gaussian Karışım Modelleri), sınıflandırma işleminde kullanılan tekniklerden en yaygın olanlarıdır. Bahsettiğimiz bu işlemler sistemin eğitim safhasında kullanılırlar. Test safhasında ise, herhangi bir kişiden gelen ses bilgisinin eğitim safhasında oluşturulan sınıflardan hangisine ait olabileceğine karar verilir. Kapalı küme sistemlerde, sistem sadece daha önce eğitilmiş konuşmacı sınıflarını ayırdetmekten sorumludur. Bu çalışma, metinden bağımsız, kapalı küme konuşmacı tanıma sistemi geliştirmede etkili olan bu iki tekniği performans açısından karşılaştırmak amacıyla yapılmıştır. Elde edilen sonuçlarda GMM tekniğinin, VQ tekniğinden daha başarılı olduğu gözlemlenmiştir.en_US
dc.identifier.citationTaşel, Faris Serdar; Sönmez, Arzu Burçak. "Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması", 3. Mühendislik ve Teknoloji Sempozyumu, pp. 1-8, 2010.en_US
dc.identifier.endpage8en_US
dc.identifier.startpage1en_US
dc.identifier.urihttp://hdl.handle.net/20.500.12416/7519
dc.language.isotren_US
dc.relation.ispartof3. Mühendislik ve Teknoloji Sempozyumuen_US
dc.rightsinfo:eu-repo/semantics/closedAccessen_US
dc.subjectMFCCen_US
dc.subjectKonuşmacı Tanımaen_US
dc.subjectVektörel Nicemlemeen_US
dc.subjectGaussian Karışım Modelien_US
dc.titleMetinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırmasıtr_TR
dc.titleMetinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırmasıen_US
dc.typeConference Objecten_US
dspace.entity.typePublication

Files

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: