Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması
No Thumbnail Available
Date
2010
Authors
Taşel, Faris Serdar
Sönmez, Arzu Burçak
Journal Title
Journal ISSN
Volume Title
Publisher
Open Access Color
OpenAIRE Downloads
OpenAIRE Views
Abstract
Otomatik Konuşmacı Tanıma Sistemleri önemli bir çalışma alanı olmakla beraber başlıca üç farklı alanda
yaygın olarak kullanılmaktadır. Bunlar, kimlik doğrulama, kimlik izleme ve adli uygulamalardır. Otomatik
konuşmacı tanıma uygulamaları, konuşma esnasında çıkardığımız seslerden gerekli bilgilerin çıkartılması
esasına dayanmaktadır. Geliştirilen uygulamalar, çıkarılan bu bilgiler doğrultusunda, insanları seslerinden
tanımaları için eğitilebilirler. Otomatik Konuşmacı Tanıma Sistemlerinde ilk basamak öznitelik çıkarma
işlemidir. Bu işlem için MFCC (Mel-frequency Cepstral Coefficients) tabanlı yaklaşımlar yaygın olarak
kullanılır. İkinci basamak ise öznitelik sınıflandırma işlemidir. Her konuşmacı bir sınıfa karşılık gelmekte
ve bulunduğu sınıfın özelliklerini belirlemektedir. VQ (Vector Quantization - Vektörel Nicemleme) ve
GMM (Gaussian Mixture Models - Gaussian Karışım Modelleri), sınıflandırma işleminde kullanılan
tekniklerden en yaygın olanlarıdır. Bahsettiğimiz bu işlemler sistemin eğitim safhasında kullanılırlar. Test
safhasında ise, herhangi bir kişiden gelen ses bilgisinin eğitim safhasında oluşturulan sınıflardan hangisine
ait olabileceğine karar verilir. Kapalı küme sistemlerde, sistem sadece daha önce eğitilmiş konuşmacı
sınıflarını ayırdetmekten sorumludur. Bu çalışma, metinden bağımsız, kapalı küme konuşmacı tanıma
sistemi geliştirmede etkili olan bu iki tekniği performans açısından karşılaştırmak amacıyla yapılmıştır.
Elde edilen sonuçlarda GMM tekniğinin, VQ tekniğinden daha başarılı olduğu gözlemlenmiştir.
Description
Keywords
MFCC, Konuşmacı Tanıma, Vektörel Nicemleme, Gaussian Karışım Modeli
Turkish CoHE Thesis Center URL
Fields of Science
Citation
Taşel, Faris Serdar; Sönmez, Arzu Burçak. "Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması", 3. Mühendislik ve Teknoloji Sempozyumu, pp. 1-8, 2010.
WoS Q
Scopus Q
Source
3. Mühendislik ve Teknoloji Sempozyumu
Volume
Issue
Start Page
1
End Page
8