Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması

Taşel, Faris Serdar; Sönmez, Arzu Burçak

Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması

dc.contributor.author	Taşel, Faris Serdar
dc.contributor.author	Sönmez, Arzu Burçak
dc.date.accessioned	2024-03-07T08:47:33Z
dc.date.available	2024-03-07T08:47:33Z
dc.date.issued	2010
dc.description.abstract	Otomatik Konuşmacı Tanıma Sistemleri önemli bir çalışma alanı olmakla beraber başlıca üç farklı alanda yaygın olarak kullanılmaktadır. Bunlar, kimlik doğrulama, kimlik izleme ve adli uygulamalardır. Otomatik konuşmacı tanıma uygulamaları, konuşma esnasında çıkardığımız seslerden gerekli bilgilerin çıkartılması esasına dayanmaktadır. Geliştirilen uygulamalar, çıkarılan bu bilgiler doğrultusunda, insanları seslerinden tanımaları için eğitilebilirler. Otomatik Konuşmacı Tanıma Sistemlerinde ilk basamak öznitelik çıkarma işlemidir. Bu işlem için MFCC (Mel-frequency Cepstral Coefficients) tabanlı yaklaşımlar yaygın olarak kullanılır. İkinci basamak ise öznitelik sınıflandırma işlemidir. Her konuşmacı bir sınıfa karşılık gelmekte ve bulunduğu sınıfın özelliklerini belirlemektedir. VQ (Vector Quantization - Vektörel Nicemleme) ve GMM (Gaussian Mixture Models - Gaussian Karışım Modelleri), sınıflandırma işleminde kullanılan tekniklerden en yaygın olanlarıdır. Bahsettiğimiz bu işlemler sistemin eğitim safhasında kullanılırlar. Test safhasında ise, herhangi bir kişiden gelen ses bilgisinin eğitim safhasında oluşturulan sınıflardan hangisine ait olabileceğine karar verilir. Kapalı küme sistemlerde, sistem sadece daha önce eğitilmiş konuşmacı sınıflarını ayırdetmekten sorumludur. Bu çalışma, metinden bağımsız, kapalı küme konuşmacı tanıma sistemi geliştirmede etkili olan bu iki tekniği performans açısından karşılaştırmak amacıyla yapılmıştır. Elde edilen sonuçlarda GMM tekniğinin, VQ tekniğinden daha başarılı olduğu gözlemlenmiştir.	en_US
dc.identifier.citation	Taşel, Faris Serdar; Sönmez, Arzu Burçak. "Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması", 3. Mühendislik ve Teknoloji Sempozyumu, pp. 1-8, 2010.	en_US
dc.identifier.uri	https://hdl.handle.net/20.500.12416/7519
dc.language.iso	tr	en_US
dc.relation.ispartof	3. Mühendislik ve Teknoloji Sempozyumu	en_US
dc.rights	info:eu-repo/semantics/closedAccess	en_US
dc.subject	MFCC	en_US
dc.subject	Konuşmacı Tanıma	en_US
dc.subject	Vektörel Nicemleme	en_US
dc.subject	Gaussian Karışım Modeli	en_US
dc.title	Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması	tr_TR
dc.title	Metinden Bağımsız Otomatik Konuşmacı Tanıma Sistemleri ve Performans Karşılaştırması	en_US
dc.type	Conference Object	en_US
dspace.entity.type	Publication
gdc.author.yokid	55346
gdc.coar.access	metadata only access
gdc.coar.type	text::conference output
gdc.description.department	Çankaya Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü	en_US
gdc.description.endpage	8	en_US
gdc.description.startpage	1	en_US
gdc.virtual.author	Taşel, Faris Serdar
gdc.virtual.author	Sönmez, Arzu Burçak
relation.isAuthorOfPublication	918b648d-075a-417d-b9d4-d8abd950b0e7
relation.isAuthorOfPublication	89b5f99e-977e-4528-815c-0765aed06a83
relation.isAuthorOfPublication.latestForDiscovery	918b648d-075a-417d-b9d4-d8abd950b0e7
relation.isOrgUnitOfPublication	12489df3-847d-4936-8339-f3d38607992f
relation.isOrgUnitOfPublication	43797d4e-4177-4b74-bd9b-38623b8aeefa
relation.isOrgUnitOfPublication	0b9123e4-4136-493b-9ffd-be856af2cdb1
relation.isOrgUnitOfPublication.latestForDiscovery	12489df3-847d-4936-8339-f3d38607992f

Files

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

Bilgisayar Mühendisliği Bölümü Yayın Koleksiyonu