Türkçe konuşma tanıma için kütüphane oluşturma çalışması ve konuşma tanıma uygulaması

dc.contributor.advisorKasapbaşı, Mustafa Cem
dc.contributor.authorKestepe, Sedat
dc.date.accessioned2024-10-10T18:25:22Z
dc.date.available2024-10-10T18:25:22Z
dc.date.issued2022
dc.departmentEnstitüler, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalıen_US
dc.descriptionFen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalıen_US
dc.description.abstractGünümüz dünyasında günlük yaşamla entegre olan Otomatik Konuşma Tanıma (ASR) sistemleri oldukça yaygındır. Ancak, Konuşma Tanıma'daki ilerlemelerin hızı tüm diller için aynı değildir. ASR, İngilizce dili için bir gereklilik olsa da, Türkçe gibi diğer diller için daha fazla gelişme bekleyen bir alandır. Sondan eklemeli bir dil olduğu için diğerlerine göre türetilebilecek kelime sayısında kesin bir sınırlama yoktur. Ayrıca Türkçe mevcut konuşma kütüphanelerinin sayısında da bir eksiklik söz konusudur. Bu çalışmada Türkçe Otomatik Konuşma Tanıma uygulamalarının önündeki temel engellerden biri olan Türkçe konuşma kütüphanesine duyulan ihtiyaca katkı sağlanması amaçlanmıştır. Türkçe içerik sağlayıcılar tarafından sıklıkla kullanılan bir internet platformundan videolar kullanılarak yeni bir Türkçe konuşma kütüphanesi oluşturulması için bir çalışma yapılmıştır. Ardından, forced alignment ve speech detection teknikleri kullanılarak konuşma kütüphanesinin kalitesi artırıldı. Ortaya çıkan konuşma kütüphanesi en gelişmiş Konuşma Tanıma teknikleri ile test edildi ve sonuç başarım oranları karşılaştırıldı. Çalışmanın sonuçları umut verici görünmektedir ve daha sonraki çalışmalarda kullanılacaklar.en_US
dc.description.abstractIn today's world, Automatic Speech Recognition (ASR) systems which are integrated with daily life are quite common. However, the speed of advancements in Speech Recognition is not the same for all languages. While ASR is a requirement for the English language, it is still an area that expects more advancements for other languages like Turkish. Since it is an agglutinative language, compared to others, there are no certain limits on the number of words that can be derived. Moreover, there is a lacking of enough Turkish corpus as well. In this study, it is aimed to contribute to the need for Turkish speech corpus which is one of the main obstacles to Turkish Automatic Speech Recognition applications. A study is carried out for the construction of a new Turkish speech corpus using videos from an internet platform that is often used by Turkish content providers. Then the quality of the corpus was increased using forced alignment and speech detection techniques. The resulting corpus was tested and compared against the state-of-art Speech recognition techniques. The results of the study look promising and they are going to be used in further studies.en_US
dc.identifier.endpage30en_US
dc.identifier.startpage1en_US
dc.identifier.urihttps://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=r4I1HnmXxFQovUpyAyUmxOSQyd-mUa66cae5PdH7EVNPbYFaPSqIBJmpIeO4I-nS
dc.identifier.urihttps://hdl.handle.net/11467/7569
dc.identifier.yoktezid784684en_US
dc.language.isotren_US
dc.publisherİstanbul Ticaret Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.snmz2024_Tezen_US
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolen_US
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleTürkçe konuşma tanıma için kütüphane oluşturma çalışması ve konuşma tanıma uygulamasıen_US
dc.title.alternativeA corpus construction study for Turkish automatic speech recognitionen_US
dc.typeMaster Thesisen_US

Dosyalar