[90445] A general approach for meeting summarization from speech to extractive summarization

dc.contributor.advisorTuran, Metin
dc.contributor.authorAkara, Neslihan
dc.date.accessioned2023-04-07T15:24:33Z
dc.date.available2023-04-07T15:24:33Z
dc.date.issued2022
dc.departmentEnstitüler, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalıen_US
dc.descriptionTez (Yüksek Lisans) -- İstanbul Ticaret Üniversitesi -- Kaynakça var.en_US
dc.descriptionTK 7895.S65/A33en_US
dc.description.abstractDeveloping technologies and techniques have increased amount of information and easier access to information resources. However, due to the ever-growing amount of information sources, it has become difficult to access the needed information in a limited time. As a result of this situation, the need for summary information has become important. In this research, it is focused on creating inferential written summaries of communications that occur in oral environments such as meetings, lectures, conferences. However, since this type of problem requires conversion from audio to text, it also includes many issues such as the human factor, sound recording environments, and language-specific problems. In this study, it is aimed to take the audio recordings of the meetings, especially the IT sector, to process and summarize. Spontaneous conversations were converted into audio recordings and the obtained texts were summarized using extractive summarization techniques. The motivation of the study is to catch the important points that may escape the attention of the individuals at the meeting and to summarize the main agenda items for the personnel who could not attend the meeting. The experimentally generated dataset (converted from audio recordings to text) was summarized by 3 different person and compared with the summaries obtained from the developed inferential summative model. The results obtained are remarkable and it is seen that approximately 71% success has been achieved.Keywords : Automatic extractive summarization, meeting summarization, speech recognition, speech summarization, speech to text, tf-idf.ÖZETGelişen teknolojiler ve teknikler bilgi kaynaklarının artmasını ve bilgi kaynaklarına erişimin kolaylaşmasını sağlamıştır. Bununla birlikte artan bilgi kaynaklarının sayısından ötürü, ihtiyaç duyulan bilgiye sınırlı zamanda erişim zorlaşmıştır. Gelinen bu durumun sonucu olarak, özet bilgiye duyulan ihtiyaç önemli bir hale gelmiştir. Bu çalışmada toplantı, ders anlatımları, konferanslar gibi sözlü ortamlarda oluşan iletişimlerin çıkarımsal yazılı özetlerinin oluşturulması üzerine durulmuştur. Fakat bu problem türü özellikle sesten metine dönüşüm gerektirdiği için, insan faktörü, ses kayıt ortamları, konuşulan dile özgü sorunlar gibi birçok konuyu da probleme dahil etmektedir. Bu çalışmada IT sektörü başta olmak üzere yapılan toplantıların ses kayıtlarının alınarak işlenip özetlenmesi amaçlanmıştır. Anlık konuşmalar ses kaydına dönüştürülmüş ve elde edilen metinler çıkarımsal özetleme teknikleri kullanılarak özetlenmiştir. Çalışmanın motivasyonunu, toplantıda bulunan bireylerin dikkatlerinden kaçabilecek önemli noktaları yakalamak ve toplantıya katılamayan personele ana gündem maddelerini özetlemek oluşturmaktadır. Deneysel oluşturulan veri seti (ses kayıtlarından metine dönüştürülmüş) 3 farklı kişi tarafından özetlenmiş, geliştirilen çıkarımsal özetleyici modelden elde edilen özetlerle kıyaslanmıştır. Elde edilen sonuçlar kayda değerdir ve yaklaşık %71 oranında başarının yakalandığı görülmektedir.Anahtar Kelimeler: Konuşmadan metine, konuşma tanıma, konuşma özetleme, otomatik çıkarımsal özetleme, tf-idf, toplantı özetleme.en_US
dc.identifier.endpage56en_US
dc.identifier.startpage1en_US
dc.identifier.urihttps://katalog.ticaret.edu.tr/e-kaynak/tez/90445.pdf
dc.identifier.urihttps://hdl.handle.net/11467/6456
dc.identifier.yoktezid759635en_US
dc.institutionauthorAkara, Neslihan
dc.language.isoenen_US
dc.publisherİstanbul Ticaret Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectAutomatic speech recognitionen_US
dc.subjectOtomatik konuşma tanımaen_US
dc.subjectTeknoloji ve Mühendisliken_US
dc.title[90445] A general approach for meeting summarization from speech to extractive summarizationen_US
dc.typeMaster Thesisen_US

Dosyalar