[90445] A general approach for meeting summarization from speech to extractive summarization

Küçük Resim Yok

Tarih

2022

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

İstanbul Ticaret Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Developing technologies and techniques have increased amount of information and easier access to information resources. However, due to the ever-growing amount of information sources, it has become difficult to access the needed information in a limited time. As a result of this situation, the need for summary information has become important. In this research, it is focused on creating inferential written summaries of communications that occur in oral environments such as meetings, lectures, conferences. However, since this type of problem requires conversion from audio to text, it also includes many issues such as the human factor, sound recording environments, and language-specific problems. In this study, it is aimed to take the audio recordings of the meetings, especially the IT sector, to process and summarize. Spontaneous conversations were converted into audio recordings and the obtained texts were summarized using extractive summarization techniques. The motivation of the study is to catch the important points that may escape the attention of the individuals at the meeting and to summarize the main agenda items for the personnel who could not attend the meeting. The experimentally generated dataset (converted from audio recordings to text) was summarized by 3 different person and compared with the summaries obtained from the developed inferential summative model. The results obtained are remarkable and it is seen that approximately 71% success has been achieved.Keywords : Automatic extractive summarization, meeting summarization, speech recognition, speech summarization, speech to text, tf-idf.ÖZETGelişen teknolojiler ve teknikler bilgi kaynaklarının artmasını ve bilgi kaynaklarına erişimin kolaylaşmasını sağlamıştır. Bununla birlikte artan bilgi kaynaklarının sayısından ötürü, ihtiyaç duyulan bilgiye sınırlı zamanda erişim zorlaşmıştır. Gelinen bu durumun sonucu olarak, özet bilgiye duyulan ihtiyaç önemli bir hale gelmiştir. Bu çalışmada toplantı, ders anlatımları, konferanslar gibi sözlü ortamlarda oluşan iletişimlerin çıkarımsal yazılı özetlerinin oluşturulması üzerine durulmuştur. Fakat bu problem türü özellikle sesten metine dönüşüm gerektirdiği için, insan faktörü, ses kayıt ortamları, konuşulan dile özgü sorunlar gibi birçok konuyu da probleme dahil etmektedir. Bu çalışmada IT sektörü başta olmak üzere yapılan toplantıların ses kayıtlarının alınarak işlenip özetlenmesi amaçlanmıştır. Anlık konuşmalar ses kaydına dönüştürülmüş ve elde edilen metinler çıkarımsal özetleme teknikleri kullanılarak özetlenmiştir. Çalışmanın motivasyonunu, toplantıda bulunan bireylerin dikkatlerinden kaçabilecek önemli noktaları yakalamak ve toplantıya katılamayan personele ana gündem maddelerini özetlemek oluşturmaktadır. Deneysel oluşturulan veri seti (ses kayıtlarından metine dönüştürülmüş) 3 farklı kişi tarafından özetlenmiş, geliştirilen çıkarımsal özetleyici modelden elde edilen özetlerle kıyaslanmıştır. Elde edilen sonuçlar kayda değerdir ve yaklaşık %71 oranında başarının yakalandığı görülmektedir.Anahtar Kelimeler: Konuşmadan metine, konuşma tanıma, konuşma özetleme, otomatik çıkarımsal özetleme, tf-idf, toplantı özetleme.

Açıklama

Tez (Yüksek Lisans) -- İstanbul Ticaret Üniversitesi -- Kaynakça var.
TK 7895.S65/A33

Anahtar Kelimeler

Automatic speech recognition, Otomatik konuşma tanıma, Teknoloji ve Mühendislik

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye