Classification of news according to age groups using NLP

Yükleniyor...
Küçük Resim

Tarih

2020

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Gazi Üniversitesi

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Bu çalışmada, Doğal Dil İşleme kullanılarak elektronik ortamlardaki haberlerin yaş gruplarına göre etiketlenmesi amaçlanmıştır. Haber sitelerinden toplanan haber veri setinin eğitim amaçlı seçilmiş olanları, NLP Zemberek Kütüphanesi kullanılarak Python dili ile işlenmiş, Havighurst’ün “Gelişim Kuramı” nın güncel duruma adapte edilmiş Çocukluk, Ergenlik ve Yetişkinlik yaş gruplarını temsil edebilecek kelime sözlüğü oluşturulmuştur (her kelimenin hangi yaş grubuna uygun olduğu). Daha sonra, bu sözlük kullanılarak haber veri setinin test amaçlı seçilmiş olanlarının sınıflarını belirlemek üzere bir sınıflandırıcı önerilmiştir. Testler sonucunda, geliştirilen sözlüğün 0.70 oranında doğru sınıfı tespit edebildiği görülmüştür.
In this study, it is aimed to label the news in electronic media according to age groups by using Natural Language Processing. The selected ones for training in the news dataset collected from the news sites were processed in Python language using the NLP Zemberek Library, and a vocabulary dictionary that could represent Childhood, Adolescence and Adult age groups of Havighurst's Development Theory adapted to the current situation was created (which age group of each word as appropriate). A classifier was then proposed to determine the classes of the news dataset selected for testing using this dictionary. As a result of the tests, it was seen that the developed dictionary can detect the correct class with a success rate of 0.70.

Açıklama

Anahtar Kelimeler

Haber Yaş Grubu Tespiti, Yaş Grubu Sözlüğü, Zemberek, Doğal Dil İşleme, News Age Group, Detection, Age Group Dictionary, Natural Language, Processing

Kaynak

Gazi Üniversitesi Fen Bilimleri Dergisi Part C: Tasarım ve Teknoloji

WoS Q Değeri

Scopus Q Değeri

Cilt

8

Sayı

2

Künye