Sentiment analysis for textual data
Yükleniyor...
Dosyalar
Tarih
2021
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
İstanbul Ticaret Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
ÖZET Duygu analizi, müşterilerin bir ürüne, markaya, hizmete karşı tutum ve görüşlerini ortaya çıkarmak veya sosyal medya kullanıcılarının bir durum ve olaya tepkilerini analiz etmek için son zamanlarda sıkça çalışılan yaygın bir konu haline gelmiştir. Bu nedenle, birçok araştırmacı anlamsal sözcük, tümcecik veya paragraf puanlarını hesaplayan sözlükleri geliştirmeye odaklanmıştır. Kelimelere ait duyarlılık derecesini içeren çoğu sözlük manuel olarak oluşturulur ve insan uzmanlığı gerektirir. Terimleri etiketlemenin zorluğu nedeniyle, mevcut sözlükler genellikle yalnızca kelimelerden ve bunların duyarlılık kutuplarından oluşur. Bu nedenle, bir tümce veya paragraf için, bu sözlükler, metindeki tüm sözcüklerin puanlarını değerlendirerek ve genel (yaklaşık ortalama) bir puan hesaplayarak metnin duyarlılığının olumlu veya olumsuz olup olmadığına karar verir. Bu tezde, mevcut sözlüklerle n-gram yaklaşımını kullanan ve her bir görüşü veya incelemeyi sabit uzunlukta bir vektörle temsil eden yeni bir yaklaşım çerçevesi sunulmuştur. Amaç, ikili-gram veya üçlü-gram gibi her metnin çok kelimeli ifadelerinin anlamsal puanlarını içeren sıralı bir özellik alanı oluşturmaktır. Yöntemimiz, bir görüşü olumlu veya olumsuz olarak sınıflandırmak için bu özellik alanı üzerinde bir eğitim aşaması gerçekleştirir. Çoğu sözlük tabanlı yaklaşımdan farklı olarak, önerilen yöntem, metin duyarlılığı sınıflandırması için cümledeki sözcüklerin polarite değerlerinin yaklaşık ortalamasını kullanmak yerine, kelime öbeklerine ait gerçek değerli veya ikili değerli polarite puanları içeren ve metindeki sözcük sırasını koruyan bir öznitelik vektörü kullanır. Anahtar Kelimeler: Duygu analizi, duygu sözlükleri, n-gram. ABSTRACT Sentiment analysis has become a common topic that is frequently studied in recent times to reveal the attitudes and opinions of customers towards a product, brand, service, or to analyze the reactions of social media users to a situation and event. Therefore, many researchers have focused on enhancing lexicons that compute semantic scores of words, phrases, or paragraphs. Most sentiment lexicons are manually constructed, and requires human expertise. Due to the difficulty of labeling terms, existing lexicons generally consist of only words (unigrams) and their sentiment polarities. Therefore, for a sentence (or a paragraph), these lexicons decide whether the sentiment of text is positive or negative by evaluating the scores of all words in that text and computing an overall (approximately average) score. In this thesis, a new sentiment analysis framework is presented which uses n-gram approach with existing lexicons, and represents each opinion or review with a fixed-length vector. The aim is to create a sequential feature space containing the semantic scores of multi-word expressions of each text in the corpus such as bi-grams or tri-grams. Our method performs a training phase over this feature space to classify an opinion as positive or negative. Different from most lexicon based approach, the proposed method utilizes an attribute vector containing real-valued or binary-valued polarity scores and preserving word order in the text, instead of using approximate average of the polarity assessments of the words in the sentence for sentiment classification. Keywords: Sentiment analysis, sentiment Lexicons, n-gram.
Açıklama
Tez (Yüksek Lisans) -- İstanbul Ticaret Üniversitesi -- Kaynakça var.
Anahtar Kelimeler
Application software, Uygulama yazılımı, Artificial intelligence, Yapay zeka, Data mining, Veri madenciliği, Database management, Veri tabanı yönetimi, Bilgi saklama ve geri alma sistemleri, Information storage and retrieval, Örüntü tanıma sistemleri, Pattern recognition systems