Sentiment analysis for textual data

dc.contributor.advisorKakışım, Arzu
dc.contributor.authorFarah, Hassan Abdirahman
dc.date.accessioned2022-11-01T16:40:24Z
dc.date.available2022-11-01T16:40:24Z
dc.date.issued2021
dc.departmentEnstitüler, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalıen_US
dc.descriptionTez (Yüksek Lisans) -- İstanbul Ticaret Üniversitesi -- Kaynakça var.en_US
dc.description.abstractÖZET Duygu analizi, müşterilerin bir ürüne, markaya, hizmete karşı tutum ve görüşlerini ortaya çıkarmak veya sosyal medya kullanıcılarının bir durum ve olaya tepkilerini analiz etmek için son zamanlarda sıkça çalışılan yaygın bir konu haline gelmiştir. Bu nedenle, birçok araştırmacı anlamsal sözcük, tümcecik veya paragraf puanlarını hesaplayan sözlükleri geliştirmeye odaklanmıştır. Kelimelere ait duyarlılık derecesini içeren çoğu sözlük manuel olarak oluşturulur ve insan uzmanlığı gerektirir. Terimleri etiketlemenin zorluğu nedeniyle, mevcut sözlükler genellikle yalnızca kelimelerden ve bunların duyarlılık kutuplarından oluşur. Bu nedenle, bir tümce veya paragraf için, bu sözlükler, metindeki tüm sözcüklerin puanlarını değerlendirerek ve genel (yaklaşık ortalama) bir puan hesaplayarak metnin duyarlılığının olumlu veya olumsuz olup olmadığına karar verir. Bu tezde, mevcut sözlüklerle n-gram yaklaşımını kullanan ve her bir görüşü veya incelemeyi sabit uzunlukta bir vektörle temsil eden yeni bir yaklaşım çerçevesi sunulmuştur. Amaç, ikili-gram veya üçlü-gram gibi her metnin çok kelimeli ifadelerinin anlamsal puanlarını içeren sıralı bir özellik alanı oluşturmaktır. Yöntemimiz, bir görüşü olumlu veya olumsuz olarak sınıflandırmak için bu özellik alanı üzerinde bir eğitim aşaması gerçekleştirir. Çoğu sözlük tabanlı yaklaşımdan farklı olarak, önerilen yöntem, metin duyarlılığı sınıflandırması için cümledeki sözcüklerin polarite değerlerinin yaklaşık ortalamasını kullanmak yerine, kelime öbeklerine ait gerçek değerli veya ikili değerli polarite puanları içeren ve metindeki sözcük sırasını koruyan bir öznitelik vektörü kullanır. Anahtar Kelimeler: Duygu analizi, duygu sözlükleri, n-gram. ABSTRACT Sentiment analysis has become a common topic that is frequently studied in recent times to reveal the attitudes and opinions of customers towards a product, brand, service, or to analyze the reactions of social media users to a situation and event. Therefore, many researchers have focused on enhancing lexicons that compute semantic scores of words, phrases, or paragraphs. Most sentiment lexicons are manually constructed, and requires human expertise. Due to the difficulty of labeling terms, existing lexicons generally consist of only words (unigrams) and their sentiment polarities. Therefore, for a sentence (or a paragraph), these lexicons decide whether the sentiment of text is positive or negative by evaluating the scores of all words in that text and computing an overall (approximately average) score. In this thesis, a new sentiment analysis framework is presented which uses n-gram approach with existing lexicons, and represents each opinion or review with a fixed-length vector. The aim is to create a sequential feature space containing the semantic scores of multi-word expressions of each text in the corpus such as bi-grams or tri-grams. Our method performs a training phase over this feature space to classify an opinion as positive or negative. Different from most lexicon based approach, the proposed method utilizes an attribute vector containing real-valued or binary-valued polarity scores and preserving word order in the text, instead of using approximate average of the polarity assessments of the words in the sentence for sentiment classification. Keywords: Sentiment analysis, sentiment Lexicons, n-gram.en_US
dc.identifier.endpage29en_US
dc.identifier.startpage1en_US
dc.identifier.urihttps://katalog.ticaret.edu.tr/e-kaynak/tez/88951.pdf
dc.identifier.urihttps://hdl.handle.net/11467/5498
dc.identifier.yoktezid706394en_US
dc.institutionauthorFarah, Hassan Abdirahman
dc.language.isotren_US
dc.publisherİstanbul Ticaret Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectApplication softwareen_US
dc.subjectUygulama yazılımıen_US
dc.subjectArtificial intelligenceen_US
dc.subjectYapay zekaen_US
dc.subjectData miningen_US
dc.subjectVeri madenciliğien_US
dc.subjectDatabase managementen_US
dc.subjectVeri tabanı yönetimien_US
dc.subjectBilgi saklama ve geri alma sistemlerien_US
dc.subjectInformation storage and retrievalen_US
dc.subjectÖrüntü tanıma sistemlerien_US
dc.subjectPattern recognition systemsen_US
dc.subject.otherQA 76.9.D343/F37en_US
dc.titleSentiment analysis for textual dataen_US
dc.typeMaster Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
88951.pdf
Boyut:
830.24 KB
Biçim:
Adobe Portable Document Format
Açıklama: