Performance comparison of smote-based machine learning models on unbalanced datasets: A study on date and pistachio fruits

dc.authorid0000-0002-7179-1634
dc.authorid0000-0002-8752-3335
dc.contributor.authorBal, Fatih
dc.contributor.authorKayaalp, Fatih
dc.date.accessioned2025-08-15T09:08:56Z
dc.date.available2025-08-15T09:08:56Z
dc.date.issued2025
dc.departmentİstanbul Ticaret Üniversitesi
dc.departmentİstanbul Ticaret Üniversitesi
dc.description.abstractCreating balanced datasets is a significant challenge that substantially affects the performance of machine learning models in the classification of agricultural products. In this research, we tried to overcome this challenge by using an unbalanced dataset containing information on 7 date palm (Phoenix dactylifera L.) and 2 pistachio (Pistacia vera L.) cultivars. The aim of the study is to compare the classification performance of machine learning models on an unbalanced dataset and a balanced dataset using the SMOTE technique. Initially, classification was performed on the unbalanced dataset using machine learning approaches. Among the machine learning models applied on the unbalanced dataset, the Linear-SVM model showed the highest accuracy rate with an accuracy rate of 92,62%. In the data set extended by applying the SMOTE technique, the RBF-SVM model again showed the highest accuracy rate with 95,55% accuracy rate. In summary, our study highlights the difficulties in machine learning-based agricultural crop classification due to data unbalances. Utilizing the SMOTE technique for oversampling was effective in overcoming this obstacle and improving classification accuracy.
dc.description.abstractDengeli veri kümeleri oluşturmak, tarımsal ürünlerin sınıflandırılmasında makine öğrenimi modellerinin performansını önemli ölçüde etkileyen önemli bir zorluktur. Yapılan bu araştırmada, 7 hurma (Phoenix dactylifera L.) ve 2 Antep fıstığı (Pistacia vera L.) çeşidine ait bilgileri içeren dengesiz bir veri kümesi kullanarak bu zorluğun üstesinden gelinmeye çalışılmıştır. Çalışmanın ana hedefi, makine öğrenmesi modellerinin dengesiz veri kümesi ve SMOTE tekniği ile dengelenmiş veri kümesi üzerindeki sınıflandırma başarısını karşılaştırmaktır. Başlangıç olarak, dengesiz veri kümesi üzerinde makine öğrenimi yaklaşımları kullanılarak sınıflandırma yapılmıştır. Dengesiz veri kümesinde uygulanan makine öğrenmesi modelleri içerisinde %92,62 doğruluk oranı ile en yüksek doğruluk oranını Linear-SVM modeli göstermiştir. SMOTE tekniği uygulanarak genişletilen veri kümesinde ise %95,55 doğruluk oranı ile en yüksek doğruluk oranını RBF-SVM modeli göstermiştir. Özetle, çalışmamız makine öğrenimi tabanlı tarımsal ürün sınıflandırmasında veri dengesizliklerinden kaynaklanan zorlukların altını çizmektedir. Aşırı örnekleme için SMOTE tekniğinden yararlanmak, bu engelin üstesinden gelmede ve sınıflandırma doğruluğunu artırmada etkili olmuştur.
dc.identifier.citationBal, F., & Kayaalp, F. (2025). Performance Comparison of Smote-Based Machine Learning Models on Unbalanced Datasets: A Study on Date and Pistachio Fruits. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 24(47), 176-200.
dc.identifier.doi10.55071/ticaretfbd.1597150
dc.identifier.endpage200
dc.identifier.issn1305-7820
dc.identifier.issn2587-165X
dc.identifier.issue47
dc.identifier.startpage176
dc.identifier.urihttps://hdl.handle.net/11467/9594
dc.identifier.volume24
dc.indekslendigikaynakTR-Dizin
dc.language.isoen
dc.publisherİstanbul Ticaret Üniversitesi
dc.relation.ispartofİstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Başka Kurum Yazarı
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Başka Kurum Yazarı
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectMachine Learning
dc.subjectSMOTE
dc.subjectFruit Classification
dc.subjectOversampling
dc.subjectMakine Öğrenmesi
dc.subjectSmote
dc.subjectMeyve Sınıflandırma
dc.subjectAşırı Örnekleme
dc.titlePerformance comparison of smote-based machine learning models on unbalanced datasets: A study on date and pistachio fruits
dc.title.alternativeSmote tabanlı makine öğrenmesi modellerinin dengesiz veri kümeleri üzerinde performans karşılaştırması: Hurma ve Antep fıstığı meyveleri üzerine bir çalışma
dc.typeArticle

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
Performance comparison of smote-based machine learning models on unbalanced datasets A study on date and pistachio fruits.pdf
Boyut:
876.61 KB
Biçim:
Adobe Portable Document Format
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.17 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: