Tuning paramater selection in penalized logistic regression with application in cancer
Yükleniyor...
Dosyalar
Tarih
2019
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
İstanbul Ticaret Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Variable selection is an important subject in regression analysis intended to select the best subset of predictors. In cancer classification, gene selection plays an important issue. The Least Absolute Shrinkage and Selection Operator (LASSO) is one of most used penalized method. In logistic regression, Lasso right the traditional parameter estimation method, maximum log-likelihood, by adding the L1-norm of the parameters to the negative log-likelihood function. Lasso depends on the tuning parameter. Finding the optimal value for the tuning parameter is one of the most important topics. There are three popular methods to select the optimal value of the tuning parameter: Bayesian Information Criterion (BIC), Akaike Information Criterion (AIC), and Cross-Validation (CV). The aim of this paper is to evaluate and compare these three methods for selecting the optimal value of tuning parameter in terms of coefficients estimation accuracy and variable selection through simulation studies and application in cancer classification.
Değişken seçim, regresyon analizinde en iyi öngösterge alt kümesini seçmeyi amaçlayan önemli bir konudur. Kanser sınıflamasında gen seçimi önemli bir konudur. En az mutlak büzülme ve seçme operatörü (Lasso) en çok kullanılan ceza yöntemlerinden biridir. Lojistik regresyonda Lasso, parametrelerin L1-normunu negatif log-olabilirlik fonksiyonuna ekleyerek, geleneksel parametre tahmin yöntemini, maksimum log olasılığını değiştirir. Kement ayarlama parametresine bağlıdır. Ayar parametresi için en uygun değeri bulmak en önemli konulardan biridir. Ayar parametresinin en uygun değerini seçmek için üç popüler yöntem vardır: Bayesian bilgi kriteri (BIC), Akaike bilgi kriteri (AIC) ve çapraz doğrulama (CV). Bu çalışmanın amacı, simülasyon çalışmaları ve kanser sınıflandırma uygulamalarında katsayılar tahmin doğruluğu ve değişken seçimi açısından en uygun ayarlama parametresini seçmek için bu üç yöntemi değerlendirmek ve karşılaştırmaktır.
Değişken seçim, regresyon analizinde en iyi öngösterge alt kümesini seçmeyi amaçlayan önemli bir konudur. Kanser sınıflamasında gen seçimi önemli bir konudur. En az mutlak büzülme ve seçme operatörü (Lasso) en çok kullanılan ceza yöntemlerinden biridir. Lojistik regresyonda Lasso, parametrelerin L1-normunu negatif log-olabilirlik fonksiyonuna ekleyerek, geleneksel parametre tahmin yöntemini, maksimum log olasılığını değiştirir. Kement ayarlama parametresine bağlıdır. Ayar parametresi için en uygun değeri bulmak en önemli konulardan biridir. Ayar parametresinin en uygun değerini seçmek için üç popüler yöntem vardır: Bayesian bilgi kriteri (BIC), Akaike bilgi kriteri (AIC) ve çapraz doğrulama (CV). Bu çalışmanın amacı, simülasyon çalışmaları ve kanser sınıflandırma uygulamalarında katsayılar tahmin doğruluğu ve değişken seçimi açısından en uygun ayarlama parametresini seçmek için bu üç yöntemi değerlendirmek ve karşılaştırmaktır.
Açıklama
Anahtar Kelimeler
Cancer classification, gene selection, Lasso, penalized logistic regression, Cezalandırılmış lojistik regresyon, gen seçimi, kanser sınıflandırması, Lasso
Kaynak
İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi
WoS Q Değeri
Scopus Q Değeri
Cilt
18
Sayı
36