Farklı regresyon modellerinde lineerizasyon sapmalarının minimize edilmesine yönelik model önerisi
Küçük Resim Yok
Tarih
2023
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
İstanbul Ticaret Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu çalışmada, farklı regresyon modellerinde lineerizasyon sapmalarının minimize edilmesine yönelik bir model önerisinin geliştirilmesi amaçlanmıştır. Çalışmada sosyal bilimler, finansal bilimler ve sağlık bilimleri olmak üzere üç alandan Dünya Bankası verileri kullanılarak, her bir alan için eğri tahmin modelleri ve regresyon katsayıları ile lineerizasyondan sapmalar hesaplanmıştır. Sosyal alanda değişkenler arasında ikinci derece ve kübik ilişki olduğu durum ile lineer ilişki olduğu durum arasında %7,80'lik bir sapma söz konusudur. Finans alanında açıklama gücü değişimi farkı en fazla kübik modelde olup, lineer model kübik modele göre %5,70 daha düşük açıklama gücüne sahiptir. Sağlık alanındaki verilerde en fazla sapma kübik ve ikinci derecede fonksiyonda görülmekte olup, %2,3 civarındadır. Buna göre en fazla sapma sosyal alanda olup, bunu sırasıyla finans ve sağlık alanı izlemektedir. Önerilen Regresyon Düzeltme Katsayısı (RDK) bir model içerisinde her bir bağımlı değişken için bağımsız değişkenlerin maksimum R2 değerinden lineerizasyon değerinin farkının kareli ortalaması olup, bu sayede birden fazla bağımsız değişkenin söz konusu olduğu modellerde, değişkenlerin lineerizasyon sapmalarını minimize etmektedir. Elde edilen sonuçlar, özellikle sosyal ve finansal alanlardaki regresyon modellerinde sapmaların %5'in üzerinde olabileceğini ve ciddi anlam ifade edebileceğini ortaya koymaktadır. Bu nedenle, daha geniş örneklem ve daha fazla veriyle, RDK için daha geniş bir alan uygulamasının sağlanması ve saha uygulamalarında RDK kullanımı önerilmektedir.
In this study, it is aimed to develop a model proposal for minimizing linearization deviations in different regression models. In the study, curve estimation models and regression coefficients and deviations from linearization were calculated for each field using World Bank data from three fields: social sciences, financial sciences and health sciences. There is a 7.80% deviation between the situation where there is a quadratic and cubic relationship between the variables in the social field and the situation where there is a linear relationship. In the field of finance, the difference in explanatory power is highest in the cubic model, and the linear model has 5.70% lower explanatory power than the cubic model. In the data in the field of health, the greatest deviation is seen in cubic and second-degree functions, around 2.3%. Accordingly, the highest deviation is in the social domain, followed by finance and health, respectively. The proposed Area Correction Coefficient (ADK) is the squared average of the difference of the linearization value from the maximum R2 value of the independent variables for each dependent variable in a model, thus minimizing the linearization deviations of the variables in models where there is more than one independent variable. The results show that deviations in regression models, especially in social and financial fields, can be over 5% and have serious meaning. Therefore, with a larger sample and more data, it is recommended to provide a wider field application for RCC and to use RCC in field applications.
In this study, it is aimed to develop a model proposal for minimizing linearization deviations in different regression models. In the study, curve estimation models and regression coefficients and deviations from linearization were calculated for each field using World Bank data from three fields: social sciences, financial sciences and health sciences. There is a 7.80% deviation between the situation where there is a quadratic and cubic relationship between the variables in the social field and the situation where there is a linear relationship. In the field of finance, the difference in explanatory power is highest in the cubic model, and the linear model has 5.70% lower explanatory power than the cubic model. In the data in the field of health, the greatest deviation is seen in cubic and second-degree functions, around 2.3%. Accordingly, the highest deviation is in the social domain, followed by finance and health, respectively. The proposed Area Correction Coefficient (ADK) is the squared average of the difference of the linearization value from the maximum R2 value of the independent variables for each dependent variable in a model, thus minimizing the linearization deviations of the variables in models where there is more than one independent variable. The results show that deviations in regression models, especially in social and financial fields, can be over 5% and have serious meaning. Therefore, with a larger sample and more data, it is recommended to provide a wider field application for RCC and to use RCC in field applications.
Açıklama
Fen Bilimleri Enstitüsü, İstatistik Ana Bilim Dalı, İstatistik Bilim Dalı
Anahtar Kelimeler
İstatistik, Statistics