Regresiya dəyişənlər arasındakı əlaqələri təhlil edir
Regression, müəyyən bir verilənlər bazası verilmiş sayısal dəyərlərin ( daimi dəyərlər də adlandırılır) bir sıra proqnozlaşdırmaq üçün istifadə edilən bir məlumat mədən üsuludur. Məsələn, digər dəyişənlər verilmiş bir məhsulun və ya xidmətin dəyərini proqnozlaşdırmaq üçün regressiya istifadə edilə bilər.
Regresiya iş və marketinq planlaması, maliyyə proqnozu, ekoloji modelləşdirmə və meyllərin təhlili üçün bir çox sənayedə istifadə olunur.
Regression Vs. Təsnifat
Regresiya və təsnifat oxşar problemləri həll etmək üçün istifadə edilən məlumatların əldə edilməsi üsullarıdır, lakin onlar tez-tez qarışdırılır. Hər ikisi də proqnozlaşdırma analizində istifadə olunur, lakin təsnifat verilənləri ayrı-ayrı kateqoriyalara verərkən, ədədi və ya davamlı dəyərin proqnozlaşdırılması üçün regression istifadə olunur.
Məsələn, regresiya onun yerini, kvadrat ayağını, son satıldığı qiyməti, oxşar evlərin qiymətini və digər amillərə əsaslanaraq bir ev qiymətini proqnozlaşdırmaq üçün istifadə ediləcək. Əgər təsəvvür etmək mümkün deyildirsə, evlərinizi gediş-gəliş, lot ölçüsü və ya cinayət dərəcələri kimi kateqoriyalara təşkil etmək istəyirik.
Regression Texnikası növləri
Regresiyanın ən sadə və ən qədim forması, iki dəyişən arasındakı əlaqəni qiymətləndirmək üçün istifadə olunan xətti reqressiyadır. Bu üsul bir düz xəttin riyazi formulunu (y = mx + b) istifadə edir. Düz ifadələrlə, bu sadəcə Y və X oxlu bir qrafik verildiyindən X və Y arasındakı əlaqələr bir neçə çatışmazlığı olan bir düz xəttdir. Misal üçün, əhalinin artması nəzərə alınarsa, qida istehsalının eyni dərəcədə artacağını nəzərə alsaq, bu, iki rəqəm arasında güclü, doğrusal bir əlaqəni tələb edir. Bunu görselleştirmek üçün, Y ekseninin nüfus arttığı bir grafik düşünün ve X ekseni qida istehsalını izler. Y dəyəri artdıqca X dəyəri eyni dərəcədə artacaq, aralarındakı düz bir xətt arasındakı əlaqəni qurur.
Çoxlu regresiya kimi qabaqcıl texnika, çox dəyişənlər arasında bir əlaqəni öngörür - məsələn, gəlir, təhsil və yaşamaq istədiyi yer arasında bir əlaqə varmı? Daha çox dəyişənlərin əlavə edilməsi proqnozun mürəkkəbliyini əhəmiyyətli dərəcədə artırır. Standart, hiyerarşik, setwise və addım-addımlı, hər biri öz tətbiqi ilə bir çox müxtəlif regresiya üsulları var.
Bu nöqtədə proqnozu (müstəqil və ya proqnozlaşdırılan dəyişənlər) və proqnozu (müstəqil və ya proqnozlaşdırıcı dəyişənlər) etmək üçün istifadə etdiyimiz məlumatları təxmin etməyə çalışdığımızı anlamaq vacibdir. Bizim nümunədə biz gəlir verən və təhsil verən (həm də proqnozlaşdırıcı dəyişənlər) yaşamaq istədiyi yeri ( proqnozlaşdırılan dəyişən) proqnozlaşdırmaq istəyirik.
- Standart çoxlu regression bütün predictor dəyişənləri eyni zamanda hesab edir. Məsələn, 1) gəlir və təhsil (predictors) və qonşuluq seçimi (proqnozlaşdırılan) arasındakı əlaqələr nədir; və 2) fərdi fərdiləşdiricilərin hər biri bu əlaqələrə nə dərəcədə təsir edir?
- Stepwise çox regresiya tamamilə fərqli bir sual verir. A stepwise regression alqoritmi məhəllə seçimi proqnozlaşdırmaq üçün hansı predictors ən yaxşı istifadə olunur təhlil edəcək - stepwise model predictor dəyişənlərin əhəmiyyətini sırası qiymətləndirir və sonra müvafiq bir alt kümeyi seçir. Bu növ regresiya problemi regression tənlikinin inkişafı üçün "addımlar" istifadə edir. Bu cür regressiya nəzərə alındıqda, bütün yordayıcılar son regression tənlikində belə görünə bilməz.
- Hiyerarşik regressiya , mərhələli kimi, bir ardıcıl prosesdir, lakin predictor dəyişənlər əvvəlcədən müəyyən edilmiş əvvəlcədən müəyyən edilmiş qaydada modelə daxil edilir, yəni alqoritm içərisində müəyyənləşdirilmiş sətrin müəyyən edilməsi üçün tənzimlənən kompleksi ehtiva etməz. yayılanları daxil edin. Bu, regresiyanın tənzimlənməsini yaratan şəxs sahənin ekspert biliklərinə malik olduqda tez-tez istifadə olunur.
- Setwise regresiyası da mərhələyə bənzəyir, lakin fərdi dəyişənlərdən daha çox dəyişənlər qruplarını təhlil edir.