Съдържание
- Примери за множествена регресия
- Предимства на множествената регресия
- Недостатъци на множествена регресия
Множеството регресия се използва за изследване на връзката между няколко независими променливи и зависима променлива. Докато множеството регресионни модели ви позволяват да анализирате относителните влияния на тези независими или прогнозиращи променливи върху зависимата или критерийната променлива, тези често сложни набори от данни могат да доведат до грешни заключения, ако не са анализирани правилно.
Примери за множествена регресия
Агентът за недвижими имоти може да използва многократна регресия, за да анализира стойността на къщите. Например, тя може да използва като независими променливи размера на къщите, възрастта им, броя на спалните, средната цена на жилището в квартала и близостта до училищата. Разпределяйки ги в модел на множествена регресия, тя би могла да използва тези фактори, за да види връзката им с цените на жилищата като критерийна променлива.
Друг пример за използване на модел за множествена регресия може да бъде човек в човешките ресурси, определящ заплатата на ръководните позиции - критерийната променлива. Променливите на прогнозата могат да бъдат старшинството на всеки мениджър, средният брой отработени часове, броят на управляваните хора и бюджета на отделите за мениджъри.
Предимства на множествената регресия
Има две основни предимства за анализиране на данни, използвайки модел за множествена регресия. Първият е способността да се определи относителното влияние на една или повече променливи променливи на критерийната стойност. Агенцията за недвижими имоти би могла да установи, че размерът на домовете и броят на спалните имат силна корелация с цената на жилището, докато близостта до училищата няма никаква корелация или дори отрицателна корелация, ако това е предимно пенсиониране общност.
Второто предимство е способността да се идентифицират остатъци или аномалии. Например, при преглед на данните, свързани с заплатите на ръководството, ръководителят на човешките ресурси би могъл да установи, че броят на отработените часове, размерът на отдела и неговият бюджет са имали силна връзка със заплатите, докато трудовия стаж не са. Като алтернатива може да се окаже, че всички изброени стойности на прогнозите са свързани с всяка от заплатите, които се изследват, с изключение на един ръководител, който е надплатен в сравнение с останалите.
Недостатъци на множествена регресия
Всеки недостатък от използването на модел за множествена регресия обикновено се свежда до използваните данни. Два примера за това са използването на непълни данни и невярно заключение, че корелацията е причинно-следствена връзка.
Например, при преглед на цената на жилищата, агентът за недвижими имоти е разгледал само 10 жилища, седем от които са закупени от млади родители. В този случай връзката между близостта на училищата може да я накара да вярва, че това има ефект върху продажната цена за всички жилища, продавани в общността. Това илюстрира клопките на непълни данни. Ако беше използвала по-голяма извадка, можеше да открие, че от 100 продадени жилища само десет процента от стойностите на дома са свързани с близостта до училищата. Ако беше използвала възрастите за купувачи като прогнозна стойност, можеше да открие, че по-младите купувачи са готови да плащат повече за домовете в общността, отколкото по-възрастните купувачи.
Да предположим, че в примера за заплатите на ръководството е имало един външен човек, който е с по-малък бюджет, по-малко стаж и с по-малко персонал, който управлява, но печели повече от всеки друг. HR мениджърът би могъл да разгледа данните и да заключи, че това лице е надплатено. Това заключение обаче би било погрешно, ако той не взе предвид, че този мениджър ръководеше уебсайта на компаниите и разполагаше с високо желания набор от умения в мрежовата сигурност.