Как се изчислява корелационна матрица

Posted on
Автор: John Stephens
Дата На Създаване: 25 Януари 2021
Дата На Актуализиране: 20 Ноември 2024
Anonim
Корелационен анализ (Correlation)
Видео: Корелационен анализ (Correlation)

Съдържание

Корелацията (r) е мярка за линейната връзка между две променливи. Например, дължината на краката и дължината на торса са силно свързани; височината и теглото са по-малко свързани, а височината и дължината на името (с букви) са некорелирани.


Перфектна положителна корелация: r = 1. (Когато единият тръгне нагоре, другият тръгва нагоре) Перфектна отрицателна корелация: r = -1 (Когато единият тръгне нагоре, другият намалява) Няма корелация: r = 0 (Няма линеен връзка)

Корелационна матрица е матрица от много корелации.

Изчисляване на корелационна матрица с R

    Вземете данните. Ако вашите данни са в Excel, най-лесният метод е да го запишете като .csv файл (В Excel 7 кликнете върху "Файл", след това "Запазване като", след това "други формати." След това в "Запазване като тип" превъртете надолу до CSV (стойности, разделени със запетая). Всеки ред трябва да има данни за една тема, а всяка колона трябва да е една променлива.

    Прочетете данните в R, като използвате read.csv. Например, ако вашите данни са в „c: mydisk mydir data.csv“, въведете mydata <- read.csv („c: /mydisk/mydir/data.csv“).

    Изчислете корелационната матрица, използвайки cor (). Например: cor (mydata). Или можете да съхраните корелационната матрица като обект за по-късна употреба, като използвате: cormat <- cor (mydata).


Изчисляване на корелационна матрица със SAS

    Вземете данните. SAS може да чете данни в много формати. Ако съхранявате данните си в Excel, имайте по една тема на всеки ред и по една променлива във всяка колона

    Прочетете данните в SAS. Можете да използвате помощника IMPORT, за да получите вашите данни. Кликнете върху „Файл“, след това „Импортиране на данни“, след което изберете тип данни с помощта на падащото меню. Кликнете върху „Напред“ и отидете до вашите данни, след което кликнете върху „Край“.

    Изчислете корелационната матрица. Ако вашите данни се запаметяват в SAS като mydata, с променливи VAR1, VAR2 и VAR3, тогава въведете: PROC CORR data = mydata; VAR var1 var2 var3; RUN;

    Съвети

    Предупреждения