Съдържание
- Изчисляване на корелационна матрица с R
- Изчисляване на корелационна матрица със SAS
- Съвети
- Предупреждения
Корелацията (r) е мярка за линейната връзка между две променливи. Например, дължината на краката и дължината на торса са силно свързани; височината и теглото са по-малко свързани, а височината и дължината на името (с букви) са некорелирани.
Перфектна положителна корелация: r = 1. (Когато единият тръгне нагоре, другият тръгва нагоре) Перфектна отрицателна корелация: r = -1 (Когато единият тръгне нагоре, другият намалява) Няма корелация: r = 0 (Няма линеен връзка)
Корелационна матрица е матрица от много корелации.
Изчисляване на корелационна матрица с R
Вземете данните. Ако вашите данни са в Excel, най-лесният метод е да го запишете като .csv файл (В Excel 7 кликнете върху "Файл", след това "Запазване като", след това "други формати." След това в "Запазване като тип" превъртете надолу до CSV (стойности, разделени със запетая). Всеки ред трябва да има данни за една тема, а всяка колона трябва да е една променлива.
Прочетете данните в R, като използвате read.csv. Например, ако вашите данни са в „c: mydisk mydir data.csv“, въведете mydata <- read.csv („c: /mydisk/mydir/data.csv“).
Изчислете корелационната матрица, използвайки cor (). Например: cor (mydata). Или можете да съхраните корелационната матрица като обект за по-късна употреба, като използвате: cormat <- cor (mydata).
Изчисляване на корелационна матрица със SAS
Вземете данните. SAS може да чете данни в много формати. Ако съхранявате данните си в Excel, имайте по една тема на всеки ред и по една променлива във всяка колона
Прочетете данните в SAS. Можете да използвате помощника IMPORT, за да получите вашите данни. Кликнете върху „Файл“, след това „Импортиране на данни“, след което изберете тип данни с помощта на падащото меню. Кликнете върху „Напред“ и отидете до вашите данни, след което кликнете върху „Край“.
Изчислете корелационната матрица. Ако вашите данни се запаметяват в SAS като mydata, с променливи VAR1, VAR2 и VAR3, тогава въведете: PROC CORR data = mydata; VAR var1 var2 var3; RUN;