Съдържание
Един от най-основните инструменти за инженерни или научни анализи е линейна регресия. Тази техника започва с набор от данни в две променливи. Независимата променлива обикновено се нарича "x", а зависимата променлива обикновено се нарича "y". Целта на техниката е да се идентифицира линията, y = mx + b, която приближава набора от данни. Тази линия на тренда може да показва, графично и числово, връзки между зависимите и независимите променливи. От този регресионен анализ се изчислява и стойност за корелация.
Идентифицирайте и разделете стойностите x и y на вашите точки от данни. Ако използвате електронна таблица, въведете ги в съседни колони. Трябва да има еднакъв брой стойности x и y. Ако не, изчислението ще бъде неточно или функцията за електронна таблица ще върне грешка. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Изчислете средната стойност за стойностите x и y, като разделите сбора на всички стойности на общия брой стойности в множеството. Тези средни стойности ще бъдат наричани "x_avg" и y_avg. "X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
Създайте два нови набора от данни, като извадите стойността x_avg от всяка x стойност и y_avg стойността от всяка y стойност. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6 ...) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5, ...) y1 = (-3, -2, 4, -4, 3, 2, 0)
Умножете всяка x1 стойност по всяка y1 стойност, в ред. x1y1 = (0 * -3, -1 * -2, 5 * 4, ...) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Квадрат на всяка x1 стойност. x1 ^ 2 = (0 ^ 2, 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)
Изчислете сумите на стойностите x1y1 и x1 ^ 2. sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 sum_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Разделете "sum_x1y1" на "sum_x1 ^ 2", за да получите коефициента на регресия. sum_x1y1 / sum_x1 ^ 2 = 11/36 = 0.306