Съдържание
Когато монтирате права линия към набор от данни, може да ви е интересно да определите доколко получената линия отговаря на данните. Един от начините за това е да се изчисли сумата на грешките на квадратите (SSE). Тази стойност дава мярка за това, доколко линията за най-добро прилягане се приближава до набора от данни. SSE е важен за анализа на експерименталните данни и се определя само чрез няколко кратки стъпки.
Намерете линия, която е най-подходяща за моделиране на данните, като използвате регресия. Линията с най-добро прилягане има формата y = ax + b, където a и b са параметри, които трябва да определите. Можете да намерите тези параметри с помощта на обикновен линеен регресионен анализ. Например, приемете, че линията на най-доброто прилягане има формата y = 0.8x + 7.
Използвайте уравнението, за да определите стойността на всяка y-стойност, прогнозирана от най-подходящия ред. Можете да направите това, като замените всяка x-стойност в уравнението на реда. Например, ако х е равно на 1, заместване на това в уравнението y = 0.8x + 7 дава 7.8 за y-стойността.
Определете средната стойност на стойностите, предвидени от линията на най-доброто уравнение. Можете да направите това, като сумирате всички y-стойности, предвидени от уравненията, и полученото число разделяте на броя стойности. Например, ако стойностите са 7,8, 8,6 и 9,4, сумирането на тези стойности дава 25,8, а делението на това число на броя на стойностите, 3 в този случай дава 8,6.
Извадете всяка от отделните стойности от средната стойност и квадратът на полученото число. В нашия пример, ако извадим стойността 7,8 от средното 8,6, полученото число е 0,8. Квадрирането на тази стойност дава 0,64.
Обобщете всички квадратни стойности от стъпка 4. Ако приложите инструкциите в стъпка 4 към трите стойности в нашия пример, ще намерите стойности 0,64, 0 и 0,64. Обобщаването на тези стойности дава 1.28. Това е сумата от грешки в квадратите.