Как се изчислява MSE

Posted on
Автор: Lewis Jackson
Дата На Създаване: 14 Може 2021
Дата На Актуализиране: 17 Ноември 2024
Anonim
Machine Learning with Python! Mean Squared Error (MSE)
Видео: Machine Learning with Python! Mean Squared Error (MSE)

Съдържание

Когато учените, икономистите или статистиците правят прогнози въз основа на теорията и след това събират реални данни, им е необходим начин за измерване на разликата между прогнозираните и измерените стойности. Те обикновено разчитат на средната квадратна грешка (MSE), която е сумата от вариациите на отделните точки от данни в квадрат и разделена на броя точки на данни минус 2. Когато данните се показват на графика, вие определяте MSE по сумиране на промените в точките с данни по вертикалната ос. На x-y графика това ще са y-стойностите.


Защо квадрат на вариациите?

Умножаването на разликата между прогнозираните и наблюдаваните стойности има два желани ефекта. Първият е да се гарантира, че всички стойности са положителни. Ако една или повече стойности са отрицателни, сборът на всички стойности може да бъде нереално малък и лошо представяне на действителното изменение между прогнозираните и наблюдаваните стойности. Второто предимство на квадратите е да се придаде по-голяма тежест на по-големи разлики, което гарантира, че голяма стойност за MSE означава големи вариации на данните.

Алгоритъм за изчисляване на пробата

Да предположим, че имате алгоритъм, който ежедневно прогнозира цените на определен състав. В понеделник прогнозира цената на акциите да бъде 5,50 долара, във вторник да бъде 6,00 долара, сряда 6,00 долара, четвъртък 7,50 долара и петък 8,00 долара. Смятайки понеделник за ден 1, имате набор от данни, които изглеждат така: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) и (5, 8.00). Реалните цени са както следва: понеделник $ 4.75 (1, 4.75); Вторник 5,35 долара (2, 5,35); Сряда $ 6,25 (3, 6,25); Четвъртък 7,25 долара (4, 7,25); и петък: 8,50 долара (5, 8,50).


Разликите между стойностите на y на тези точки са съответно 0,75, 0,65, -0,25, 0,25 и -0,50, където отрицателният знак показва прогнозна стойност, по-малка от наблюдаваната. За да изчислите MSE, първо квадратирате всяка стойност на вариация, което елиминира знаците минус и добива 0.5625, 0.4225, 0.0625, 0.0625 и 0.25. Обобщаването на тези стойности дава 1,36 и деление на броя на измерванията минус 2, което е 3, дава MSE, което се оказва 0,45.

MSE и RMSE

По-малките стойности за MSE показват по-тясно съгласие между прогнозираните и наблюдаваните резултати, а MSE от 0,0 показва перфектно съгласие. Важно е да запомните обаче, че стойностите на вариациите са в квадрат. Когато се изисква измерване на грешка, което е в същите единици като точките с данни, статистиците приемат коренната средна квадратна грешка (RMSE). Те получават това, като вземат квадратния корен на средната квадратна грешка. За горния пример, RSME ще бъде 0.671 или около 67 цента.