Съдържание
- Изчисляване на средна стойност
- Изчисляване на медиана
- Режим на изчисляване
- Изчисляване на обхват
- Изчисляване на стандартно отклонение
Опростете сравненията на множества от числа, особено големи набори от числа, чрез изчисляване на централните стойности, като използвате средни, режим и медиана. Използвайте диапазоните и стандартните отклонения на множествата, за да разгледате променливостта на данните.
Изчисляване на средна стойност
Средата идентифицира средната стойност на набора от числа. Например, помислете за набора от данни, съдържащ стойностите 20, 24, 25, 36, 25, 22, 23.
За да намерите средната стойност, използвайте формулата: Средно се равнява на сумата от числата в набора от данни, разделена на броя на стойностите в набора от данни. В математически план: Средно = (сбор от всички термини) ÷ (колко термина или стойности в множеството).
Добавете числата в примерния набор от данни: 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175.
Разделете на броя точки от данни в набора. Този набор има седем стойности, така че разделете на 7.
Вмъкнете стойностите във формулата, за да изчислите средната стойност. Средната стойност е равна на сумата от стойностите (175), разделена на броя точки от данни (7). Тъй като 175 ÷ 7 = 25, средната стойност на този набор от данни е равна на 25. Не всички средни стойности ще са равни на цяло число.
Изчисляване на медиана
Медианата идентифицира средната или средната стойност на набор от числа.
Поставете числата в ред от най-малките до най-големите. Използвайте примерния набор от стойности: 20, 24, 25, 36, 25, 22, 23. Поставен в ред, множеството става: 20, 22, 23, 24, 25, 25, 36.
Тъй като този набор от числа има седем стойности, средната или стойността в центъра е 24.
Ако наборът от числа има четен брой стойности, изчислете средната стойност на двете централни стойности. Да предположим, например, че множеството от числа съдържа стойностите 22, 23, 25, 26. Средната е между 23 и 25. Добавянето на 23 и 25 добива 48. Разделянето на 48 на две дава средна стойност от 24.
Режим на изчисляване
Режимът идентифицира най-често срещаната стойност или стойности в набора от данни. В зависимост от данните може да има един или повече режима или изобщо да няма режим.
Подобно на намирането на медианата, подредете набора от най-малки до най-големи. В набор от пример подредените стойности стават: 20, 22, 23, 24, 25, 25, 36.
Режим възниква, когато стойностите се повтарят. В набора пример стойността 25 се появява два пъти. Никой друг номер не се повтаря. Следователно режимът е стойността 25.
В някои набори от данни се среща повече от един режим. Наборът от данни 22, 23, 23, 24, 27, 27, 29 съдържа два режима, един на 23 и 27. Другите масиви данни могат да имат повече от два режима, могат да имат режими с повече от две числа (като 23, 23 , 24, 24, 24, 28, 29: режимът е равен на 24) или може изобщо да няма режими (като 21, 23, 24, 25, 26, 27, 29). Режимът може да се появи навсякъде в набора от данни, а не само в средата.
Изчисляване на обхват
Диапазонът показва математическото разстояние между най-ниските и най-високите стойности в набора от данни. Диапазонът измерва променливостта на набора от данни. Широкият обхват показва по-голяма променливост в данните или може би един отделен далеч от останалите данни. Преживелиците могат да изкривят или изместят средната стойност, достатъчна за анализ на въздействието на данните.
В групата на извадката най-ниската стойност е 20, а най-високата - 36.
За да изчислите диапазона, извадете най-ниската стойност от най-високата стойност. Тъй като 36-20 = 16, диапазонът е равен на 16.
В набор от извадки високата стойност на данните от 36 надвишава предишната стойност 25 с 11. Тази стойност изглежда изключителна, като се имат предвид другите стойности в набора. Стойността 36 може да е по-външна точка от данни.
Изчисляване на стандартно отклонение
Стандартното отклонение измерва променливостта на набора от данни. Подобно на обхвата, по-малкото стандартно отклонение показва по-малка променливост.
Намирането на стандартно отклонение изисква сумиране на разликата в квадрат между всяка точка от данни и средната стойност, добавяне на всички квадратчета, разделяне на тази сума с една по-малка от стойността (N-1) и накрая изчисляване на квадратния корен на дивидента. Математически започнете с изчисляването на средната стойност.
Изчислете средната стойност, като добавите всички стойности на точките от данни, след което разделете на броя точки на данни. В набора от извадкови данни 20 + 24 + 25 + 36 + 25 + 22 + 23 = 175. Разделете сумата 175 по броя на точките с данни 7 или 175 ÷ 7 = 25. Средната стойност е равна на 25.
След това извадете средната стойност от всяка точка от данни, след което квадратнете всяка разлика. Формулата изглежда така: ∑ (x-µ)2, където ∑ означава сума, x представлява всяка стойност на набора от данни и µ представлява средната стойност. Продължавайки с зададения пример, стойностите стават: 20-25 = -5 и -52= 25; 24-25 = -1 и -12= 1; 25-25 = 0 и 02= 0; 36-25 = 11 и 112= 121; 25-25 = 0 и 02= 0; 22-25 = -3 и -32= 9; и 23-25 = -2 и -22=4.
Като добавим и разликите в квадрат, се получават: 25 + 1 + 0 + 121 + 0 + 9 + 4 = 160.
Разделете сумата на разликите в квадрат с една по-малка от броя точки на данни. Примерният набор от данни има 7 стойности, така че N-1 е равен на 7-1 = 6. Сумата от разликите в квадрат, 160, разделена на 6, е приблизително 26.6667.
Изчислете стандартното отклонение, като намерите квадратния корен на делението по N-1. В примера, квадратният корен от 26.6667 е равен приблизително на 5.164. Следователно стандартното отклонение е приблизително 5,164.
Стандартното отклонение помага за оценка на данните. Числата в набора от данни, които попадат в рамките на едно стандартно отклонение от средната стойност, са част от набора от данни. Числата, които попадат извън две стандартни отклонения, са екстремни стойности или отклонения. В набора пример стойността 36 лежи повече от две стандартни отклонения от средната стойност, така че 36 е по-далеч. Преживелиците могат да представляват грешни данни или могат да предполагат непредвидени обстоятелства и трябва да бъдат внимателно обмислени при интерпретирането на данните.