Съдържание
- TL; DR (Твърде дълго; Не четях)
- Стандартно отклонение срещу примерно стандартно отклонение
- Намиране на примерното стандартно отклонение
- Средно отклонение срещу стандартно отклонение
Статистически тестове като т-тестът по същество зависи от концепцията за стандартно отклонение. Всеки студент по статистика или наука ще използва стандартни отклонения редовно и ще трябва да разбере какво означава и как да го намери от набор от данни. За щастие, единственото, от което се нуждаете, са оригиналните данни и макар изчисленията да са досадни, когато имате много данни, в тези случаи трябва да използвате функции или данни от електронната таблица, за да ги направите автоматично. Всичко, което трябва да направите, за да разберете основната концепция, е да видите основен пример, който лесно можете да изработите на ръка. В основата си стандартното отклонение на извадката измерва колко избраното от вас количество варира за цялото население въз основа на вашата извадка.
TL; DR (Твърде дълго; Не четях)
Използвайки н да означава размер на извадката, μ за средната стойност на данните, хаз за всяка отделна точка от данни (от аз = 1 до аз = н), и Σ като сумиращ знак, пробата отклонение (с2) е:
с2 = (Σ хаз – μ)2 / (н − 1)
И стандартното отклонение на извадката е:
с = √с2
Стандартно отклонение срещу примерно стандартно отклонение
Статистиката се върти около изготвянето на оценки за цели популации въз основа на по-малки извадки от популацията и отчитане на всяка несигурност в оценката в процеса. Стандартните отклонения количествено определят размера на вариацията в популацията, която изучавате. Ако се опитвате да намерите средната височина, ще получите съвкупност от резултати около средната (средната) стойност, а стандартното отклонение описва ширината на клъстера и разпределението на височините сред населението.
Стандартното отклонение „извадка“ оценява истинското стандартно отклонение за цялото население въз основа на малка извадка от популацията. През повечето време няма да можете да вземете извадка за цялото въпросно население, така че стандартното отклонение на извадката често е подходящата версия.
Намиране на примерното стандартно отклонение
Нуждаете се от вашите резултати и номера (н) на хората от вашата извадка. Първо, изчислете средната стойност на резултатите (μ) чрез добавяне на всички отделни резултати и след това разделяне на броя на измерванията.
Като пример, сърдечната честота (в удари в минута) на петима мъже и пет жени са:
71, 83, 63, 70, 75, 69, 62, 75, 66, 68
Което води до средно:
μ = (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10
= 702 ÷ 10 = 70.2
Следващият етап е да се извади средната стойност от всяко отделно измерване и след това да се квадратът на резултата. Като пример за първата точка от данни:
(71 – 70.2)2 = 0.82 = 0.64
И за второ:
(83 – 70.2)2 = 12.82 = 163.84
Продължавате по този начин чрез данните и след това добавяте тези резултати. Така че за примерните данни сумата от тези стойности е:
0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6
Следващият етап прави разлика между стандартното отклонение на извадката и стандартното отклонение на популацията. За отклонението в извадката разделяте този резултат на размера на извадката минус един (н -1). В нашия пример, н = 10, така че н – 1 = 9.
Този резултат дава дисперсията на извадката, обозначена с с2, което например е:
с2 = 353.6 ÷ 9 = 39.289
Стандартно отклонение на извадката (с) е само положителния квадратен корен на това число:
с = √39.289 = 6.268
Ако изчислявате стандартното отклонение на популацията (σ) единствената разлика е, че се разделяте по н отколкото н −1.
Цялата формула за стандартно отклонение на пробата може да бъде изразена чрез символа на сумиране Σ, като сумата е над цялата проба, и хаз представляваща i_th резултат от _n, Дисперсията на извадката е:
с2 = (Σ хаз – μ)2 / (н − 1)
И стандартното отклонение на извадката е просто:
с = √с2
Средно отклонение срещу стандартно отклонение
Средното отклонение се различава леко от стандартното отклонение. Вместо да изчислявате разликите между средната и всяка стойност, вместо това просто вземате абсолютната разлика (игнорирайки всички минус знаци) и след това намирате средната стойност от тях. За пример в предишния раздел, първата и втората точки от данни (71 и 83) дават:
х1 – μ = 71 – 70.2 = 0.8
х2 – μ = 83 – 70.2 = 12.8
Третата точка от данни дава отрицателен резултат
х3 – μ = 63 – 70.2 = −7.2
Но просто премахвате знака минус и приемате това като 7.2.
Сумата от всички тези дава разделена на н дава средното отклонение. В примера:
(0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2) ÷ 10 = 46.4 ÷ 10 = 4.64
Това съществено се различава от стандартното отклонение, изчислено преди, тъй като не включва квадрати и корени.