Как да изчислим нивата на увереност

Ноември 2024

Автор: John Stephens

Дата На Създаване: 25 Януари 2021

Дата На Актуализиране: 20 Ноември 2024

Съдържание

TL; DR (Твърде дълго; Не четях)
Разликата между ниво на увереност спрямо интервал на увереност
Изчисляване на доверителни интервали или нива за големи проби
Изчисляване на доверителни интервали за малки проби

Статистиката е свързана с правенето на заключения в условията на несигурност. Всеки път, когато вземете проба, не можете да бъдете напълно сигурни, че вашата проба отразява населението, от което е взета. Статистиците се справят с тази несигурност, като вземат предвид факторите, които биха могли да повлияят на оценката, количествено определят тяхната несигурност и извършват статистически тестове, за да направят изводи от тези несигурни данни.

Статистиците използват интервали на доверие, за да определят диапазон от стойности, който може да съдържа „истинското“ средно население на базата на извадка, и да изразят нивото си на сигурност в това чрез нива на доверие. Въпреки че изчисляването на нивата на доверие не е често полезно, изчисляването на интервали на доверие за дадено ниво на доверие е много полезно умение.

TL; DR (Твърде дълго; Не четях)

Изчислете интервал на доверие за дадено ниво на доверие, като умножите стандартната грешка с Z оценка за избраното от вас ниво на увереност. Изваждане на този резултат от вашата проба означава да получите долната граница и да я добавите към средната проба, за да намерите горната граница. (Вижте ресурси)

Повторете същия процес, но с т резултат на мястото на Z оценка за по-малки проби (н < 30).

Намерете ниво на достоверност за набор от данни, като вземете половината от размера на доверителен интервал, умножавайки го с квадратния корен на размера на извадката и след това се раздели на стандартното отклонение на извадката. Потърсете полученото Z или т резултат в таблица, за да намерите нивото.

Разликата между ниво на увереност спрямо интервал на увереност

Когато видите цитирана статистика, понякога има диапазон, даден след нея, със съкращението „CI“ (за „доверителен интервал“) или просто символ плюс-минус, последван от цифра. Например, „средното тегло на възрастен мъж е 180 паунда (CI: 178,14 до 181,86)“ или „средното тегло на възрастен мъж е 180 ± 1,86 паунда.“ И двамата ви казват една и съща информация: въз основа на извадката използвано, средното тегло на човек вероятно попада в определен диапазон. Самият диапазон се нарича интервал на доверие.

Ако искате да сте максимално сигурни, че диапазонът съдържа истинската стойност, тогава можете да разширите обхвата. Това би увеличило вашето „ниво на доверие“ в оценката, но обхватът ще покрие повече потенциални тегла. Повечето статистически данни (включително тази, цитирана по-горе) са дадени като 95-процентови интервали на доверие, което означава, че има 95 процента вероятност истинската средна стойност да е в границите. Можете също така да използвате 99-процентно ниво на доверие или 90-процентно ниво на доверие, в зависимост от вашите нужди.

Изчисляване на доверителни интервали или нива за големи проби

Когато използвате ниво на доверие в статистиката, обикновено се нуждаете от него, за да изчислите интервал на доверие. Това е малко по-лесно да направите, ако имате голяма извадка, например над 30 души, защото можете да използвате Z оценка за вашата оценка, а не по-сложна т резултати.

Вземете необработените си данни и изчислете примерната средна стойност (просто добавете отделните резултати и разделете на броя резултати). Изчислява се стандартното отклонение, като се изважда средната стойност от всеки отделен резултат, за да се намери разликата и след това да се квадратира тази разлика. Добавете всички тези разлики и след това разделете резултата на размера на извадката минус 1. Вземете квадратния корен от този резултат, за да намерите стандартното отклонение на извадката (Вижте ресурси).

Определете интервала на доверие, като първо намерите стандартната грешка:

SE = с / √н

Където с е вашето примерно отклонение на пробата и н е вашият размер на пробата Например, ако сте взели проба от 1000 мъже, за да изчислите средната тежест на мъж, и сте получили пробно стандартно отклонение от 30, това ще даде:

SE = 30 / √1000 = 30 / 31.62 = 0.95

За да намерите интервала на доверие от това, потърсете нивото на увереност, за което искате да изчислите интервала в a Z-скалирате таблицата и умножете тази стойност с Z рейтинг. За 95-процентно ниво на доверие, Z-score е 1,96. Използвайки примера, това означава:

Средно ± Z × SE= 180 паунда ± 1,96 × 0,95 = 180 ± 1,86 паунда

Тук ± 1,86 паунда е 95-процентовият доверителен интервал.

Ако вместо това имате малко информация, заедно с размера на извадката и стандартното отклонение, можете да изчислите нивото на доверие, като използвате следната формула:

Z = 0,5 × размер на доверителен интервал × √н / с

Размерът на доверителен интервал е точно два пъти повече от ± стойността, така че в примера по-горе знаем, че 0,5 пъти това е 1,86. Това дава:

Z = 1.86 × √1000 / 30 = 1.96

Това ни дава стойност за Z, което можете да погледнете в Z- таблица за оценка, за да намерите съответното ниво на увереност.

Изчисляване на доверителни интервали за малки проби

За малките проби има подобен процес за изчисляване на доверителния интервал. Първо, извадете 1 от размера на извадката си, за да намерите вашите „степени на свобода“. В символи:

ге = н −1

За проба н = 10, това дава ге = 9.

Намерете алфа стойността си, като извадите десетичната версия на нивото на доверие (т.е. вашето процентно ниво на доверие, разделено на 100) от 1 и разделите резултата на 2, или на символи:

α = (1 - десетично ниво на доверие) / 2

Така че за 95% (0.95) ниво на доверие:

α = (1 – 0.95) / 2 = 0.05 / 2 = 0.025

Потърсете вашата алфа стойност и степени на свобода в (една опашка) т таблица за разпространение и отбележете резултата. Като алтернатива, пропуснете разделението с 2 по-горе и използвайте две опашки т стойност. В този пример резултатът е 2.262.

Както в предишната стъпка, изчислете доверителния интервал, като умножите това число по стандартната грешка, която се определя, като използвате стандартното отклонение на вашата проба и размера на извадката по същия начин. Единствената разлика е, че на мястото на Z резултат, вие използвате т рейтинг.