Правилният размер на извадката е важно съображение за тези, които извършват проучвания. Ако размерът на извадката е твърде малък, получените извадкови данни няма да бъдат точно отражение на данните, които са представителни за популацията. Ако размерът на извадката е твърде голям, проучването ще бъде твърде скъпо и отнема много време. Например, ако целта на вашето проучване беше да откриете средната възраст на жените в Съединените щати, би било непрактично да питате всяка жена на нейната възраст.
Определянето на размера на извадката изисква да определите желаното ниво на увереност и нивото на грешка, което ще търпите, и че или знаете, или имате оценка на стандартното отклонение на параметъра на популацията, което се опитвате да определите.
Определете нивото на грешка, което ще търпите. Изберете стойност, която ще даде резултат, който е под 5 процента от параметъра на популацията, който се опитвате да оцените. Имайте предвид, че колкото по-високо ниво на грешка се понася, толкова по-малко значими са резултатите от вашето проучване.
Помислете за ситуация, в която трябва да намерите средната възраст на жените (параметър за населението) в Съединените щати. Първо направете оценка на средната възраст на жените. За тази оценка използвайте предишно проучване и след това умножете това число по 0,05, за да намерите грешката.
Ако няма налично проучване, приблизително преценете средната възраст на жените сами. За тази оценка вземете данни с 10 различни собствени проучвания, които имат размер на извадка от 31 жени. За всяко проучване изчислете средната възраст за 31 жени. След това се изчислява средната стойност на средствата за всички изследвания. Използвайте това число като оценка на средната възраст за жените. След това умножете това число по 0,05, за да получите грешката. Ако средната стойност на получените средства за вашите проучвания е била 40, умножете 0,05 (5 процента) пъти 40, за да получите 2.Така че, изберете грешката, която ще търпите да бъде до две години.
Запишете това число; ще го използвате за изчисляване на размера на пробата. Ако използвате 2 за грешката за изчислението на извадката си, вашето проучване ще доведе до точен резултат в рамките на две години от действителната средна възраст на жените от населението. Не забравяйте, че колкото по-малка е грешката, толкова по-голям ще бъде размерът на извадката.
Определете нивото на увереност, което искате да използвате. Изберете ниво на доверие от 90, 95 или 99 процента. Използвайте по-високо ниво на увереност, ако искате да увеличите вероятността резултатите от вашето извадково проучване да бъдат в рамките на допустимите грешки, изчислени в предишната стъпка. Не забравяйте, че колкото по-високо ниво на увереност изберете, толкова по-голям ще бъде размерът на извадката.
Определете критичната стойност за дадения интервал на доверие. За ниво на доверие от 90 процента използвайте критична стойност от 1.645. За 90-процентов доверителен интервал използвайте критична стойност 1,960, а за ниво на доверие 99 процента използвайте критична стойност 2,575. Запишете това число; ще го използвате за изчисляване на размера на пробата.
След това разберете стандартното отклонение за параметъра на популацията, който се опитвате да оцените с вашето проучване. Използвайте стандартното отклонение на параметъра на популацията, даден в проблема, или преценете стандартното отклонение. Ако не е дадено, използвайте стандартното отклонение от подобно изследване. Ако не е налице нито едно от двете, приблизително изчислете стандартно отклонение, така че да бъде приблизително 34 процента от населението.
За примера, посочен в стъпка 1, приемете, че 20 години е едно стандартно отклонение. За средна възраст на 40 години това би означавало, че 68 процента от жените в населението се изчисляват на възраст между 20 и 60 години.
Изчислете размера на пробата. Първо умножете критичната стойност със стандартното отклонение. След това разделете този резултат на грешката от стъпка 1. Сега квадрат този резултат. Този резултат е размерът на извадката.
За проблем, който използва доверителен интервал от 90 процента (критична стойност от 1.645), посочва грешка в рамките на две години и дава стандартно отклонение на популацията от 20 години, първо умножете 1.645 по 20, за да получите 32.9. Разделете 32.9 на 2, за да получите 16.45. Квадрат 16.45 за получаване на 270.6. Закръглете до следващото най-голямо цяло число, за да получите размер на пробата 271.
Посочете условията за резултатите от вашето проучване. Например в стъпка 1, с размер на извадката 271, можете да сте 90 процента уверени, че средната стойност на извадката от 271 жени ще бъде в рамките на две години от реалната средна стойност за общото женско население. Така че, ако вашето проучване доведе до средна възраст от 43 години, можете да установите, че има 90 процента вероятност средната възраст на населението на жените в Съединените щати да бъде между 42 и 44 години.