Съдържание
- Тип I грешка: неправилно отхвърляне на нулевата хипотеза
- Грешка тип II: Неправилно отхвърляне на алтернативната хипотеза
- Определяне на нивото на значимост
- Избор на тест за значимост
Статистическата значимост е обективен показател за това дали резултатите от изследването са математически „реални“ и статистически обосновани, а не просто случайно настъпване. Често използваните тестове за значимост търсят различия в средствата от масиви от данни или различия във вариациите на наборите от данни. Типът тест, който се прилага, зависи от типа на данните, които се анализират. От изследователите зависи да определят колко значителни изискват те да бъдат резултатите - с други думи, колко риск са готови да поемат, за да сгрешат. Обикновено изследователите са готови да приемат ниво на риск от 5 процента.
Тип I грешка: неправилно отхвърляне на нулевата хипотеза
••• Scott Rothstein / iStock / Getty ImagesЕкспериментите се провеждат за тестване на конкретни хипотези или експериментални въпроси с очакван резултат. Нулева хипотеза е тази, която не открива разлика между двата набора данни, които се сравняват. Например в медицинско проучване, нулевата хипотеза може да бъде, че няма разлика в подобрението между пациентите, получаващи изследваното лекарство, и пациентите, получаващи плацебо. Ако изследователят погрешно отхвърли тази нулева хипотеза, когато в действителност е истина, с други думи, ако те „открият“ разлика между двата групи пациенти, когато наистина няма разлика, тогава те са допуснали грешка от тип I.Изследователите предварително определят какъв риск от извършване на грешка от тип I са готови да приемат. Този риск се основава на максимална p-стойност, която ще приемат преди отхвърляне на нулевата хипотеза, и се нарича алфа.
Грешка тип II: Неправилно отхвърляне на алтернативната хипотеза
Алтернативна хипотеза е тази, която открива разлика между двата набора данни, които се сравняват. В случай на медицинското изпитване бихте очаквали да видите различни нива на подобрения при пациенти, получаващи изследваното лекарство, и пациенти, получаващи плацебо. Ако изследователите не успеят да отхвърлят нулевата хипотеза, когато трябва, с други думи, ако „открият“ няма разлика между двата набора пациенти, когато наистина е имало разлика, тогава те са допуснали грешка от тип II.
Определяне на нивото на значимост
Когато изследователите извършват тест със статистическа значимост и получената p-стойност е по-ниска от нивото на риска, считано за приемливо, тогава резултатът от теста се счита за статистически значим. В този случай нулевата хипотеза - хипотезата, че няма разлика между двете групи, се отхвърля. С други думи, резултатите показват, че има разлика в подобрението между пациентите, получаващи изследваното лекарство, и пациентите, получаващи плацебо.
Избор на тест за значимост
Има няколко различни статистически тестове, от които да избирате. Стандартен t-тест сравнява средствата от два набора от данни, като нашите данни за изследваното лекарство и нашите данни за плацебо. Сдвоен t-тест се използва за откриване на разлики в един и същ набор от данни, като например преди и след изследване. Еднопосочният анализ на вариацията (ANOVA) може да сравни средствата от три или повече набора от данни, а двупосочен ANOVA сравнява средствата от два или повече набора от данни в отговор на две различни независими променливи, като различни силни стойности на проучване на наркотици. Линейна регресия сравнява средствата от наборите от данни по градиент на лечение или време. Всеки статистически тест ще доведе до значимост или алфа, които могат да бъдат използвани за интерпретация на резултатите от теста.