Съдържание
- Типът на необходимите данни
- Тестът за годност
- Изчисляване на статистиката на Chi-Square
- Тълкуване на статистиката на Chi-Square
Прогнози за тестове на експерименти. Тези прогнози често са числени, което означава, че докато учените събират данни, те очакват числата да се разпаднат по определен начин. Данните от реалния свят рядко съвпадат точно с прогнозите, които правят учените, така че учените се нуждаят от тест, за да им кажат дали разликата между наблюдаваните и очакваните числа е поради случаен шанс или поради някакъв непредвиден фактор, който ще принуди учения да коригира основната теория , Хи-квадратният тест е статистически инструмент, който учените използват за тази цел.
Типът на необходимите данни
Имате нужда от категорични данни, за да използвате хи-квадрат тест. Пример за категорични данни е броят на хората, отговорили на въпрос „да“ спрямо броя на хората, отговорили на въпроса „не“ (две категории), или броя на жабите в популация, която е зелена, жълта или сива ( три категории). Не можете да използвате хи-квадрат тест за непрекъснати данни, като например може да бъде събран от анкета, питаща хората колко са високи. От такова проучване бихте получили широк спектър от височини. Ако обаче разделите височините на категории като "под 6 фута висок" и "6 фута висок и повече", тогава можете да използвате тест-квадрат на данните.
Тестът за годност
Тестът за добро прилягане е често срещан и може би най-простият тест, извършен с помощта на статистиката на хи-квадрат. В тест за добро приспособяване ученият прави конкретно прогнозиране за числата, които очаква да види във всяка категория от своите данни. След това тя събира данни от реалния свят - наречени наблюдавани данни - и използва хи-квадратния тест, за да види дали наблюдаваните данни отговарят на нейните очаквания.
Например, представете си, че биолог изучава моделите на наследяване при вид на жаба. Сред 100 потомства на набор от родители на жаби, генетичният модел на биолозите я кара да очаква 25 жълто потомство, 50 зелено потомство и 25 сиво потомство. Това, което тя всъщност наблюдава, е 20 жълти потомства, 52 зелени потомства и 28 сиви потомства. Подкрепя ли се нейното прогнозиране или нейният генетичен модел е неправилен? Тя може да използва тест на чи-квадрат, за да разбере.
Изчисляване на статистиката на Chi-Square
Започнете да изчислявате статистиката на хи-квадрата, като изваждате всяка очаквана стойност от съответната наблюдавана стойност и сравнявате всеки резултат. Изчислението за примера на жабешкото потомство ще изглежда така:
жълто = (20 - 25) ^ 2 = 25 зелено = (52 - 50) ^ 2 = 4 сиво = (28 - 25) ^ 2 = 9
Сега разделете всеки резултат по съответната очаквана стойност.
жълто = 25 ÷ 25 = 1 зелено = 4 ÷ 50 = 0,08 сиво = 9 ÷ 25 = 0,36
Накрая добавете заедно отговорите от предишната стъпка.
чи-квадрат = 1 + 0,08 + 0,36 = 1,44
Тълкуване на статистиката на Chi-Square
Статистиката chi-square ви показва колко различни са били наблюдаваните от вас прогнозирани стойности. Колкото по-голямо е числото, толкова по-голяма е разликата. Можете да определите дали стойността на вашият чи-квадрат е твърде висока или достатъчно ниска, за да подкрепи прогнозата ви, като видите дали е под определена критична стойност върху таблица за разпределение на хи-квадрат. Тази таблица съвпада с чи-квадратните стойности с вероятности, наречени р-стойности, По-конкретно, таблицата ви показва вероятността разликите между наблюдаваните и очакваните стойности да се дължат просто на случаен шанс или на наличието на някакъв друг фактор. За тест за годност, ако p-стойността е 0,05 или по-малка, трябва да отхвърлите прогнозата си.
Трябва да определите степени на свобода (df) във вашите данни, преди да можете да потърсите критичната стойност на чи-квадрат в таблица за разпространение. Степените на свобода се изчисляват, като се извади 1 от броя категории във вашите данни. В този пример има три категории, така че има 2 степени на свобода. Един поглед към тази таблица за разпределение на чи-квадрат ви казва, че при 2 степени на свобода критичната стойност за вероятността 0,05 е 5,99. Това означава, че докато изчислената стойност на квадратна чи е по-малка от 5,99, очакваните от вас стойности и по този начин базисната теория са валидни и подкрепени. Тъй като статистиката на хи-квадрата за данните от потомството на жабите е 1,44, биологът може да приеме нейния генетичен модел.