Съдържание
- TL; DR (Твърде дълго; Не четях)
- Точки за поръчка на данни
- Определете първата четвъртична позиция
- Определете третата четвъртична позиция
- Изчислете интерквартирен обхват
- Предимства и недостатъци на IQR
Интерквартилният диапазон, често съкратено като IQR, представлява диапазона от 25-ти перцентил до 75-ия перцентил или средния 50 процента от всеки даден набор от данни. Интерквартилният диапазон може да се използва, за да се определи какъв би бил средният диапазон на ефективността на един тест: можете да го използвате, за да видите къде падат повечето хора при определен тест или да определите колко пари прави средният служител във фирма всеки месец , Интерквартилният диапазон може да бъде по-ефективен инструмент за анализ на данни от средната или средната стойност на набор от данни, тъй като ви позволява да идентифицирате диапазона на дисперсия, а не само едно число.
TL; DR (Твърде дълго; Не четях)
Интерквартилният диапазон (IQR) представлява средните 50 процента от набор от данни. За да го изчислите, първо подредете вашите данни от най-малко до най-голямо, а след това определете първите си и третите четвърти позиции, като използвате съответно формулите (N + 1) / 4 и 3 * (N + 1) / 4, където N е числото от точки в набора от данни. И накрая, извадете първия кватил от третия четвърт, за да определите интерквартилния диапазон за набора от данни.
Точки за поръчка на данни
Изчисляването на интерквартирен обхват е проста задача, но преди да изчислите, ще трябва да подредите различните точки от набора от данни. За да направите това, започнете с подреждането на вашите данни от най-малко до най-големи. Например, ако вашите данни са били 10, 19, 8, 4, 9, 12, 15, 11 и 20, вие бихте ги пренаредили така: {4, 8, 9, 10, 11, 12, 15, 19, 20}. След като вашите данни са подредени по този начин, можете да преминете към следващата стъпка.
Определете първата четвъртична позиция
На следващо място, определете позицията на първия квартил, като използвате следната формула: (N + 1) / 4, където N е броят точки в набора от данни. Ако първият кватил попада между две числа, вземете средната стойност на двете числа като първа оценка за четвъртицата. В горния пример, тъй като има девет точки от данни, трябва да добавите 1 до 9, за да получите 10, и след това да разделите на 4, за да получите 2.5. Тъй като първият квантил попада между втората и третата стойност, бихте взели средното 8 и 9, за да получите първа четворна позиция от 8.5.
Определете третата четвъртична позиция
След като определите първия си квантил, определете позицията на третия кватил по следната формула: 3 * (N + 1) / 4, където N отново е броят точки в набора от данни. По същия начин, ако третата четвъртина попада между две числа, просто вземете средната стойност, както бихте направили при изчисляването на първия резултат от четвъртицата. В горния пример, тъй като има девет точки от данни, бихте добавили 1 до 9, за да получите 10, умножете по 3, за да получите 30 и след това разделите на 4, за да получите 7,5. Тъй като първият квантил пада между седмата и осмата стойност, бихте взели средното 15 и 19, за да получите трета четворна оценка от 17.
Изчислете интерквартирен обхват
След като определите първия и третия си квантил, изчислете интерквартилния диапазон, като извадите стойността на първия квантил от стойността на третия кватил. За да завършите примера, използван по време на тази статия, трябва да извадите 8.5 от 17, за да откриете, че интерквартилният диапазон от набора от данни е равен на 8,5.
Предимства и недостатъци на IQR
Интеркуртиалният диапазон има предимство в това, че е в състояние да идентифицира и елиминира остатъците от двата края на набор данни. IQR също е добра мярка за промяна в случаите на изкривено разпределение на данни и този метод за изчисляване на IQR може да работи за групирани набори от данни, стига да използвате кумулативно честотно разпределение, за да организирате вашите точки от данни. Формулата на интерквартилния диапазон за групирани данни е същата като при негрупираните данни, като IQR е равен на стойността на първия квантил, изваден от стойността на третия четвърт. Въпреки това той има няколко недостатъка в сравнение със стандартното отклонение: по-малка чувствителност към няколко крайни резултати и стабилност на извадката, която не е толкова силна, колкото стандартното отклонение.