Всеки набор от данни, натрупан за статистически цели, като данните от преброяването в САЩ, съдържа информация, която изисква сумиране и обобщаване. Почти невъзможно е да се изброят атрибутите например като индивидуални доходи и семейни размери. Статистиците използват графики за честотно разпределение, за да изобразяват данните изчерпателно. Например, хистограма разделя данните на класови интервали и отчита честотата, при която се появяват всички членове, принадлежащи към този интервал на класа.Въпреки че няма строги правила за изчисляване на размера и броя на интервалите на класа, има някои полезни конвенционални критерии.
Изчислете диапазона от данни, т.е. разликата между най-високите и най-ниските точки на данни. Например, приемете, че най-високо платеното лице в САЩ печели 30 милиарда долара годишно, а най-ниското печели нула. Обхватът е равен на 30 - 0, което се равнява на 30 милиарда долара.
Определете броя на класовете от размера на извадката. Като правило, пет до седем класа се използват за размер на пробата до 50, осем до 10 класове за размер на пробата между 50 и 100, 10 до 15 класове за размер на пробата между 100 и 250 и 15 до 20 класове за размер на извадката по-голям от 250.
Изчислете интервала на класа по следната формула: Клас интервал = обхват ÷ брой класове. Ако имате 15 класа доходи в примера на разпределението на дохода, изработете 30 ÷ 15 = 2 милиарда долара. Често статистиците игнорират изключително високи и ниски цифри и се фокусират върху средните честоти. Поради тази причина разпределението на доходите в САЩ е представено на по-малки интервали от 10 000 щатски долара с доходи, по-големи от определена цифра, обикновено милион, събрани заедно в един класов интервал.
Използвайте своята преценка, когато изчислявате интервал на класа. Свещеният граал на графика като хистограма е да предава съответната информация по смислен и прост начин. Изберете интервалите си за клас, за да предадете информацията, която считате за достойна за читателите.