Съдържание
В статистиката гаусската или нормална дистрибуция се използва за характеризиране на сложни системи с много фактори. Както е описано в Историята на статистиката на Стивън Стиглер, Ейбрахам Де Моивре измисли дистрибуцията, носеща името на Карл Фредрик Гаус. Приносът на Гаус се състои в неговото прилагане на разпределението към подхода с най-малко квадрати, за да се сведе до минимум грешката при приспособяването на данни с най-подходяща линия. По този начин той направи най-важното разпределение на грешките в статистиката.
мотивиране
Какво е разпределението на извадка от данни? Ами ако не знаете базата на разпространението на данните? Има ли някакъв начин да се тестват хипотези за данните, без да се знае основното разпределение? Благодарение на теоремата за централната граница, отговорът е „да“.
Изказване на теоремата
В него се посочва, че средните стойности на извадката от безкрайната популация са приблизително нормални, или гаусови, със средна стойност като основната популация и дисперсия, равна на дисперсията на популацията, разделена на размера на извадката. Приближаването се подобрява с увеличаването на размера на извадката.
Изявлението за приближаване понякога се изкривява неправилно като заключение за конвергенция към нормално разпределение. Тъй като приблизителното нормално разпределение се променя с увеличаване на размера на извадката, такова твърдение е подвеждащо.
Теоремата е разработена от Пиер Саймън Лаплас.
Защо си навсякъде
Нормалните разпределения са вездесъщи. Причината идва от централната гранична теорема. Често, когато се измерва стойност, това е сумарният ефект на много независими променливи. Следователно стойността, която се измерва сама, има примерно средно качество. Например, разпределението на представянията на спортистите може да има звънна форма в резултат на различия в диетата, тренировките, генетиката, коучинг и психология. Дори мъжките височини имат нормално разпределение, като са функция на много биологични фактори.
Гаусски копули
Това, което се нарича „функция на копула“ с гаусска дистрибуция, се появи в новините през 2009 г. поради нейното използване при оценка на риска от инвестиране в обезпечени облигации. Злоупотребата с функцията играе важна роля при финансовата криза през 2008-2009 г. Въпреки че имаше много причини за кризата, в заден план Гауссовите дистрибуции вероятно не би трябвало да се използват. Функция с по-дебела опашка би довела до по-голяма вероятност за неблагоприятни събития.
деривация
Теоремата за централния лимит може да се докаже в много редове, като се анализира функцията за генериране на момент (mgf) на (средна проба - популация средна стойност) /? Приблизителната част на теоремата е въведена чрез разширяване на mgf на основната популация като мощностни серии, след което показва, че повечето термини са незначителни, тъй като размерът на извадката се увеличава.
Това може да бъде доказано в много по-малко редове, като се използва разширение на Тейлър върху характерното уравнение на същата функция и увеличаване на размера на извадката.
Изчислителни удобства
Някои статистически модели предполагат, че грешките са гаусски. Това позволява разпределението на функции на нормални променливи, като хи-квадратното и F-разпределението, да се използва при тестване на хипотези. По-конкретно, при F-теста F статистиката се състои от съотношение на хи-квадратните разпределения, които сами по себе си са функции на нормален параметър на дисперсия. Съотношението на двете причинява отмяната на дисперсията, което позволява тестване на хипотези без познаване на дисперсиите, като се изключи тяхната нормалност и постоянство.