Što je Gaussova distribucija?

Posted on
Autor: Louise Ward
Datum Stvaranja: 11 Veljača 2021
Datum Ažuriranja: 19 Studeni 2024
Anonim
Normalna raspodjela (distribucija). Gaussova krivulja. Primjer u Excelu.
Video: Normalna raspodjela (distribucija). Gaussova krivulja. Primjer u Excelu.

Sadržaj

U statistici se Gaussova, ili normalna, distribucija koristi za karakterizaciju složenih sustava s mnogim čimbenicima. Kao što je opisano u Povijesti statistike Stephena Stiglera, Abraham De Moivre izumio je distribuciju koja nosi ime Karla Fredricka Gausa. Gausov doprinos nalazio se u njegovoj primjeni distribucije na pristup najmanjih kvadrata kako bi se minimizirala pogreška u prilagođavanju podataka linijom koja najbolje odgovara. Time je učinio najvažniju distribuciju pogrešaka u statistici.


Motivacija

Kakva je distribucija uzorka podataka? Što ako ne znate distribuciju podataka na kojoj se temelji? Postoji li neki način testiranja hipoteza o podacima bez poznavanja temeljne distribucije? Zahvaljujući teoremi o središnjoj granici, odgovor je da.

Izjava teorema

Kaže da je vrijednost uzorka iz beskonačne populacije približno normalna, ili gausova, s srednjom vrijednosti jednakom osnovnoj populaciji i varijancom jednakom varijanci populacije podijeljenoj s veličinom uzorka. Približavanje se poboljšava kako veličina uzorka postaje velika.

Izjava aproksimacije ponekad se pogrešno prikazuje kao zaključak o konvergenciji u normalnu distribuciju. Budući da se približna normalna raspodjela mijenja kako se veličina uzorka povećava, takva je izjava pogrešna.

Teoremu je razvio Pierre Simon Laplace.

Zašto svuda

Normalne raspodjele su sveprisutne. Razlog dolazi iz teorema o središnjoj granici. Često, kad se mjeri vrijednost, to je zbrojni učinak mnogih neovisnih varijabli. Stoga, vrijednost koja se mjeri sama ima kvalitetu uzoraka. Na primjer, distribucija performansi sportaša može imati zvonasti oblik, kao rezultat razlika u prehrani, treningu, genetici, treniranju i psihologiji. Čak i muške visine imaju normalnu raspodjelu, što je funkcija mnogih bioloških čimbenika.


Gaussian Copulas

Ono što se naziva "funkcija kopule" s Gaussovom raspodjelom bilo je u vijestima 2009. godine zbog njegove upotrebe u procjeni rizika ulaganja u kolateralizirane obveznice. Zlouporaba funkcije bila je presudna u financijskoj krizi 2008.-2009. Iako je bilo mnogo uzroka krize, unazad, Gaussova distribucija vjerojatno se ne bi trebala koristiti. Funkcija s debljim repom dala bi veću vjerojatnost štetnim događajima.

derivacija

Teorem o središnjoj granici može se dokazati u mnogim crtama analizom funkcije generiranja trenutka (mgf) (prosječna vrijednost uzorka - populacija) /? (Varijanca populacije / veličina uzorka) kao funkcija mgf osnovne populacije. Približni dio teoreme uveden je širenjem mgf temeljne populacije kao energetskog niza, a zatim je prikazano da je većina pojmova beznačajna kako veličina uzorka postaje veća.

To se može dokazati u daleko manje crta pomoću Taylorove ekspanzije na karakterističnoj jednadžbi iste funkcije i uvećanja veličine uzorka.


Računalna pogodnost

Neki statistički modeli pretpostavljaju da su pogreške bile Gaussove. To omogućuje raspodjelu funkcija normalnih varijabli, poput hi-kvadratne i F-distribucije, koja se koristi u ispitivanju hipoteza. Konkretno, u F-testu se F statistika sastoji od omjera hi-kvadratnih raspodjela, koje su same funkcije parametra normalne varijance. Omjer dviju varijanti uzrokuje otkazivanje varijance što omogućava testiranje hipoteza bez znanja o varijanci osim njihove normalnosti i postojanosti.