Kako testirati Chi-kvadrat

Posted on
Autor: Judy Howell
Datum Stvaranja: 4 Srpanj 2021
Datum Ažuriranja: 14 Studeni 2024
Anonim
23. Testiranje stat.nezavisnosti dveju kategoričkih varijabli hi-kvadrat testom u programu SPSS
Video: 23. Testiranje stat.nezavisnosti dveju kategoričkih varijabli hi-kvadrat testom u programu SPSS

Sadržaj

Predviđanja ispitivanja eksperimenta. Ova predviđanja često su brojčana, što znači da, kako znanstvenici prikupljaju podatke, očekuju da se brojke na određeni način sruše. Podaci iz stvarnog svijeta rijetko se podudaraju s točno predviđanjima koja znanstvenici daju, pa znanstvenicima treba test koji će im reći je li razlika između promatranih i očekivanih brojeva zbog slučajnih slučajnosti ili zbog nekog nepredviđenog faktora koji će prisiliti znanstvenika da prilagodi temeljnu teoriju , Chi-kvadrat test je statistički alat koji znanstvenici koriste u tu svrhu.


Vrsta potrebnih podataka

Za upotrebu hi-kvadrat testa trebaju vam kategorični podaci. Primjer kategorijskih podataka je broj ljudi koji su odgovorili na pitanje "da" u odnosu na broj ljudi koji su odgovorili na pitanje "ne" (dvije kategorije), ili broj žaba u populaciji koja je zelena, žuta ili siva ( tri kategorije). Ne možete upotrebljavati hi-kvadrat test za kontinuirane podatke, poput onih koji se mogu prikupiti iz ankete i pitati ljude koliko su visoki. Iz takvog istraživanja dobili biste široki raspon visina. Međutim, ako podijelite visine u kategorije kao što su "ispod 6 stopa i 6 i više stopa", tada možete upotrijebiti test hi-kvadrat na podacima.

Ispitivanje ispravnosti

Ispitivanje ispravnosti odgovara uobičajenom, a možda i najjednostavnijem testu provedenom pomoću statistike hi-kvadrata. Znanstvenim testom u skladu s odgovarajućim testom predviđa brojeve koje očekuje u svakoj kategoriji svojih podataka. Zatim prikuplja podatke iz stvarnog svijeta - koji se nazivaju promatrani podaci - i koristi test chi-kvadratom da vidi podudaraju li promatrani podaci s njezinim očekivanjima.


Na primjer, zamislite da biolog proučava uzorke nasljeđivanja u vrsti žabe. Među 100 potomaka roditelja žaba, genetski model biologa navodi je da očekuje 25 žutih potomaka, 50 zelenih potomaka i 25 sivih potomaka. Ono što ona zapravo primjećuje je 20 žutih potomaka, 52 zelenog potomstva i 28 sivih potomaka. Podržava li njezino predviđanje ili je njezin genetski model netočan? Ona može koristiti test chi-kvadrat kako bi to saznala.

Izračunavanje statistike Chi-Square

Započnite izračunavanje statistike hi-kvadrata oduzimanjem svake očekivane vrijednosti od odgovarajuće promatrane vrijednosti i uspoređivanjem svakog rezultata. Izračun za primjer žabljeg potomstva izgledao bi ovako:

žuta = (20 - 25) ^ 2 = 25 zelena = (52 - 50) ^ 2 = 4 siva = (28 - 25) ^ 2 = 9

Sada podijelite svaki rezultat s njegovom odgovarajućom očekivanom vrijednošću.

žuta = 25 ÷ 25 = 1 zelena = 4 ÷ 50 = 0,08 siva = 9 ÷ 25 = 0,36

Na kraju, zbrojite odgovore iz prethodnog koraka.


chi-kvadrat = 1 + 0,08 + 0,36 = 1,44

Tumačenje statistike Chi-Squarea

Statistika hi-kvadrata govori o tome koliko su promatrane vrijednosti bile različite od vaših predviđenih vrijednosti. Što je broj veći, to je veća i razlika. Možete utvrditi je li vrijednost vašeg hi-kvadrat previsoka ili dovoljno niska da podrži vaše predviđanje uvidom je li ispod određene kritična vrijednost na tablici raspodjele Chi-kvadrat. Ta se tablica podudara s vrijednostima Chi-kvadrat-a s vjerojatnostima p-vrijednosti, Tablica vam prikazuje vjerojatnost da su razlike između promatranih i očekivanih vrijednosti jednostavno slučajne slučajnosti ili je li prisutan neki drugi faktor. Ako je test ispravnosti usklađen, ako je p vrijednost 0,05 ili manja, tada morate odbiti svoje predviđanje.

Morate odrediti stupnjevi slobode (df) u vašim podacima prije nego što potražite kritičnu vrijednost chi-kvadrat u distribucijskoj tablici. Stupnjevi slobode izračunavaju se oduzimanjem 1 od broja kategorija u vašim podacima. U ovom primjeru postoje tri kategorije, tako da postoje 2 stupnja slobode. Pogled u tablicu raspodjele hi-kvadrat govori vam da je za 2 stupnja slobode kritična vrijednost za 0,05 vjerojatnosti 5,99. To znači da ako su izračunate vrijednosti hi-kvadrata manje od 5,99, vaše očekivane vrijednosti, a time i osnovna teorija, vrijede i podržavaju ih. Budući da je statistički podatak o kvadratnim podacima za potomstvo žaba iznosio 1,44, biolog može prihvatiti njezin genetski model.