Povezanost između dvije varijable opisuje vjerojatnost da će promjena jedne varijable uzrokovati proporcionalnu promjenu u drugoj varijabli. Velika povezanost dviju varijabli sugerira da imaju zajednički uzrok ili je promjena jedne od varijabli izravno odgovorna za promjenu druge varijable. Pearsons r vrijednost koristi se za kvantificiranje korelacije između dvije diskretne varijable.
Označite varijablu za koju vjerujete da uzrokuje promjenu druge varijable kao x (neovisna varijabla) i drugu varijablu y (ovisna varijabla).
Konstruirajte tablicu s pet stupaca i onoliko redova koliko postoje podatkovne točke za x i y. Označite stupce A do E s lijeva na desno.
U svakom retku popunite sljedeće vrijednosti za svaku (x, y) podatkovnu točku u prvom stupcu - vrijednost x u stupcu A, vrijednost x u stupcu B, vrijednost y u stupcu C, vrijednost y u stupcu C, vrijednost od y kvadratno u stupcu D, a vrijednost x puta y u stupcu E.
Napravite završni redak na samom dnu tablice i stavite zbroj svih vrijednosti svakog stupca u odgovarajuću ćeliju.
Izračunajte produkt konačnih stanica u stupcima A i C.
Pomnožite konačnu ćeliju u stupcu E s brojem podataka.
Oduzmite vrijednost dobivenu u koraku 5 od vrijednosti dobivene u koraku 6 i podvucite odgovor.
Pomnožite konačnu ćeliju stupca B s brojem podataka. Odšteti od ove vrijednosti kvadrat vrijednosti konačne ćelije stupca A.
Pomnožite konačnu ćeliju stupca D s brojem podataka i oduzmite kvadrat vrijednosti konačne ćelije stupca C.
Vrijednosti pronađene u koracima 8 i 9 pomnožite zajedno, a zatim uzmite kvadratni korijen rezultata.
Vrijednost dobivenu u koraku 7 (treba je podvući) podijelite s vrijednošću dobivenom u koraku 10. To je Pearsons r, također poznat kao koeficijent korelacije. Ako je r blizu 1, postoji jaka pozitivna povezanost. Ako je r blizu -1, postoji jaka negativna povezanost. Ako je r blizu 0, postoji slaba korelacija.