Kako izračunati MSE

Posted on
Autor: Lewis Jackson
Datum Stvaranja: 14 Svibanj 2021
Datum Ažuriranja: 12 Svibanj 2024
Anonim
Machine Learning with Python! Mean Squared Error (MSE)
Video: Machine Learning with Python! Mean Squared Error (MSE)

Sadržaj

Kada znanstvenici, ekonomisti ili statističari predviđaju na temelju teorije i zatim prikupe stvarne podatke, potreban im je način za mjerenje varijacija između predviđenih i izmjerenih vrijednosti. Obično se oslanjaju na srednju kvadratnu pogrešku (MSE), koja je zbroj varijacija pojedinih podatkovnih točaka u kvadratu i podijeljeno s brojem podatkovnih točaka minus 2. Kada su podaci prikazani na grafu, MSE određujete prema zbrajanje varijacija podataka u okomitim osovinama. Na x-y grafu to bi bile y-vrijednosti.


Zašto trgovati varijacije?

Množenje varijacija između predviđenih i promatranih vrijednosti ima dva poželjna učinka. Prvo je osigurati da su sve vrijednosti pozitivne. Ako su jedna ili više vrijednosti negativne, zbroj svih vrijednosti mogao bi biti nerealno mali i loš prikaz stvarne varijacije između predviđenih i promatranih vrijednosti. Druga prednost kvadrata je davanje veće težine većim razlikama, što osigurava da velika vrijednost za MSE označava velike varijacije podataka.

Algoritam uzorka uzorka

Pretpostavimo da imate algoritam koji svakodnevno predviđa cijene pojedinih dionica. U ponedjeljak predviđa da će cijena dionica biti 5,50 USD, u utorak 6,00 USD, srijeda 6,00 USD, četvrtak 7,50 USD i petak 8,00 USD. Smatrajući ponedjeljak danom 1, imate skup podataka koji se prikazuju ovako: (1, 5,50), (2, 6,00), (3, 6,00), (4, 7,50) i (5, 8,00). Stvarne cijene su sljedeće: ponedjeljak 4,75 dolara (1, 4,75); Utorak 5,35 USD (2, 5,35); Srijeda 6,25 dolara (3, 6,25); Četvrtak 7,25 USD (4, 7,25); i petak: 8,50 USD (5, 8,50).


Varijacije između y-vrijednosti ovih točaka su 0,75, 0,65, -0,25, 0,25 i -0,50, pri čemu negativni znak ukazuje na predviđenu vrijednost manju od promatrane. Da biste izračunali MSE, prvo uvrštavate svaku vrijednost varijacije, što eliminira znakove minus i daje 0.5625, 0.4225, 0.0625, 0.0625 i 0.25. Zbir ovih vrijednosti daje 1,36, a dijeljenjem broja mjerenja minus 2, koji je 3, dobiva se MSE, koji se ispostavlja 0,45.

MSE i RMSE

Manje vrijednosti za MSE ukazuju na bliži dogovor između predviđenih i promatranih rezultata, a MSE od 0,0 ukazuje na savršen slaganje. Važno je, međutim, zapamtiti da su vrijednosti varijacija u kvadratu. Kada je potrebno mjerenje pogreške koja se nalazi u istim jedinicama kao i podatkovne točke, statističari uzimaju korijensku srednju kvadratnu pogrešku (RMSE). Oni to dobivaju uzimanjem kvadratnog korijena srednje kvadratne pogreške. Za gornji primjer, RSME bi iznosio 0,671 ili oko 67 centi.