Różnica między wariancją a kowariancją

Różnica między wariancją a kowariancją
Różnica między wariancją a kowariancją

Wideo: Różnica między wariancją a kowariancją

Wideo: Różnica między wariancją a kowariancją
Wideo: Rozkład normalny / Normal distribution - Damian Sojka, ADAMED SmartUP 2024, Listopad
Anonim

Wariancja a kowariancja

Wariancja i kowariancja to dwie miary używane w statystyce. Wariancja jest miarą rozrzutu danych, a kowariancja wskazuje stopień zmiany dwóch zmiennych losowych razem. Wariancja jest raczej intuicyjną koncepcją, ale kowariancja jest zdefiniowana matematycznie w niezbyt intuicyjny sposób.

Więcej o wariancji

Wariancja jest miarą rozproszenia danych od średniej wartości rozkładu. Mówi, jak daleko punkty danych leżą od średniej rozkładu. Jest to jeden z podstawowych deskryptorów rozkładu prawdopodobieństwa i jeden z momentów rozkładu. Również wariancja jest parametrem populacji, a wariancja próbki z populacji działa jako estymator wariancji populacji. Z jednej perspektywy jest definiowany jako kwadrat odchylenia standardowego.

W prostym języku można to opisać jako średnią kwadratów odległości między każdym punktem danych a średnią rozkładu. Poniższy wzór służy do obliczenia wariancji.

Var(X)=E[(X-µ)2] dla populacji oraz

Var(X)=E[(X-‾x)2] dla próbki

Można jeszcze bardziej uprościć, dając Var(X)=E[X2]-(E[X])2.

Wariancja ma pewne właściwości podpisu i często jest używana w statystykach, aby uprościć użycie. Wariancja nie jest ujemna, ponieważ jest kwadratem odległości. Jednak zakres wariancji nie jest ograniczony i zależy od konkretnego rozkładu. Wariancja stałej zmiennej losowej wynosi zero, a wariancja nie zmienia się względem parametru lokalizacji.

Więcej o kowariancji

W teorii statystycznej kowariancja jest miarą tego, jak bardzo dwie zmienne losowe zmieniają się razem. Innymi słowy, kowariancja jest miarą siły korelacji między dwiema zmiennymi losowymi. Można to również uznać za uogólnienie pojęcia wariancji dwóch zmiennych losowych.

Kowariancja dwóch zmiennych losowych X i Y, które są wspólnie rozłożone ze skończonym drugim pędem, jest znana jako σXY=E[(X-E[X])(Y-E[T])]. Na tej podstawie wariancję można postrzegać jako szczególny przypadek kowariancji, w którym dwie zmienne są takie same. Cov(X, X)=Var(X)

Normalizując kowariancję, można uzyskać współczynnik korelacji liniowej lub współczynnik korelacji Pearsona, który jest zdefiniowany jako ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )

Graficznie, kowariancja między parą punktów danych może być postrzegana jako obszar prostokąta z punktami danych na przeciwległych wierzchołkach. Można to interpretować jako miarę wielkości separacji między dwoma punktami danych. Biorąc pod uwagę prostokąty dla całej populacji, nakładanie się prostokątów odpowiadających wszystkim punktom danych można uznać za siłę separacji; wariancja dwóch zmiennych. Kowariancja występuje w dwóch wymiarach, ze względu na dwie zmienne, ale uproszczenie jej do jednej zmiennej daje wariancję pojedynczej jako separację w jednym wymiarze.

Jaka jest różnica między wariancją a kowariancją?

• Wariancja jest miarą rozrzutu/rozproszenia w populacji, podczas gdy kowariancja jest uważana za miarę zmienności dwóch zmiennych losowych lub siły korelacji.

• Wariancję można uznać za szczególny przypadek kowariancji.

• Wariancja i kowariancja są zależne od wielkości wartości danych i nie mogą być porównywane; dlatego są znormalizowane. Kowariancja jest normalizowana do współczynnika korelacji (dzielona przez iloczyn odchyleń standardowych dwóch zmiennych losowych), a wariancja jest normalizowana do odchylenia standardowego (wyciągając pierwiastek kwadratowy)

Zalecana: