Odchylenie a odchylenie standardowe
Odchylenie a odchylenie standardowe
W statystyce opisowej i inferencyjnej używa się kilku wskaźników do opisania zbioru danych odpowiadającego jego centralnej tendencji, rozproszeniu i skośności. We wnioskowaniu statystycznym są one powszechnie znane jako estymatory, ponieważ szacują wartości parametrów populacji.
Rozproszenie to miara rozproszenia danych w centrum zbioru danych. Odchylenie standardowe jest jedną z najczęściej stosowanych miar dyspersji. Odchylenia każdego punktu danych od średniej są brane pod uwagę przy obliczaniu odchylenia standardowego. Stąd można argumentować, że odchylenie standardowe wraz ze średnią zapewni prawie wystarczający obraz zbioru danych.
Rozważ następujący zestaw danych. Wagi 10 osób (w kilogramach) są mierzone jako 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Wtedy średnia waga dziesięciu osób (w kilogramach) wynosi 71 (w kilogramach).).
Co to jest odchylenie?
W statystyce odchylenie oznacza wielkość, o jaką pojedynczy punkt danych różni się od wartości stałej, takiej jak średnia. Ogólnie rzecz biorąc, niech k będzie wartością stałą, a x1, x2, …, xn oznaczają dane ustawić. Następnie odchylenie xj od k jest zdefiniowane jako (xj– k).
Na przykład w powyższym zestawie danych odpowiednie odchylenia od średniej wynoszą (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 i (79 – 71)=8.
Co to jest odchylenie standardowe?
Gdy można uwzględnić dane z całej populacji (np. w przypadku spisu), możliwe jest obliczenie odchylenia standardowego populacji. Aby obliczyć odchylenie standardowe populacji, najpierw obliczane są odchylenia wartości danych od średniej populacji. Średnia kwadratowa (średnia kwadratowa) odchyleń nazywana jest odchyleniem standardowym populacji. W symbolach σ=√{ ∑(xi-µ)2 / n} gdzie µ to średnia populacji, a n to wielkość populacji.
Gdy dane z próbki (o rozmiarze n) są używane do oszacowania parametrów populacji, obliczane jest odchylenie standardowe próbki. Najpierw obliczane są odchylenia wartości danych od średniej próbki. Ponieważ średnia z próby jest używana zamiast średniej populacji (która jest nieznana), przyjmowanie średniej kwadratowej nie jest właściwe. Aby skompensować użycie średniej z próby, sumę kwadratów odchyleń dzieli się przez (n-1) zamiast przez n. Odchylenie standardowe próbki to pierwiastek kwadratowy z tego. W symbolach matematycznych S=√{ ∑(xi-ẍ)2 / (n-1)}, gdzie S jest odchyleniem standardowym próbki, ẍ to średnia próbki, a xi to punkty danych.
W poprzednim zestawie danych suma kwadratów odchyleń wynosi (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1) 2 + (-8)2 + 12 + 62 + 82=366. Zatem odchylenie standardowe populacji wynosi √(366/10)=6,05 (w kilogramach). (Zakładając, że rozważana populacja składa się z 10 osób, od których pobrano dane).
Jaka jest różnica między odchyleniem a odchyleniem standardowym?
• Odchylenie standardowe jest wskaźnikiem statystycznym i estymatorem, ale odchylenie nie jest.
• Odchylenie standardowe jest miarą rozproszenia klastra danych od centrum, podczas gdy odchylenie odnosi się do ilości, o jaką pojedynczy punkt danych różni się od wartości stałej.