Odchylenie standardowe a średnia
W statystyce opisowej i inferencyjnej używa się kilku wskaźników do opisania zbioru danych odpowiadającego jego centralnej tendencji, rozproszeniu i skośności. We wnioskowaniu statystycznym są one powszechnie znane jako estymatory, ponieważ szacują wartości parametrów populacji.
Centralna tendencja odnosi się i lokalizuje centrum rozkładu wartości. Średnia, moda i mediana są najczęściej używanymi wskaźnikami do opisu centralnej tendencji zbioru danych. Dyspersja to ilość rozprzestrzenionych danych z centrum dystrybucji. Najczęściej stosowanymi miarami dyspersji są zakres i odchylenie standardowe. Do opisu skośności rozkładu danych wykorzystuje się współczynniki skośności Pearsona. Tutaj skośność odnosi się do tego, czy zestaw danych jest symetryczny względem środka, czy nie, a jeśli nie, jak jest pochylony.
Co to znaczy?
Mean jest najczęściej używanym wskaźnikiem tendencji centralnej. Biorąc pod uwagę zestaw danych, średnią oblicza się, biorąc sumę wszystkich wartości danych, a następnie dzieląc ją przez liczbę danych. Na przykład waga 10 osób (w kilogramach) jest mierzona jako 70, 62, 65, 72, 80, 70, 63, 72, 77 i 79. Wtedy średnia waga dziesięciu osób (w kilogramach) może być obliczone w następujący sposób. Suma wag wynosi 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Średnia=(suma) / (liczba danych)=710 / 10=71 (w kilogramach).
Podobnie jak w tym konkretnym przykładzie, średnia wartość zbioru danych może nie być punktem danych zbioru, ale będzie unikalna dla danego zbioru danych. Średnia będzie miała te same jednostki, co oryginalne dane. Dlatego może być zaznaczony na tej samej osi co dane i może być używany w porównaniach. Nie ma również ograniczenia znaku dla średniej zbioru danych. Może być ujemna, zerowa lub dodatnia, ponieważ suma zbioru danych może być ujemna, zerowa lub dodatnia.
Co to jest odchylenie standardowe?
Odchylenie standardowe to najczęściej używany wskaźnik dyspersji. Aby obliczyć odchylenie standardowe, najpierw obliczane są odchylenia wartości danych od średniej. Średnia kwadratowa odchyleń nazywana jest odchyleniem standardowym.
W poprzednim przykładzie odpowiednie odchylenia od średniej wynoszą (70 – 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 i (79-71)=8. Suma kwadratów odchylenia wynosi (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. Odchylenie standardowe wynosi √(366/10)=6,05 (w kilogramach). Na tej podstawie można wywnioskować, że większość danych mieści się w przedziale 71±6.05, pod warunkiem, że zestaw danych nie jest bardzo przekrzywiony, i rzeczywiście tak jest w tym konkretnym przykładzie.
Ponieważ odchylenie standardowe ma takie same jednostki jak oryginalne dane, daje nam miarę odchylenia danych od środka; większe odchylenie standardowe większe rozproszenie. Ponadto odchylenie standardowe będzie wartością nieujemną, niezależnie od charakteru danych w zestawie danych.
Jaka jest różnica między odchyleniem standardowym a średnią?
• Odchylenie standardowe jest miarą rozproszenia od środka, podczas gdy średnia mierzy położenie środka zbioru danych.
• Odchylenie standardowe jest zawsze wartością nieujemną, ale średnia może przyjąć dowolną wartość rzeczywistą.