Zmienne losowe a rozkład prawdopodobieństwa
Eksperymenty statystyczne to eksperymenty losowe, które można powtarzać w nieskończoność ze znanym zestawem wyników. Z takimi eksperymentami związane są zarówno zmienne losowe, jak i rozkłady prawdopodobieństwa. Z każdą zmienną losową związany jest rozkład prawdopodobieństwa zdefiniowany przez funkcję zwaną funkcją dystrybucji skumulowanej.
Co to jest zmienna losowa?
Zmienna losowa to funkcja, która przypisuje wartości liczbowe wynikom eksperymentu statystycznego. Innymi słowy, jest to funkcja zdefiniowana z przestrzeni próbki eksperymentu statystycznego do zbioru liczb rzeczywistych.
Rozważmy na przykład losowy eksperyment polegający na dwukrotnym rzuceniu monetą. Możliwe wyniki to HH, HT, TH i TT (H – głowy, T – opowieści). Niech zmienna X będzie liczbą głów obserwowanych w eksperymencie. Wtedy X może przyjmować wartości 0, 1 lub 2 i jest zmienną losową. Tutaj zmienna losowa X mapuje zbiór S={HH, HT, TH, TT} (przestrzeń próbki) na zbiór {0, 1, 2} w taki sposób, że HH jest mapowane na 2, HT i TH są mapowane na 1, a TT jest mapowane na 0. W notacji funkcji można to zapisać jako: X: S → R gdzie X(HH)=2, X(HT)=1, X(TH)=1 i X(TT)=0.
Istnieją dwa typy zmiennych losowych: dyskretne i ciągłe, w związku z czym liczba możliwych wartości, jakie może przyjąć zmienna losowa, jest co najwyżej policzalna lub nie. W poprzednim przykładzie zmienna losowa X jest dyskretną zmienną losową, ponieważ {0, 1, 2} jest zbiorem skończonym. Rozważmy teraz eksperyment statystyczny polegający na znalezieniu wag uczniów w klasie. Niech Y będzie zmienną losową zdefiniowaną jako waga ucznia. Y może przyjąć dowolną wartość rzeczywistą w określonym przedziale. Stąd Y jest ciągłą zmienną losową.
Co to jest rozkład prawdopodobieństwa?
Rozkład prawdopodobieństwa to funkcja, która opisuje prawdopodobieństwo, że zmienna losowa przyjmie określone wartości.
Funkcja zwana dystrybuantą (F) może być zdefiniowana ze zbioru liczb rzeczywistych do zbioru liczb rzeczywistych jako F(x)=P(X ≤ x) (prawdopodobieństwo, że X będzie mniejsze niż lub równy x) dla każdego możliwego wyniku x. Teraz dystrybuantę X w pierwszym przykładzie można zapisać jako F(a)=0, jeśli a<0; F(a)=0,25, jeśli 0≤a<1; F(a)=0,75, jeśli 1≤a<2 i F(a)=1, jeśli a≥2.
W przypadku dyskretnych zmiennych losowych funkcję można zdefiniować ze zbioru możliwych wyników do zbioru liczb rzeczywistych w taki sposób, że ƒ(x)=P(X=x) (prawdopodobieństwo X równe x) dla każdego możliwego wyniku x. Ta konkretna funkcja ƒ nazywana jest funkcją masy prawdopodobieństwa zmiennej losowej X. Teraz funkcję masy prawdopodobieństwa X w pierwszym konkretnym przykładzie można zapisać jako ƒ(0)=0,25, ƒ(1)=0,5, ƒ(2)=0,25 i ƒ(x)=0 w przeciwnym razie. Zatem funkcja masy prawdopodobieństwa wraz z funkcją skumulowanego rozkładu opiszą rozkład prawdopodobieństwa X w pierwszym przykładzie.
W przypadku ciągłych zmiennych losowych funkcję zwaną funkcją gęstości prawdopodobieństwa (ƒ) można zdefiniować jako ƒ(x)=dF(x)/dx dla każdego x, gdzie F jest skumulowaną funkcją rozkładu ciągła zmienna losowa. Łatwo zauważyć, że funkcja ta spełnia ∫ƒ(x)dx=1. Funkcja gęstości prawdopodobieństwa wraz z funkcją rozkładu skumulowanego opisuje rozkład prawdopodobieństwa ciągłej zmiennej losowej. Na przykład rozkład normalny (który jest ciągłym rozkładem prawdopodobieństwa) jest opisany za pomocą funkcji gęstości prawdopodobieństwa ƒ(x)=1/√(2πσ2) e^([(x- µ)]2/(2σ2)).
Jaka jest różnica między zmiennymi losowymi a rozkładem prawdopodobieństwa?
• Zmienna losowa to funkcja, która wiąże wartości przestrzeni próbki z liczbą rzeczywistą.
• Rozkład prawdopodobieństwa to funkcja, która łączy wartości, które zmienna losowa może przyjąć z odpowiednim prawdopodobieństwem wystąpienia.