Próbka a populacja
Populacja i próba to dwa ważne terminy w temacie „Statystyka”. Mówiąc prościej, populacja jest największym zbiorem elementów, którymi jesteśmy zainteresowani badaniem, a próba jest podzbiorem populacji. Innymi słowy, próba powinna reprezentować populację z mniejszą, ale wystarczającą liczbą pozycji. Jedna populacja może mieć kilka próbek o różnych rozmiarach.
Próbka
Próbka może składać się z dwóch lub więcej pozycji wybranych z populacji. Najniższa możliwa wielkość próbki to dwa, a największa równałaby się wielkości populacji. Istnieje kilka sposobów na wybranie próbki z populacji. Teoretycznie wybór „próby losowej” jest najlepszym sposobem na uzyskanie dokładnych wniosków na temat populacji. Próbki tego typu są również nazywane próbkami prawdopodobieństwa, ponieważ każda pozycja w populacji ma równe szanse na uwzględnienie w próbie.
Technika „Proste losowe pobieranie próbek” jest najbardziej znaną techniką losowego pobierania próbek. W tym przypadku pozycje do wyboru do próby wybierane są losowo z populacji. Taka próbka nazywana jest „prostą próbką losową” lub SRS. Inną popularną techniką jest „systematyczne pobieranie próbek”. W takim przypadku pozycje do próby są wybierane na podstawie określonej kolejności systematycznej.
Przykład: Co dziesiąta osoba w kolejce jest wybierana do próbki.
W tym przypadku porządek systematyczny to co dziesiąta osoba. Statystyk może dowolnie zdefiniować ten porządek w sensowny sposób. Istnieją inne techniki losowego doboru próby, takie jak próbkowanie grupowe lub próbkowanie warstwowe, a metody selekcji różnią się nieco od dwóch powyższych.
W celach praktycznych można użyć próbek nielosowych, takich jak próbki wygodne, próbki oceny, próbki kuli śnieżnej i próbki celowe. Co więcej, przedmioty wybrane do nielosowych próbek odnoszą się do przypadku. W rzeczywistości żadna jednostka populacji nie ma równych szans na uwzględnienie w próbach nielosowych. Tego typu próbki są również nazywane próbkami bez prawdopodobieństwa.
Populacja
Każdy zbiór jednostek, które są interesujące do zbadania, jest po prostu definiowany jako „populacja”. Populacja jest podstawą dla próbek. Dowolny zbiór obiektów we wszechświecie może być populacją na podstawie deklaracji studiów. Ogólnie rzecz biorąc, populacja powinna być stosunkowo duża i trudno wywnioskować pewne cechy, rozważając poszczególne jej elementy. Pomiary, które mają być badane w populacji, nazywane są parametrami. W praktyce parametry są szacowane za pomocą statystyk, które są odpowiednimi pomiarami próbki.
Przykład: Podczas szacowania średniej oceny z matematyki 30 uczniów w klasie na podstawie średniej oceny z matematyki 5 uczniów, parametr to Średnia ocena z matematyki w klasie. Statystyka to średnia ocena z matematyki dla 5 uczniów.
Próbka a populacja
Interesujący związek między próbą a populacją polega na tym, że populacja może istnieć bez próbki, ale próbka może nie istnieć bez populacji. Ten argument dalej dowodzi, że próba zależy od populacji, ale co ciekawe, większość wniosków dotyczących populacji zależy od próby. Głównym celem próbki jest jak najdokładniejsze oszacowanie lub wywnioskowanie niektórych pomiarów populacji. Wyższą dokładność można wywnioskować z ogólnego wyniku uzyskanego z kilku próbek tej samej populacji, a nie z jednej próbki. Kolejną ważną rzeczą, o której należy wiedzieć, jest to, że wybierając więcej niż jedną próbkę z populacji, jedna pozycja może być również uwzględniona w innej próbce. Ten przypadek jest znany jako „próbki z zamiennikami”. Co więcej, zainwestowanie odpowiednich pomiarów populacji z próbki i uzyskanie prawie podobnych wyników jest doskonałą okazją do zaoszczędzenia kosztów i wartości czasu.
Ważne jest, aby wiedzieć, że wraz ze wzrostem wielkości próby zwiększa się również dokładność oszacowania parametru populacji. Logicznie, w celu uzyskania lepszych szacunków dla populacji, wielkość próby nie powinna być zbyt mała. Ponadto należy również uznać, że próbki losowe mają lepsze szacunki. Dlatego ważne jest, aby zwrócić uwagę na wielkość i losowość próby, aby była reprezentatywna, aby uzyskać najlepsze oszacowania dla populacji.