Wykres słupkowy a histogram
W statystykach ważne jest podsumowanie i prezentacja danych. Można to zrobić numerycznie za pomocą miar opisowych lub graficznie za pomocą wykresów kołowych, wykresów słupkowych i wielu innych metod reprezentacji graficznej.
Co to jest wykres słupkowy?
Wykres słupkowy to jedna z głównych metod reprezentacji graficznej w statystyce. Służy do wyświetlania różnych wartości danych jakościowych na osi poziomej oraz względnych częstotliwości (lub częstotliwości lub procentów) tych wartości na osi pionowej. Słupek, którego wysokość/długość jest proporcjonalna do względnej częstotliwości, reprezentuje każdą odrębną wartość, a słupki są umieszczone w taki sposób, aby się nie stykały. Wykres słupkowy z powyższą konfiguracją jest najbardziej powszechny i jest znany jako pionowy wykres słupkowy lub wykres kolumnowy. Ale możliwa jest również zamiana osi; w takim przypadku paski są poziome.
Wykres słupkowy został po raz pierwszy użyty w książce Williama Playfaira „The Commercial and Political Atlas” z 1786 roku. Od tego czasu wykres słupkowy stał się jednym z najważniejszych narzędzi do reprezentowania danych kategorycznych. Korzystanie z wykresów słupkowych można rozszerzyć, aby reprezentować bardziej złożone dane kategoryczne, takie jak zmienne rozwijające się w czasie (odpowiedź na wybory), dane pogrupowane i inne.
Co to jest histogram?
Histogram to kolejna ważna graficzna reprezentacja danych, którą można uznać za rozwinięcie wykresu słupkowego. Na histogramie klasy danych ilościowych są wyświetlane na osi poziomej, a częstotliwość (lub względna częstotliwość lub procenty) klas są wyświetlane na osi y. Pionowa kreska zwykle reprezentuje częstotliwość (lub częstotliwość względną lub procenty) klasy, której wysokość jest równa jej wielkości. W przeciwieństwie do zwykłych wykresów słupkowych, słupki są ustawione tak, aby stykały się ze sobą.
Zmienna na osi X może być zgrupowana z pojedynczą wartością lub zgrupowana z limitem. W przypadku grupowania z jedną wartością do oznaczenia słupków używane są odrębne wartości obserwacji, przy czym każda taka wartość jest wyśrodkowana poniżej słupka. W przypadku grupowania granic lub grupowania punktów cięcia do etykietowania prętów używane są granice niższej klasy (lub równoważnie punkty cięcia niższej klasy). Można również użyć znaków klasowych lub punktów środkowych klas wyśrodkowanych pod kreskami.
Jedna z głównych różnic dotyczy zmiennej używanej na osi X. Na histogramie zmienna jest zmienną ilościową i może być ciągła lub dyskretna. I może być używany do reprezentowania informacji o gęstości w zestawach danych. W tym przypadku odstępy użyte na osi x mogą się różnić od siebie, a na osi y zaznaczona jest gęstość częstotliwości. Jeśli odstęp osi X wynosi 1, histogram jest równy wykresowi częstotliwości względnej.
Jaka jest różnica między wykresem słupkowym a histogramem?
• Przede wszystkim histogram jest rozwinięciem wykresu słupkowego, ale nie jest identyczny z wykresem słupkowym. Histogramy są rodzajem wykresów słupkowych, ale wykresy słupkowe zdecydowanie nie są histogramami.
• Wykresy słupkowe służą do wykreślania danych kategorycznych lub jakościowych, podczas gdy histogramy służą do wykreślania danych ilościowych z zakresami danych pogrupowanymi w przedziały lub przedziały.
• Wykresy słupkowe służą do porównywania zmiennych, a histogramy służą do przedstawiania rozkładów zmiennych
• Wykresy słupkowe zawierają odstępy między dwoma słupkami, podczas gdy histogramy nie zawierają odstępów między słupkami. (Powodem jest to, że oś x na wykresach słupkowych jest dyskretnymi wartościami kategorialnymi, podczas gdy na histogramach jest to dyskretna lub ciągła ilościowa).
• Histogramy służą do zilustrowania gęstości zmiennej w przedziałach; w tym przypadku obszar słupka reprezentuje częstotliwość zmiennej.