Regresja a korelacja
W statystyce ważne jest określenie relacji między dwiema zmiennymi losowymi. Daje możliwość przewidywania jednej zmiennej w stosunku do innych. Analiza i korelacja regresji są stosowane w prognozach pogody, zachowaniu rynków finansowych, ustalaniu fizycznych relacji za pomocą eksperymentów oraz w znacznie bardziej rzeczywistych scenariuszach.
Co to jest regresja?
Regresja to metoda statystyczna używana do narysowania relacji między dwiema zmiennymi. Często podczas zbierania danych mogą występować zmienne zależne od innych. Dokładny związek między tymi zmiennymi można ustalić jedynie metodami regresji. Określenie tej relacji pomaga zrozumieć i przewidzieć zachowanie jednej zmiennej w stosunku do drugiej.
Najczęstszym zastosowaniem analizy regresji jest oszacowanie wartości zmiennej zależnej dla danej wartości lub zakresu wartości zmiennych niezależnych. Na przykład za pomocą regresji możemy ustalić relację między ceną towaru a konsumpcją na podstawie danych zebranych z próby losowej. Analiza regresji generuje funkcję regresji zbioru danych, która jest modelem matematycznym najlepiej dopasowanym do dostępnych danych. Można to łatwo przedstawić za pomocą wykresu punktowego. Graficznie regresja jest równoważna znalezieniu najlepiej dopasowanej krzywej dla danego zestawu danych. Funkcją krzywej jest funkcja regresji. Korzystając z modelu matematycznego, można przewidzieć popyt na towar dla danej ceny.
Dlatego analiza regresji jest szeroko stosowana w przewidywaniu i prognozowaniu. Służy również do ustalania relacji w danych eksperymentalnych, w dziedzinie fizyki, chemii oraz wielu dyscyplin nauk przyrodniczych i inżynieryjnych. Jeśli zależność lub funkcja regresji jest funkcją liniową, proces ten nazywa się regresją liniową. Na wykresie punktowym można go przedstawić jako linię prostą. Jeżeli funkcja nie jest kombinacją liniową parametrów, to regresja jest nieliniowa.
Co to jest korelacja?
Korelacja jest miarą siły związku między dwiema zmiennymi. Współczynnik korelacji określa ilościowo stopień zmiany jednej zmiennej na podstawie zmiany drugiej zmiennej. W statystyce korelacja związana jest z pojęciem zależności, która jest statystycznym związkiem między dwiema zmiennymi.
Współczynnik korelacji Pearsona lub po prostu współczynnik korelacji r jest wartością od -1 do 1 (-1≤r≤+1). Jest to najczęściej stosowany współczynnik korelacji i ważny tylko dla liniowej zależności między zmiennymi. Jeśli r=0, to nie ma związku, a jeśli r≥0, relacja jest wprost proporcjonalna; czyli wartość jednej zmiennej rośnie wraz ze wzrostem drugiej. Jeśli r≤0, zależność jest odwrotnie proporcjonalna; tj. jedna zmienna maleje, gdy druga rośnie.
Ze względu na warunek liniowości współczynnik korelacji r może być również użyty do ustalenia obecności liniowej zależności między zmiennymi.
Jaka jest różnica między regresją a korelacją?
Regresja podaje formę związku między dwiema zmiennymi losowymi, a korelacja określa stopień siły związku.
Analiza regresji tworzy funkcję regresji, która pomaga ekstrapolować i przewidywać wyniki, podczas gdy korelacja może dostarczyć tylko informacji o tym, w jakim kierunku może się zmienić.
Bardziej dokładne modele regresji liniowej są podane w analizie, jeśli współczynnik korelacji jest wyższy. (|r|≥0,8)