Kluczowa różnica między klasyfikacją a drzewem regresji polega na tym, że w klasyfikacji zmienne zależne są jakościowe i nieuporządkowane, podczas gdy w regresji zmienne zależne są ciągłymi lub uporządkowanymi wartościami całkowitymi.
Klasyfikacja i regresja to techniki uczenia się służące do tworzenia modeli predykcji na podstawie zebranych danych. Obie techniki są przedstawione graficznie jako drzewa klasyfikacji i regresji, a raczej schematy blokowe z podziałami danych po każdym kroku, a raczej „gałęzi” w drzewie. Ten proces nazywa się partycjonowaniem rekurencyjnym. Dziedziny takie jak górnictwo wykorzystują te techniki uczenia klasyfikacji i regresji. Ten artykuł koncentruje się na drzewie klasyfikacji i drzewie regresji.
Co to jest klasyfikacja?
Klasyfikacja to technika używana do uzyskania schematu, który pokazuje organizację danych, zaczynając od zmiennej prekursora. Zmienne zależne są tym, co klasyfikuje dane.
Rysunek 01: Eksploracja danych
Drzewo klasyfikacyjne zaczyna się od zmiennej niezależnej, która rozgałęzia się na dwie grupy zgodnie z istniejącymi zmiennymi zależnymi. Ma to na celu wyjaśnienie odpowiedzi w formie kategoryzacji wywołanej przez zmienne zależne.
Co to jest regresja
Regresja to metoda przewidywania oparta na założonej lub znanej liczbowej wartości wyjściowej. Ta wartość wyjściowa jest wynikiem serii rekurencyjnego partycjonowania, przy czym każdy krok ma jedną wartość liczbową i inną grupę zmiennych zależnych, które rozgałęziają się do innej pary, takiej jak ta.
Drzewo regresji zaczyna się od jednej lub więcej zmiennych prekursorów i kończy się jedną końcową zmienną wyjściową. Zmienne zależne są albo ciągłymi, albo dyskretnymi zmiennymi liczbowymi.
Jaka jest różnica między klasyfikacją a regresją?
Klasyfikacja a regresja |
|
Model drzewa, w którym zmienna docelowa może przyjmować dyskretny zestaw wartości. | Model drzewa, w którym zmienna docelowa może przyjmować wartości ciągłe, zazwyczaj liczby rzeczywiste. |
Zmienna zależna | |
Dla drzewa klasyfikacyjnego zmienne zależne są kategorialne. | Dla drzewa regresji zmienne zależne są liczbowe. |
Wartości | |
Ma określoną ilość nieuporządkowanych wartości. | Ma albo wartości dyskretne, ale uporządkowane, albo wartości niedyskretne. |
Cel budowy | |
Celem konstruowania drzewa regresji jest dopasowanie systemu regresji do każdej gałęzi determinanty w taki sposób, aby pojawiła się oczekiwana wartość wyjściowa. | Drzewo klasyfikacyjne rozgałęzia się zgodnie ze zmienną zależną wyprowadzoną z poprzedniego węzła. |
Podsumowanie – Klasyfikacja a regresja
Drzewa regresji i klasyfikacji są pomocnymi technikami mapowania procesu, który wskazuje na badany wynik, niezależnie od tego, czy chodzi o klasyfikację, czy o pojedynczą wartość liczbową. Różnica między drzewem klasyfikacyjnym a drzewem regresji jest ich zmienną zależną. Drzewa klasyfikacyjne mają zmienne zależne, które są kategoryczne i nieuporządkowane. Drzewa regresji mają zmienne zależne, które są wartościami ciągłymi lub uporządkowanymi wartościami całkowitymi.