Różnica między eksploracją danych a OLAP

Różnica między eksploracją danych a OLAP
Różnica między eksploracją danych a OLAP

Wideo: Różnica między eksploracją danych a OLAP

Wideo: Różnica między eksploracją danych a OLAP
Wideo: OKULARY POLARYZACYJNE 50 vs 850 PLN | Porównanie (Tanie vs Drogie) - SPRZĘT WĘDKARSKI 2024, Listopad
Anonim

Eksploracja danych a OLAP

Zarówno data mining, jak i OLAP to dwie popularne technologie Business Intelligence (BI). Analiza biznesowa odnosi się do metod komputerowych służących do identyfikowania i wydobywania przydatnych informacji z danych biznesowych. Data mining to dziedzina informatyki, która zajmuje się wydobywaniem interesujących wzorców z dużych zbiorów danych. Łączy w sobie wiele metod od sztucznej inteligencji, statystyki i zarządzania bazami danych. OLAP (przetwarzanie analityczne online), jak sama nazwa wskazuje, jest kompilacją sposobów wyszukiwania wielowymiarowych baz danych.

Eksploracja danych jest również znana jako odkrywanie wiedzy w danych (KDD). Jak wspomniano powyżej, jest to dziedzina informatyki, która zajmuje się wydobywaniem nieznanych wcześniej i interesujących informacji z surowych danych. Ze względu na wykładniczy wzrost danych, zwłaszcza w obszarach takich jak biznes, eksploracja danych stała się bardzo ważnym narzędziem do przekształcania tego ogromnego bogactwa danych w inteligencję biznesową, ponieważ ręczne wyodrębnianie wzorców stało się pozornie niemożliwe w ciągu ostatnich kilku dekad. Na przykład jest obecnie używany do różnych zastosowań, takich jak analiza sieci społecznościowych, wykrywanie oszustw i marketing. Eksploracja danych zwykle zajmuje się następującymi czterema zadaniami: grupowaniem, klasyfikacją, regresją i asocjacją. Klastrowanie polega na identyfikowaniu podobnych grup na podstawie nieustrukturyzowanych danych. Klasyfikacja to zasady uczenia się, które można zastosować do nowych danych i zazwyczaj obejmuje następujące etapy: wstępne przetwarzanie danych, projektowanie modelowania, uczenie się/wybór funkcji oraz ocena/walidacja. Regresja to znajdowanie funkcji z minimalnym błędem w modelowaniu danych. A asocjacja szuka relacji między zmiennymi. Eksploracja danych jest zwykle wykorzystywana do odpowiadania na pytania, takie jak główne produkty, które mogą pomóc w osiągnięciu wysokiego zysku w przyszłym roku w Wal-Mart.

OLAP to klasa systemów, które dostarczają odpowiedzi na zapytania wielowymiarowe. Zazwyczaj OLAP jest używany do marketingu, budżetowania, prognozowania i podobnych zastosowań. Nie trzeba dodawać, że bazy danych używane przez OLAP są skonfigurowane do obsługi złożonych i doraźnych zapytań z myślą o szybkiej wydajności. Zazwyczaj macierz służy do wyświetlania danych wyjściowych OLAP. Wiersze i kolumny są tworzone na podstawie wymiarów zapytania. Często używają metod agregacji na wielu tabelach, aby uzyskać podsumowania. Na przykład, można go wykorzystać, aby dowiedzieć się o tegorocznej sprzedaży w Wal-Marcie w porównaniu do zeszłego roku? Jaka jest prognoza sprzedaży w kolejnym kwartale? Co można powiedzieć o trendzie, patrząc na zmianę procentową?

Chociaż oczywiste jest, że eksploracja danych i OLAP są podobne, ponieważ operują na danych w celu uzyskania informacji, główna różnica wynika z tego, jak operują na danych. Narzędzia OLAP zapewniają wielowymiarową analizę danych i zapewniają podsumowania danych, ale eksploracja danych skupia się na proporcjach, wzorcach i wpływach w zestawie danych. Jest to umowa OLAP z agregacją, która sprowadza się do operacji na danych poprzez „dodawanie”, ale eksploracja danych odpowiada „podziałowi”. Inną godną uwagi różnicą jest to, że podczas gdy narzędzia do eksploracji danych modelują dane i zwracają możliwe do zastosowania reguły, OLAP będzie przeprowadzać techniki porównywania i kontrastowania w wymiarze biznesowym w czasie rzeczywistym.

Zalecana: