Różnica między nadzorowanym i nienadzorowanym uczeniem maszynowym

Spisu treści:

Różnica między nadzorowanym i nienadzorowanym uczeniem maszynowym
Różnica między nadzorowanym i nienadzorowanym uczeniem maszynowym

Wideo: Różnica między nadzorowanym i nienadzorowanym uczeniem maszynowym

Wideo: Różnica między nadzorowanym i nienadzorowanym uczeniem maszynowym
Wideo: Zrozumieć AI: Jak działa uczenie maszynowe zastosowane w ChatGPT? 2024, Listopad
Anonim

Kluczowa różnica – nadzorowane i nienadzorowane uczenie maszynowe

Nadzorowane uczenie się i uczenie nienadzorowane to dwie podstawowe koncepcje uczenia maszynowego. Uczenie nadzorowane to zadanie uczenia maszynowego polegające na uczeniu funkcji, która odwzorowuje dane wejściowe na dane wyjściowe na podstawie przykładowych par wejście-wyjście. Uczenie nienadzorowane to zadanie uczenia maszynowego polegające na wywnioskowaniu funkcji opisującej ukrytą strukturę z danych nieoznaczonych. Kluczowa różnica między uczeniem maszynowym nadzorowanym i nienadzorowanym polega na tym, że uczenie nadzorowane wykorzystuje dane oznaczone etykietami, podczas gdy uczenie nienadzorowane wykorzystuje dane nieoznaczone.

Uczenie maszynowe to dziedzina informatyki, która umożliwia systemowi komputerowemu uczenie się na podstawie danych bez wyraźnego programowania. Pozwala na analizę danych i przewidywanie w nich wzorców. Istnieje wiele zastosowań uczenia maszynowego. Niektóre z nich to rozpoznawanie twarzy, rozpoznawanie gestów i rozpoznawanie mowy. Istnieją różne algorytmy związane z uczeniem maszynowym. Niektóre z nich to regresja, klasyfikacja i klasteryzacja. Najpopularniejszymi językami programowania do tworzenia aplikacji opartych na uczeniu maszynowym są R i Python. Można również używać innych języków, takich jak Java, C++ i Matlab.

Co to jest nadzorowane uczenie się?

W systemach opartych na uczeniu maszynowym model działa zgodnie z algorytmem. W uczeniu nadzorowanym model jest nadzorowany. Po pierwsze, wymagane jest wytrenowanie modelu. Dzięki zdobytej wiedzy potrafi przewidywać odpowiedzi na przyszłe instancje. Model jest trenowany przy użyciu oznaczonego zestawu danych. Gdy do systemu zostaną podane dane spoza próbki, system może przewidzieć wynik. Poniżej znajduje się mały fragment popularnego zbioru danych IRIS.

Różnica między uczeniem nadzorowanym i nienadzorowanym_Rysunek 02
Różnica między uczeniem nadzorowanym i nienadzorowanym_Rysunek 02

Zgodnie z powyższą tabelą, długość działki, szerokość działki, długość działki, szerokość działki i gatunek są nazywane atrybutami. Kolumny są nazywane funkcjami. Jeden wiersz zawiera dane dla wszystkich atrybutów. Dlatego jeden wiersz nazywa się obserwacją. Dane mogą być liczbowe lub kategoryczne. Model otrzymuje obserwacje z odpowiednią nazwą gatunku jako dane wejściowe. Gdy pojawia się nowa obserwacja, model powinien przewidywać rodzaj gatunku, do którego należy.

W uczeniu nadzorowanym istnieją algorytmy klasyfikacji i regresji. Klasyfikacja to proces klasyfikacji oznakowanych danych. Model stworzył granice oddzielające kategorie danych. Gdy do modelu dostarczane są nowe dane, można go kategoryzować na podstawie tego, gdzie istnieje punkt. K-Nearest Neighbors (KNN) to model klasyfikacji. W zależności od wartości k, decyduje kategoria. Na przykład, gdy k wynosi 5, jeśli konkretny punkt danych znajduje się w pobliżu ośmiu punktów danych w kategorii A i sześciu punktów danych w kategorii B, wówczas punkt danych zostanie sklasyfikowany jako A.

Regresja to proces przewidywania trendu poprzednich danych w celu przewidzenia wyniku nowych danych. W regresji wynik może składać się z jednej lub większej liczby zmiennych ciągłych. Przewidywanie odbywa się za pomocą linii, która obejmuje większość punktów danych. Najprostszym modelem regresji jest regresja liniowa. Jest szybki i nie wymaga strojenia parametrów takich jak w KNN. Jeżeli dane wykazują trend paraboliczny, wówczas model regresji liniowej nie jest odpowiedni.

Różnica między uczeniem nadzorowanym i nienadzorowanym
Różnica między uczeniem nadzorowanym i nienadzorowanym

To są przykłady algorytmów uczenia nadzorowanego. Ogólnie rzecz biorąc, wyniki generowane z nadzorowanych metod uczenia się są dokładniejsze i bardziej wiarygodne, ponieważ dane wejściowe są dobrze znane i oznakowane. Dlatego maszyna musi analizować tylko ukryte wzory.

Co to jest nauka nienadzorowana?

W uczeniu nienadzorowanym model nie jest nadzorowany. Model działa samodzielnie, aby przewidzieć wyniki. Wykorzystuje algorytmy uczenia maszynowego, aby wyciągać wnioski na temat nieoznakowanych danych. Ogólnie rzecz biorąc, algorytmy uczenia nienadzorowanego są trudniejsze niż algorytmy uczenia nadzorowanego, ponieważ jest niewiele informacji. Klastrowanie to rodzaj uczenia się nienadzorowanego. Może służyć do grupowania nieznanych danych za pomocą algorytmów. K-średnia i klastrowanie oparte na gęstości to dwa algorytmy klastrowania.

Algorytm k-średniej umieszcza losowo k centroid dla każdego klastra. Następnie każdy punkt danych jest przypisywany do najbliższego centroidu. Odległość euklidesowa służy do obliczania odległości od punktu danych do centroidu. Punkty danych są podzielone na grupy. Pozycje dla k centroidów są ponownie obliczane. Nowa pozycja centroidu jest określana przez średnią wszystkich punktów w grupie. Ponownie każdy punkt danych jest przypisany do najbliższego centroidu. Ten proces powtarza się, aż centroidy przestaną się zmieniać. k-średnia to szybki algorytm klastrowania, ale nie ma określonej inicjalizacji punktów klastrowania. Ponadto istnieje duża zmienność modeli klastrowania opartych na inicjalizacji punktów klastrowych.

Innym algorytmem klastrowania jest klastrowanie oparte na gęstości. Jest również znany jako aplikacje do klastrowania przestrzennego oparte na gęstości z szumem. Działa poprzez zdefiniowanie klastra jako maksymalnego zestawu punktów połączonych gęstością. Są to dwa parametry używane do klastrowania opartego na gęstości. Są to Ɛ (epsilon) i minimalne punkty. Ɛ to maksymalny promień sąsiedztwa. Minimalne punkty to minimalna liczba punktów w sąsiedztwie Ɛ do zdefiniowania klastra. Oto kilka przykładów klastrowania, które należy do uczenia się bez nadzoru.

Ogólnie rzecz biorąc, wyniki generowane przez nienadzorowane algorytmy uczenia się nie są zbyt dokładne i wiarygodne, ponieważ maszyna musi zdefiniować i oznaczyć dane wejściowe przed określeniem ukrytych wzorców i funkcji.

Jakie jest podobieństwo między nadzorowanym i nienadzorowanym uczeniem maszynowym?

Zarówno uczenie nadzorowane, jak i nienadzorowane to rodzaje uczenia maszynowego

Jaka jest różnica między nadzorowanym a nienadzorowanym uczeniem maszynowym?

Nadzorowane a nienadzorowane uczenie maszynowe

Nadzorowane uczenie to zadanie uczenia maszynowego polegające na nauce funkcji, która mapuje wejście na wyjście na podstawie przykładowych par wejście-wyjście. Uczenie nienadzorowane to zadanie uczenia maszynowego polegające na wywnioskowaniu funkcji opisującej ukrytą strukturę z danych nieoznaczonych.
Główna funkcjonalność
W nadzorowanym uczeniu się model przewiduje wynik na podstawie oznaczonych danych wejściowych. W nienadzorowanym uczeniu się model przewiduje wynik bez oznaczonych danych, samodzielnie identyfikując wzorce.
Dokładność wyników
Wyniki generowane przez nadzorowane metody uczenia się są dokładniejsze i bardziej wiarygodne. Wyniki wygenerowane przez nienadzorowane metody uczenia się nie są zbyt dokładne i wiarygodne.
Główne algorytmy
Istnieją algorytmy regresji i klasyfikacji w uczeniu nadzorowanym. Istnieją algorytmy do grupowania w uczeniu nienadzorowanym.

Podsumowanie – nadzorowane i nienadzorowane uczenie maszynowe

Nadzorowane uczenie i nienadzorowane uczenie to dwa rodzaje uczenia maszynowego. Uczenie nadzorowane to zadanie uczenia maszynowego polegające na uczeniu funkcji, która odwzorowuje dane wejściowe na dane wyjściowe na podstawie przykładowych par dane wejściowe-wyjściowe. Uczenie nienadzorowane to zadanie uczenia maszynowego polegające na wywnioskowaniu funkcji opisującej ukrytą strukturę z danych nieoznaczonych. Różnica między nadzorowanym i nienadzorowanym uczeniem maszynowym polega na tym, że nadzorowane uczenie wykorzystuje dane oznaczone etykietami, podczas gdy uczenie nienadzorowane wykorzystuje dane nieoznaczone.

Zalecana: