Zawsze, gdy chcę nauczyć się czegoś nowego, to w głowie pojawia się PUSTKA.

Od czego zacząć? Co będzie dobre na start? Gdy zaczynam rozglądać się w danym temacie, to zwracam uwagę na najczęściej pojawiające się słowa kluczowe. Doskonale nadaje się do tego celu zasada Pareto, czyli popularne 80/20.

W myśl tej zasady uznaję, że około 20% pojęć da mi 80% zrozumienia tematu. Dlatego zrobiłem listę 7 słów kluczowych, które pozwoliły mi zrozumieć, czym faktycznie jest uczenie maszynowe.

7 SŁÓW KLUCZOWYCH

  1. MODEL – zbiór wzorców lub prawidłowości powstałych w procesie uczenia maszynowego
  2. ALGORYTM UCZĄCY – specyficzny proces uczenia maszynowego wykorzystywany do trenowania modelu
  3. DANE UCZĄCE – zbiór danych, którymi algorytm trenuje model
  4. DANE TESTOWE – nowy zbiór danych służący do oceny wydajności modelu
  5. ATRYBUTY – kolumny w zbiorze danych wykorzystywane do trenowania modelu
  6. ZMIENNE CELOWE – zmienne, które chcemy przewidywać
  7. PRÓBKI – wiersze w zbiorze danych odzwierciedlające konkretne elementy.

PRZYKŁAD PRAKTYCZNY

Aby lepiej zrozumieć powyższe pojęcia, posłużymy się fikcyjnym przykładem:

Prezentacja słów kluczowych na bazie zbioru danych.
Zbiór danych z cenami mieszkań na rynku pierwotnym. Źródło: Opracowanie własne.

Powyżej mamy zbiór składający się z danych o 200 mieszkaniach. Chcemy przewidywać ich ceny w zależności od: powierzchni, piętra i ulicy.

W powyższym zbiorze według słów kluczowych jest:

  • 200 próbek (200 mieszkań)
  • 1 zmienna celowa (CENA)
  • 3 atrybuty (POWIERZCHNIA, PIETRO, ULICA)
  • Zbiór 200 próbek moglibyśmy podzielić na dwa podzbiory:
    • 160 próbek jako dane uczące do trenowania modelu
    • 40 próbek jako dane testowe do weryfikowania wydajności modelu.

PODSUMOWANIE

W tym poście pokazałem 7 słów kluczowych, bo to one były moim punktem wyjścia do uczenia maszynowego. Ustawiły właściwy kontekst. Sprawiły, że dalsza nauka stała się łatwiejsza a temat uczenia maszynowego bardziej oswojony.