Za srebrny mur,
Księżyca Gór,
W Dolinę Cieniów bladą,
goń, śmiało goń –
a znajdziesz Eldorado!

Edgar Allan Poe

Czasami trafia się na takie miejsca, które z pozoru okazują się zwyczajne. Stojąc jednak chwilę w jednym miejscu i rozglądając się dookoła, nagle zaczyna się dostrzegać jego piękno.

Tak było w moim przypadku gdy trafiłem na Kaggle. Platformę do rywalizacji Data Science. Na początku byłem przytłoczony ogromem bogactwa. Postanowiłem jednak rozgościć się na chwilę i rozejrzeć po okolicy. Może i Ty odnajdziesz tutaj swoje skarby.

Czym dokładnie jest Kaggle?

Miejscem, gdzie odbywają się swojego rodzaju zawody. Problemy, które należy rozwiązać, publikują różnego rodzaju organizacje, firmy nawet instytucje rządowe. Cała zabawa polega na tym, aby wziąć udział w zawodach, wykorzystać dostarczone dane i używając preferowanego narzędzia rozwiązać dany problem. Liczy się innowacyjność rozwiązania i otrzymany wynik, który plasuje nas na określonej pozycji w rankingu. Cała zabawa polega oczywiście na wspinaniu się na sam szczyt.

Zapomniałem dodać, że za wygranie niektórych zawodów są spore sumy pieniędzy.

Poniżej kilka przykładowych płatnych zawodów (Competitions):

ranking płatnych zawodów
Niezłe sumki za wygraną 🙂

Dlaczego warto tu być?

Dla niektórych pieniądze ze wygrane zawody mogą być wystarczającym powodem. Dla mnie Kaggle okazał się idealnym miejscem do zdobycia praktycznych umiejętności.

W tym miejscu mamy wszystko to, czego potrzebujemy:

  • kursy wprowadzające w tematykę Data Science, wykorzystania Pythona, Wizualizacji, Uczenia Maszynowego itd
  • gotowe skrypty innych użytkowników, gdzie można krok po kroku prześledzić, jak inni rozwiązują pewne problemy i z jakich algorytmów korzystają
  • wysokiej jakości dane, gotowe do wykorzystania w swoich projektach. Sam w moim kursie korzystałem z danych o graczach z gry FIFA 2020
  • gotowe środowisko programistyczne, gdzie nie musimy niczego instalować i od ręki możemy tworzyć własne projekty.

Od czego zacząć?

Wszystko zależy od naszego poziomu doświadczenia i umiejętności. Warto po rejestracji przyjrzeć się darmowym kursom. Dla zupełnie początkujących idealna będzie ścieżka, ta, którą opisałem w tym wpisie, czyli na Kaggle odnajdziemy kursy:

  • Python, który przygotowany jest pod kątem pracy z danymi,
  • Pandas jako niezbędne narzędzie do pracy z danymi,
  • Data Visualization gdzie trenowany jest Seaborn narzędzie do wizualizacji danych,
  • Intro to Machine Learning jako wstęp do Uczenia Maszynowego.

Ktoś na wyższym poziomie zaawansowania może być zainteresowany już konkretnymi kursami dotyczącymi Uczenia Głębokiego (Deep Learning), Analiz Geoprzestrzennych czy Sztucznej Inteligencji.

Na następnym etapie, aby przećwiczyć swoje umiejętności w praktyce, warto byłoby wziąć udział w jednym lub kilku zawodach. Na sam początek, polecam zawody z kategorii Knowledge. Przeprowadzą Cię krok po kroku do pierwszego modelu, jego zatwierdzenia i umieszczenia Cię w rankingu:

zawody z kategorii Knowledge
Zawody na sam początek

Dalsza droga po Kaggle to już w zasadzie samotny spacer i wybieranie tego, co jest najbardziej wartościowe dla nas w danym momencie.

4 porady dla zaczynających przygodę z Kaggle

  • Ustalaj sobie rosnące cele

Jeżeli ktoś ma chęci być w rankingach wysoko, to warto byłoby potraktować wszystko jako grę, gdzie pokonujemy kolejne poziomy. Stawianie sobie za cel bycie pierwszym może okazać się mocno zniechęcające. Warto ustawić sobie schodki:

  • znajdę się w pierwszych 50% najlepszych,
  • znajdę się w pierwszych 25% najlepszych,
  • znajdę się w pierwszych 10% najlepszych,
  • będę 1.

Dotyczy to oczywiście każdych zawodów, w których weźmiesz udział. Warto także brać udział w różnych zawodach, aby z różnymi problemami się spotykać.

  • Nie przejmuj się niskimi wynikami

Głównym celem jest rozwój umiejętności, więc nie musisz nikomu niczego udowadniać. Jesteś tu po to, aby wiedzę zdobywać i to jest najważniejsze. Poza tym każdy zaczynał swoją przygodę od punktu 0, nawet Ci na pierwszych miejscach.

  • Przeglądać notatniki innych (notebooks)

Warto oglądać najlepiej oceniane notatniki. Poza wiedzą jak ktoś rozwiązał dany problem, uczymy się kontekstu, gdzie dany algorytm jest najlepszy. Jeśli chodzi o naukę to prawdziwa żyła złota. Uczymy się od najlepszych. Na całej platformie najlepsze zbiory danych, notatniki i sami użytkownicy otrzymują złote, srebrne i brązowe medale. Widać, że duch rywalizacji jest tu obecny:)

  • Ostatecznie Kaggle to tylko odskocznia

Najlepiej traktować to miejsce jako źródło wiedzy i salę treningową w jednym. Po treningu warto wyjść do świata i spróbować swoich umiejętności w prywatnych projektach.

Podsumowanie

Rejestracja i udział w Kaggle to wiele nauki i zabawy przy okazji. Znajdziesz tu wiedzę, zdobędziesz umiejętności i je przećwiczysz. Należy jednak pamiętać o ostatecznym celu, jakim jest tworzenie swoich projektów w realnym świecie.

Taktyka Killera
Kategorie: Data Science