Odkrywanie struktur ukrytych w danych czyli eksploracja danych


O Kursie

Cel kursu
Celem kursu jest przekazanie uczestnikom podstawowej wiedzy z zakresu struktur ukrytych w danych.

Tematyka kursu
Na początku zostanie podana seria prostych przykładów, aby słuchacze mogli w miarę łatwo odkryć reguły ukryte w danych. Proces odkrywania reguł można interpretować jako algorytmu uczenia się systemu ze zbioru treningowego. Podane zostaną dwa przykłady danych z głębiej ukrytą strukturą, nie do zdroworozsądkowego zauważenia. Jeden z tych przykładów jest o naturze statystycznej, drugi – o naturze kombinatorycznej, zorientowany na zastosowanie drzewa decyzyjnego. Podane zostanie intuicyjne objaśnienie wykrycia rozkładu normalnego ukrytego w danych – histogram, standaryzacja wartości danych, zastosowanie rozkładu normalnego do sformułowania prognozy dotyczącej danych z przykładu o naturze statystycznej. Następnie zostanie podana definicja i przykład drzewa decyzyjnego opartego o zbiór, przyjętych jako dostępne, testów na danych. Zwrócona zostanie uwaga na znaczenie ekspresywności języka, w którym próbujemy sformułować hipotezę o strukturze ukrytej w danych. Następnie sformułowany zostanie zbiór dostępnych testów dla analizy przykładu o naturze kombinatorycznej i podane zostanie intuicyjne objaśnienie klasycznego algorytmu indukcji z danych drzewa decyzyjnego, w tym kryterium wyboru testu przez entropię. Intuicyjnie zostanie wy-prowadzone z danych przykładu drugiego drzewo decyzyjne i zastosowane do sklasyfikowania danych przykładu drugiego. Na zakończenie, ostrzeżenie, że eksploracja danych jest szeroką dziedziną oferującą dziesiątki (a może setki) algorytmów, podana zostanie również informacja o niektórych zastosowaniach algorytmów eksploracji danych.
Przedmiotem warsztatów będzie:

  • Analiza statystyczna przykładowych danych z użyciem tylko arkusza Excel.
  • Wspomagane arkuszem Excel wyliczenia prowadzące do skonstruowania drzewa decyzyjnego z podanego konkretnego zbioru treningowego.
  • Programowanie prostych algorytmów użytecznych dla zrozumienia zjawiska nadmiernego dopasowania.
  1. Wstęp
  2. O pewnym problemie dużej firmy taksówkowej
    • 2.1. Histogram
    • 2.2. Zmienna losowa
    • 2.3. Rozkład normalny
    • 2.4. Ocena wiarygodności hipotezy
  3. Drzewa decyzyjne
    • 3.1. Zastosowanie drzewa decyzyjnego do klasyfikacji danych
    • 3.2. Błąd klasyfikatora i walidacja krzyżowa
    • 3.3. Zjawisko nadmiernego dopasowania
  4. Propozycja przeprowadzenia prostych badań
  5. Niektóre dziedziny zastosowań metod eksploracji danych

Struktura kursu
Kurs składa się z następujących elementów:

  1. Zeszyt dydaktyczny do kursu - w formacie PDF,
  2. Prezentacja PowerPoint do kursu - w formacie .ppt,
  3. Test z pytaniami sprawdzającymi wiedzę
  4. Materiały dodatkowe

Sposób realizacji kursu
Kurs jest przeznaczony do realizacji w trybie samokształcenia lub pod kierunkiem nauczyciela. Po zapoznaniu się ze wszystkimi elementami kursu oraz wykonaniu testu sprawdzającego wiedzę, uczestnik otrzymuje prawo do samodzielnego wystawienia certyfikatu potwierdzającego zrealizowanie kursu e-learningowego „Odkrywanie struktur ukrytych w danych czyli eksploracja danych” przygotowanego przez Warszawską Wyższą Szkołę Informatyki.

Certyfikat potwierdzający realizację kursu

certyfikat

O wykładowcy
dr hab. prof. WWSI Michał Grabowski jest wykładowcą Warszawskiej Wyższej Szkoły Informatyki. Specjalizuje się w zaawansowanym projektowaniu obiektowym oraz w językach i paradygmatach programowania. W latach 2010-2012 prowadził szkolenia z zakresu tendencji w rozwoju informatyki w ramach projektu Informatyka +.


nask logo   


Drogi użytkowniku
Przechodząc do serwisu poprzez kliknięcie odnośnika „Zgadzam się” wyrażasz zgodę na przetwarzanie przez nas Twoich danych osobowych.
Pliki cookies
Gdy korzystasz z naszych serwisów, gromadzimy informacje o Twojej wizycie i sposobie poruszania się w naszych serwisach. W tym celu stosujemy pliki cookies. Plik cookies zawiera dane informatyczne, które są umieszczone w Twoim urządzeniu końcowym - przeglądarce internetowej, z której korzystasz.
Pliki cookies używane w naszych serwisach wykorzystywane są między innymi do bieżącej optymalizacji serwisów oraz ułatwiania Twojego z nich korzystania. Niektóre funkcjonalności dostępne w naszych serwisach mogą nie działać, jeżeli nie wyrazisz zgody na instalowanie plików cookies.
Instalowanie plików cookies lub uzyskiwanie do nich dostępu nie powoduje zmian w Twoim urządzeniu ani w oprogramowaniu zainstalowanym na tym urządzeniu.
Stosujemy dwa rodzaje plików cookies: sesyjne i trwałe. Pliki sesyjne wygasają po zakończonej sesji, której czas trwania i dokładne parametry wygaśnięcia określa używana przez Ciebie przeglądarka internetowa oraz nasze systemy analityczne. Trwałe pliki cookies nie są kasowane w momencie zamknięcia okna przeglądarki, głównie po to, by informacje o dokonanych wyborach nie zostały utracone. Pliki cookies aktywne długookresowo wykorzystywane są, aby pomóc nam wspierać komfort korzystania z naszych serwisów, w zależności od tego czy dochodzi do nowych, czy do ponownych odwiedzin serwisu.

Do czego wykorzystujemy pliki cookies?
Pliki cookies wykorzystywane są w celach statystycznych oraz aby usprawnić działanie serwisów i zwiększyć komfort z nich korzystania, m.in:

  • pozwalają sprawdzić jak często odwiedzane są poszczególne strony serwisów - dane te wykorzystujemy do optymalizacji serwisów pod kątem odwiedzających;
  • umożliwiają rozpoznanie rodzaju Twojego urządzenia, dzięki czemu możemy lepiej dopasować sposób i format prezentowania treści oraz funkcjonalności serwisów;
  • poprawiają wydajność i efektywność serwisów dla korzystających.

W jaki sposób możesz nie wyrazić zgody na instalowanie plików cookies za pomocą ustawień przeglądarki?
Jeśli nie chcesz, by pliki cookies były instalowane na Twoim urządzeniu, możesz zmienić ustawienia swojej przeglądarki w zakresie instalowania plików cookies. W każdej chwili możesz też usunąć z pamięci swojego urządzenia pliki cookies zapisane w trakcie przeglądania naszych serwisów. Pamiętaj jednak, że ograniczenia w stosowaniu plików cookies mogą utrudnić lub uniemożliwić korzystanie z tych serwisów.
Wykorzystywane narzędzia firm trzecich
Niektóre pliki cookies są tworzone przez podmiot, z usług których korzystamy, np.

  • Google Inc.

W naszych serwisach wykorzystujemy narzędzie Google Analytics do analizy ruchu na stronie internetowej oraz aktywności dotyczących jej przeglądania. Wykorzystujemy je w szczególności do celów statystycznych, aby sprawdzić jak często odwiedzane są poszczególne serwisy. Dane te wykorzystujemy również do optymalizacji i rozwoju serwisów. Więcej informacji na temat narzędzia Google Analytics znajdziesz na stronie:  https://policies.google.com/technologies/cookies

  • Facebook

Więcej informacji o zasadach plików cookies możesz znaleźć na:
https://pl-pl.facebook.com/policies/cookies/     

  • Twitter

Więcej informacji o zasadach plików cookies możesz znaleźć na:
https://help.twitter.com/en/rules-and-policies/twitter-cookies

  • Youtube

Więcej informacji o zasadach plików cookies możesz znaleźć na:
https://policies.google.com/privacy?hl=pl&gl=pl

 

Wyrażam zgodę na podstawowe oraz funkcjonalne cookies.
Podstawowe cookies są niezbędne aby strona mogła działać prawidłowo.
Cookies funkcjonalne wykorzystujemy do analizowania wizyt na stronie internetowej. Pomoże nam to zrozumieć, jak często odwiedzane są poszczególne serwisy oraz pozwoli optymalizować i rozwijać stronę. ZGADZAM SIĘ