Ta witryna wykorzystuje pliki cookie, dowiedz się więcej Zgadzam się
Odkrywanie struktur ukrytych w danych czyli eksploracja danych


O Kursie

Cel kursu
Celem kursu jest przekazanie uczestnikom podstawowej wiedzy z zakresu struktur ukrytych w danych.

Tematyka kursu
Na początku zostanie podana seria prostych przykładów, aby słuchacze mogli w miarę łatwo odkryć reguły ukryte w danych. Proces odkrywania reguł można interpretować jako algorytmu uczenia się systemu ze zbioru treningowego. Podane zostaną dwa przykłady danych z głębiej ukrytą strukturą, nie do zdroworozsądkowego zauważenia. Jeden z tych przykładów jest o naturze statystycznej, drugi – o naturze kombinatorycznej, zorientowany na zastosowanie drzewa decyzyjnego. Podane zostanie intuicyjne objaśnienie wykrycia rozkładu normalnego ukrytego w danych – histogram, standaryzacja wartości danych, zastosowanie rozkładu normalnego do sformułowania prognozy dotyczącej danych z przykładu o naturze statystycznej. Następnie zostanie podana definicja i przykład drzewa decyzyjnego opartego o zbiór, przyjętych jako dostępne, testów na danych. Zwrócona zostanie uwaga na znaczenie ekspresywności języka, w którym próbujemy sformułować hipotezę o strukturze ukrytej w danych. Następnie sformułowany zostanie zbiór dostępnych testów dla analizy przykładu o naturze kombinatorycznej i podane zostanie intuicyjne objaśnienie klasycznego algorytmu indukcji z danych drzewa decyzyjnego, w tym kryterium wyboru testu przez entropię. Intuicyjnie zostanie wy-prowadzone z danych przykładu drugiego drzewo decyzyjne i zastosowane do sklasyfikowania danych przykładu drugiego. Na zakończenie, ostrzeżenie, że eksploracja danych jest szeroką dziedziną oferującą dziesiątki (a może setki) algorytmów, podana zostanie również informacja o niektórych zastosowaniach algorytmów eksploracji danych.
Przedmiotem warsztatów będzie:

  • Analiza statystyczna przykładowych danych z użyciem tylko arkusza Excel.
  • Wspomagane arkuszem Excel wyliczenia prowadzące do skonstruowania drzewa decyzyjnego z podanego konkretnego zbioru treningowego.
  • Programowanie prostych algorytmów użytecznych dla zrozumienia zjawiska nadmiernego dopasowania.
  1. Wstęp
  2. O pewnym problemie dużej firmy taksówkowej
    • 2.1. Histogram
    • 2.2. Zmienna losowa
    • 2.3. Rozkład normalny
    • 2.4. Ocena wiarygodności hipotezy
  3. Drzewa decyzyjne
    • 3.1. Zastosowanie drzewa decyzyjnego do klasyfikacji danych
    • 3.2. Błąd klasyfikatora i walidacja krzyżowa
    • 3.3. Zjawisko nadmiernego dopasowania
  4. Propozycja przeprowadzenia prostych badań
  5. Niektóre dziedziny zastosowań metod eksploracji danych

Struktura kursu
Kurs składa się z następujących elementów:

  1. Zeszyt dydaktyczny do kursu - w formacie PDF,
  2. Prezentacja PowerPoint do kursu - w formacie .ppt,
  3. Test z pytaniami sprawdzającymi wiedzę
  4. Materiały dodatkowe

Sposób realizacji kursu
Kurs jest przeznaczony do realizacji w trybie samokształcenia lub pod kierunkiem nauczyciela. Po zapoznaniu się ze wszystkimi elementami kursu oraz wykonaniu testu sprawdzającego wiedzę, uczestnik otrzymuje prawo do samodzielnego wystawienia certyfikatu potwierdzającego zrealizowanie kursu e-learningowego „Odkrywanie struktur ukrytych w danych czyli eksploracja danych” przygotowanego przez Warszawską Wyższą Szkołę Informatyki.

Certyfikat potwierdzający realizację kursu

certyfikat

O wykładowcy
dr hab. prof. WWSI Michał Grabowski jest wykładowcą Warszawskiej Wyższej Szkoły Informatyki. Specjalizuje się w zaawansowanym projektowaniu obiektowym oraz w językach i paradygmatach programowania. W latach 2010-2012 prowadził szkolenia z zakresu tendencji w rozwoju informatyki w ramach projektu Informatyka +.