Uniwersytet Mikołaja Kopernika w Toruniu - Centralny punkt logowania
Strona główna

Eksploracja danych

Informacje ogólne

Kod przedmiotu: 1000-MS1-EksDan
Kod Erasmus / ISCED: (brak danych) / (0542) Statystyka Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Eksploracja danych
Jednostka: Wydział Matematyki i Informatyki
Grupy: Mat., sp. nauczycielskie, II st., stacjonarne, przedmioty do wyboru + uzup. stand. kszt.
Punkty ECTS i inne: 6.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Wymagania wstępne:

Zaliczenie przedmiotów Narzędzia eksploracji danych oraz Statystyka matematyczna

Całkowity nakład pracy studenta:

Wykład – 30 godz.

Laboratorium – 30 godz.

Studiowanie literatury i materiałów zamieszczonych przez prowadzących oraz konsultacje z prowadzącymi zajęcia – 30 godz.

Przygotowanie do egzaminu – 15 godz.

Wykonanie zadań niezbędnych do zaliczenia przedmiotu a polegających na przeprowadzeniu analiz danych – 45 godz.

Razem: 150 godz. - 6 punktów ECTS


Efekty uczenia się - wiedza:

W01 - Zna najważniejsze zagadnienia eksploracji danych dotyczące klasyfikacji, grupowania i szacowania (K_W01, K_W03).

W02 - Dla każdego z podstawowych problemów eksploracji danych zna przynajmniej jeden algorytm stosowany do jego rozwiązania (K_W03, K_W06).

W03 - Orientuje się w dostępnym na rynku oprogramowaniu do eksploracji danych, zna w stopniu podstawowym przynajmniej jeden taki program (K_W04, K_W07).


Efekty uczenia się - umiejętności:

U01 - Potrafi znaleźć potrzebne dane w zbiorach danych ogólnie dostępnych, umie pobrać dane i poddać je analizie (K_U21).

U02 - Umie zaproponować odpowiednie algorytmy eksploracji danych do konkretnego zagadnienia, w tym klasyfikacji, grupowania, szacowania i budowania reguł, oraz wyselekcjonować z ich użyciem najlepszy model (K_U02, K_U19).

U03 - Umie posługiwać się w stopniu podstawowym przynajmniej jednym programem do eksploracji danych (K_U03).

U04 - Potrafi przygotować raport z wynikami swoich analiz oraz zastosować zbudowany model do klasyfikacji, szacowania lub przewidywania w oparciu o nowy zbiór danych (K_U05).


Efekty uczenia się - kompetencje społeczne:

K01 - Potrafi sformułować problem eksploracji danych w sposób zrozumiały zarówno dla osób, z którymi współpracuje w tym obszarze, jak i ekspertów analityków (K_K03).

K02 - Potrafi czerpać wiedzę z danych i na tej podstawie formułować propozycje rozwiązania sytuacji problemowych (K_K04).


Metody dydaktyczne:

Pokaz, wykład informacyjny (konwencjonalny), laboratoryjna, projektu, studium przypadku, metody dydaktyczne odnoszące się do autentycznych lub fikcyjnych sytuacji, metody rozwijające refleksyjne myślenie.

Metody dydaktyczne eksponujące:

- pokaz

Metody dydaktyczne podające:

- wykład informacyjny (konwencjonalny)

Metody dydaktyczne poszukujące:

- laboratoryjna
- projektu
- studium przypadku

Metody dydaktyczne w kształceniu online:

- metody odnoszące się do autentycznych lub fikcyjnych sytuacji
- metody rozwijające refleksyjne myślenie

Skrócony opis:

Duże zbiory danych pojawiają się aktualnie w każdym obszarze, w którym gromadzone są informacje. Oznacza to konieczność wykształcenia powszechniej sprawności w pracy z takimi danymi. Celem przedmiotu jest zapoznanie uczestników zajęć z najważniejszymi algorytmami data-miningu oraz wykształcenie umiejętności analizy danych z wykorzystaniem dostępnego oprogramowania.

Pełny opis:

W czasie zajęć realizowane będą następujące zagadnienia: pozyskiwanie danych i ich wstępna obróbka, statystyka opisowa, eksploracyjna analiza danych, klasyfikacja i algorytmy klasyfikacyjne (k-nn, drzewa decyzyjne i lasy losowe, sieci neuronowe), regresja i algorytmy szacowania (k-nn, drzewa CRT, sieci neuronowe), grupowanie (metodami k średnich, hierarchiczną, dwustopniową analizą skupień, sieciami Kohonena), analiza koszykowa oraz metody redukcji wymiaru.

Wszystkie zagadnienia omówione na wykładzie będą następnie ilustrowane ćwiczeniami praktycznymi na zajęciach laboratoryjnych z użyciem środowiska R, języka programowania Python, programów KNIME i IBM SPSS Statistics.

Literatura:

Literatura podstawowa:

1. Daniel T. Larose: ,,Odkrywanie wiedzy z danych''. Wydawnictwo Naukowe PWN, Warszawa, 2006.

2. Daniel T. Larose: ,,Metody i modele eksploracji danych''. Wydawnictwo Naukowe PWN, Warszawa, 2012.

3. Ch. D. Larose, D. T. Larose: ,,Data Science Using Python and R''. Wiley, 2019.

4. Aktualna dokumentacja narzędzi informatycznych wykorzystywanych na laboratoriach.

Literatura uzupełniająca:

5. Tadeusz Morzy: ,,Eksploracja danych. Metody i algorytmy’’. Wydawnictwo Naukowe PWN, Warszawa, 2013.

6. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: ,,An Introduction to Statistical Learning with Applications in R''. IV Edition. Springer, 2014 (dostępne na stronie http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Fourth%20Printing.pdf).

7. Trevor Hastie, Robert Tibshirani, Jerome Friedman: ,,The Elements of Statistical Learning''. Springer, 2009 (dostępne na stronie http://statweb.stanford.edu/~tibs/ElemStatLearn/).

8. Paweł Cichosz: ,,Data Mining Algorithms Explained Using R’’. Wiley, 2015.

Metody i kryteria oceniania:

Egzamin pisemny testowy lub ustny (w zależności od sytuacji pandemicznej) – W01, W02

Zaliczenie laboratorium na podstawie m.in. obecności, testów, zadań domowych oraz projektu końcowego – W03, U01-U04, K01, K02

Praktyki zawodowe:

Nie dotyczy

Zajęcia w cyklu "Semestr zimowy 2021/22" (zakończony)

Okres: 2021-10-01 - 2022-02-20
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin, 16 miejsc więcej informacji
Wykład, 30 godzin, 50 miejsc więcej informacji
Koordynatorzy: Joanna Karłowska-Pik
Prowadzący grup: Krzysztof Jasiński, Joanna Karłowska-Pik
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin

Zajęcia w cyklu "Semestr zimowy 2022/23" (zakończony)

Okres: 2022-10-01 - 2023-02-19
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin, 16 miejsc więcej informacji
Wykład, 30 godzin, 50 miejsc więcej informacji
Koordynatorzy: Joanna Karłowska-Pik
Prowadzący grup: Krzysztof Jasiński, Joanna Karłowska-Pik
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin

Zajęcia w cyklu "Semestr zimowy 2023/24" (zakończony)

Okres: 2023-10-01 - 2024-02-19

Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin, 16 miejsc więcej informacji
Wykład, 30 godzin, 60 miejsc więcej informacji
Koordynatorzy: Joanna Karłowska-Pik
Prowadzący grup: Krzysztof Jasiński, Joanna Karłowska-Pik
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.
ul. Jurija Gagarina 11, 87-100 Toruń tel: +48 56 611-40-10 https://usosweb.umk.pl/ kontakt deklaracja dostępności USOSweb 7.0.1.0 (2023-11-21)