Uniwersytet Mikołaja Kopernika w Toruniu - Centralny punkt logowania
Strona główna

Metody eksploracji danych

Informacje ogólne

Kod przedmiotu: 1000-M2MED
Kod Erasmus / ISCED: (brak danych) / (0541) Matematyka Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Metody eksploracji danych
Jednostka: Wydział Matematyki i Informatyki
Grupy: Mat., sp. nauczycielskie, II st., stacjonarne, przedmioty do wyboru + uzup. stand. kszt.
Mat., sp. zastosowania, II st., stac., przedmioty do wyboru + uzup. stand. kszt.
Punkty ECTS i inne: (brak) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: polski
Wymagania wstępne:

Znajomość podstawowych pojęć rachunku prawdopodobieństwa i statystyki matematycznej.

Rodzaj przedmiotu:

przedmiot fakultatywny

Całkowity nakład pracy studenta:

30 godzin - wykład

30 godzin - ćwiczenia

30 godzin - wykonanie zadań koniecznych do zaliczenia ćwiczeń,

30 godzin - praca własna (bieżące przygotowanie do zajęć, studiowanie literatury)

30 godzin - praca własna (przygotowanie do egzaminu)


RAZEM: 150 godzin

6 pkt. ECTS

Efekty uczenia się - wiedza:

Po ukończeniu kursu 1000-M2MED student osiąga następujące efekty (kody odnoszą się do efektów dla studiów 2 stopnia na kierunku matematyka):


W1: zna podstawowe techniki eksploracji danych ich wymagania oraz ograniczenia (K_W04);

W2: Zna zastosowania poznanych metod w analizie danych rzeczywistych (K_W06);

W3: Zna najpopularniejsze na rynku programy do analizy danych, potrafi posługiwać się jednym z nich w stopniu co najmniej podstawowym (K_W07).

Efekty uczenia się - umiejętności:

Po ukończeniu kursu 1000-M2MED student osiąga następujące efekty (kody odnoszą się do efektów dla studiów 2 stopnia na kierunku matematyka):


U1: umie wykorzystać podstawowe pojęcia statystyki w obróbce i eksploracji danych (K_U08);

U2: potrafi konstruować, oceniać i stosować modele eksploracyjne za pomocą wybranego programu do analizy danych (K_U12)

Efekty uczenia się - kompetencje społeczne:

Po ukończeniu kursu 1000-M2MED student osiąga następujące efekty (kody odnoszą się do efektów dla studiów 2 stopnia na kierunku matematyka):


K1: efektywnie pracuje z dużą ilością danych, potrafi dostrzec zależności i wyciągnąć poprawne wnioski (K_K01);

K2: realizuje postawione zadania, samodzielnie podejmując decyzje dotyczące wyboru odpowiednich technik eksploracyjnych w razie potrzeby znajdując informacje w literaturze lub Internecie (K_K07);

K3. formułuje wnioski z badań w sposób zrozumiały dla specjalistów z innych dziedzin (K_K04);


Metody dydaktyczne eksponujące:

- pokaz

Metody dydaktyczne podające:

- wykład informacyjny (konwencjonalny)

Metody dydaktyczne poszukujące:

- laboratoryjna

Skrócony opis:

W ramach zajęć przedstawione zostaną podstawowe metody eksploracji danych. Metody te będą ilustrowane przykładami analizy danych rzeczywistych wykonanymi w profesjonalnym programach IBM SPSS Statistics i KNIME.

Pełny opis:

1. Wprowadzenie do eksploracji danych. Prezentacja dostępnych programów oraz zbiorów danych.

2. Przegląd zagadnień, w których wykorzystywana jest eksploracja danych i jej konkretne techniki.

3. Wstępna obróbka danych.

4. Eksploracyjna analiza danych.

5. Podstawy modelowania i oceny jakości modeli.

6. Klasyfikacja. Algorytm k najbliższych sąsiadów.

7. Klasyfikacja metodą drzew decyzyjnych i lasów losowych.

8. Sieci neuronowe.

9. Analiza regresji.

10. Analiza skupień. Metoda k średnich.

11. Grupowanie hierarchiczne i dwustopniowa analiza skupień.

12. Analiza koszykowa.

13. Metody redukcji wymiaru. Analiza składowych głównych.

Literatura:

1. Daniel T. Larose: ,,Odkrywanie wiedzy z danych''. Wydawnictwo Naukowe PWN, Warszawa, 2006.

2. Daniel T. Larose: ,,Metody i modele eksploracji danych''. Wydawnictwo Naukowe PWN, Warszawa, 2012.

3. Tadeusz Morzy: ,,Eksploracja danych. Metody i algorytmy’’. Wydawnictwo Naukowe PWN, Warszawa, 2013.

4. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: ,,An Introduction to Statistical Learning with Applications in R''. IV Edition. Springer, 2014 (dostępne na stronie http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Fourth%20Printing.pdf).

5. Trevor Hastie, Robert Tibshirani, Jerome Friedman: ,,The Elements of Statistical Learning''. Springer, 2009 (dostępne na stronie http://statweb.stanford.edu/~tibs/ElemStatLearn/).

Metody i kryteria oceniania:

Ocena części laboratoryjnej będzie wystawiona na podstawie wykonanych analiz, sprawdzających efekty W3, U2, K1, K2, K3. Egzamin będzie sprawdzał wiedzę teoretyczną oraz efekty W1, W2, U1.

Przedmiot nie jest oferowany w żadnym z aktualnych cykli dydaktycznych.
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.
ul. Jurija Gagarina 11, 87-100 Toruń tel: +48 56 611-40-10 https://usosweb.umk.pl/ kontakt deklaracja dostępności USOSweb 7.0.2.0-1 (2024-03-12)