Uniwersytet Mikołaja Kopernika w Toruniu - Centralny punkt logowania
Strona główna

Eksploracja danych

Informacje ogólne

Kod przedmiotu: 1000-I2ED
Kod Erasmus / ISCED: (brak danych) / (0613) Tworzenie i analiza oprogramowania i aplikacji Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Eksploracja danych
Jednostka: Wydział Matematyki i Informatyki
Grupy: Informatyka, studia II stopnia, 3 sem, 1 rok
Informatyka, studia II stopnia, 4 sem, 1 rok
Punkty ECTS i inne: 6.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Wymagania wstępne:

- Podstawowa umiejętność posługiwania się komputerem.

- Podstawowa umiejętność programowania.

- Znajomość podstawowych pojęć statystyki opisowej.

Rodzaj przedmiotu:

przedmiot obowiązkowy

Całkowity nakład pracy studenta:

1. Godziny realizowane z udziałem nauczycieli:

a. wykład – 30 godzin,

b. laboratorium – 30 godzin,

c. bieżące przygotowanie do zajęć, w tym rozwiązywanie zadań zleconych przez prowadzących, zapoznanie się z informacją zwrotną dotyczącą rozwiązanych zadań oraz konsultacje z prowadzącymi zajęcia – 40 godzin.


2. Czas poświęcony na pracę indywidualną studenta/słuchacza/uczestnika kursu potrzebny do pomyślnego zaliczenia przedmiotu:

a. studiowanie literatury – 10 godzin,

b. zapoznanie się z materiałami dodatkowymi, m.in. dokumentacją bibliotek i pakietów – 10 godzin,

c. wykonanie projektu zaliczeniowego – 15 godzin.


3. Czas wymagany do przygotowania się do uczestnictwa w procesie oceniania (np. w egzaminach):

a. przygotowanie się do egzaminu – 15 godzin.


RAZEM: 150 godzin (6 punktów ECTS)



Efekty uczenia się - wiedza:

Kody odnoszą się do efektów uczenia się dla kierunku Informatyka, studia I stopnia, inżynierskie.


W1 - Wie jak definiuje się najważniejsze zadania eksploracji danych tj. klasyfikację, szacowanie (regresję), grupowanie i odkrywanie reguł (K_W01, K_W09).

W2 - Dla każdego z podstawowych problemów eksploracji danych zna przynajmniej jeden algorytm stosowany do jego rozwiązania (K_W09).

W3 - Orientuje się w dostępnych na rynku narzędziach informatycznych stosowanych do eksploracji danych, zna w stopniu podstawowym przynajmniej jedno takie narzędzie (K_W10).


Efekty uczenia się - umiejętności:

Kody odnoszą się do efektów uczenia się dla kierunku Informatyka, studia I stopnia, inżynierskie.


U1 - Potrafi znaleźć potrzebne dane w zbiorach danych ogólnie dostępnych, umie pobrać dane i poddać je analizie (K_U02, K_U08).

U2 - Umie zaproponować odpowiednie algorytmy eksploracji danych do konkretnego zagadnienia, w tym klasyfikacji, grupowania, szacowania i budowania reguł, oraz wyselekcjonować z ich użyciem najlepszy model (K_U02, K_U18).

U3 - Umie posługiwać się w stopniu podstawowym przynajmniej jednym narzędziem informatycznym do eksploracji danych (K_U23).

U4 - Potrafi przygotować raport z wynikami swoich analiz oraz zastosować zbudowany model do klasyfikacji, szacowania lub grupowania w oparciu o nowy zbiór danych (K_U02, K_U03, K_U04).


Efekty uczenia się - kompetencje społeczne:

Kody odnoszą się do efektów uczenia się dla kierunku Informatyka, studia I stopnia, inżynierskie.


K1 - Potrafi sformułować problem eksploracji danych w sposób zrozumiały zarówno dla osób, z którymi współpracuje w tym obszarze, jak i ekspertów analityków (K_K02, K_K04).

K2 - Potrafi czerpać wiedzę z danych i na tej podstawie formułować propozycje rozwiązania sytuacji problemowych (K_K02).


Metody dydaktyczne:

Pokaz, wykład informacyjny (konwencjonalny), laboratoryjna, projektu, studium przypadku.

Metody dydaktyczne eksponujące:

- pokaz

Metody dydaktyczne podające:

- wykład informacyjny (konwencjonalny)

Metody dydaktyczne poszukujące:

- laboratoryjna
- projektu
- studium przypadku

Skrócony opis:

Duże zbiory danych pojawiają się aktualnie w każdym obszarze, w którym gromadzone są informacje. Oznacza to konieczność wykształcenia powszechniej sprawności w pracy z takimi danymi. Celem przedmiotu jest zapoznanie uczestników zajęć z najważniejszymi algorytmami data-miningu oraz wykształcenie umiejętności analizy danych z wykorzystaniem środowiska R oraz języka programowania Python.

Pełny opis:

W czasie zajęć realizowane będą następujące zagadnienia: pozyskiwanie danych i ich wstępna obróbka, statystyka opisowa, eksploracyjna analiza danych, klasyfikacja i algorytmy klasyfikacyjne (k-nn, drzewa decyzyjne i lasy losowe, sieci neuronowe), regresja i algorytmy szacowania (k-nn, drzewa CRT, sieci neuronowe), grupowanie (metodami k średnich, hierarchiczną, dwustopniową analizą skupień, sieciami Kohonena), analiza koszykowa oraz metody redukcji wymiaru.

Wszystkie zagadnienia omówione na wykładzie będą następnie ilustrowane ćwiczeniami praktycznymi na zajęciach laboratoryjnych z użyciem środowiska R oraz języka programowania Python.

Literatura:

Literatura podstawowa:

1. Daniel T. Larose: ,,Odkrywanie wiedzy z danych''. Wydawnictwo Naukowe PWN, Warszawa, 2006.

2. Daniel T. Larose: ,,Metody i modele eksploracji danych''. Wydawnictwo Naukowe PWN, Warszawa, 2012.

3. Ch. D. Larose, D. T. Larose: ,,Data Science Using Python and R''. Wiley, 2019.

4. Aktualna dokumentacja narzędzi informatycznych wykorzystywanych na laboratoriach.

Literatura uzupełniająca:

5. Tadeusz Morzy: ,,Eksploracja danych. Metody i algorytmy’’. Wydawnictwo Naukowe PWN, Warszawa, 2013.

6. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: ,,An Introduction to Statistical Learning with Applications in R''. IV Edition. Springer, 2014 (dostępne na stronie http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Fourth%20Printing.pdf).

7. Trevor Hastie, Robert Tibshirani, Jerome Friedman: ,,The Elements of Statistical Learning''. Springer, 2009 (dostępne na stronie http://statweb.stanford.edu/~tibs/ElemStatLearn/).

8. Paweł Cichosz: ,,Data Mining Algorithms Explained Using R’’. Wiley, 2015.

Metody i kryteria oceniania:

Egzamin ustny – uzyskanie oceny pozytywnej z egzaminu zgodnie z kryterium określonym przez prowadzącego zajęcia - W1, W2, U2, K2.

Sprawdziany pisemne (testowe) – kryterium zaliczenia ustala prowadzący na początkowych zajęciach – W2, K2.

Zadania o charakterze analitycznym – kryterium zaliczenia ustala prowadzący na początkowych zajęciach - W3, U1, U2, U3, U4, K1.

Projekt końcowy – kryterium zaliczenia ustala prowadzący na początkowych zajęciach – W3, U2, U3, U4, K1.

Praktyki zawodowe:

Nie dotyczy.

Zajęcia w cyklu "Semestr letni 2021/22" (zakończony)

Okres: 2022-02-21 - 2022-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin, 16 miejsc więcej informacji
Wykład, 30 godzin, 50 miejsc więcej informacji
Koordynatorzy: Joanna Karłowska-Pik
Prowadzący grup: Krzysztof Jasiński, Joanna Karłowska-Pik, Łukasz Maślanka
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin

Zajęcia w cyklu "Semestr zimowy 2022/23" (zakończony)

Okres: 2022-10-01 - 2023-02-19
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin, 16 miejsc więcej informacji
Wykład, 30 godzin, 70 miejsc więcej informacji
Koordynatorzy: Joanna Karłowska-Pik
Prowadzący grup: Krzysztof Jasiński, Joanna Karłowska-Pik, Mateusz Topolewski, Bartosz Ziemkiewicz
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin

Zajęcia w cyklu "Semestr zimowy 2023/24" (zakończony)

Okres: 2023-10-01 - 2024-02-19
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin, 16 miejsc więcej informacji
Wykład, 30 godzin, 70 miejsc więcej informacji
Koordynatorzy: Joanna Karłowska-Pik
Prowadzący grup: Krzysztof Jasiński, Joanna Karłowska-Pik, Mateusz Topolewski, Bartosz Ziemkiewicz
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie na ocenę
Wykład - Egzamin
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.
ul. Jurija Gagarina 11, 87-100 Toruń tel: +48 56 611-40-10 https://usosweb.umk.pl/ kontakt deklaracja dostępności USOSweb 7.0.2.0-1 (2024-03-12)