Uniwersytet Mikołaja Kopernika w Toruniu - Centralny punkt logowania
Strona główna

Data mining dla niezaawansowanych

Informacje ogólne

Kod przedmiotu: 1000-OG-DM
Kod Erasmus / ISCED: (brak danych) / (0541) Matematyka Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Data mining dla niezaawansowanych
Jednostka: Wydział Matematyki i Informatyki
Grupy: Przedmioty ogólnouniwersyteckie
Punkty ECTS i inne: 3.00 Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.
Język prowadzenia: polski
Wymagania wstępne:

Znajomość matematyki na poziomie szkoły średniej. Podstawowa umiejętność posługiwania się komputerem z systemem Windows. Samodyscyplina, umiejętność gospodarowania własnym czasem, umiejętność czytania ze zrozumieniem tekstów napisanych językiem formalnym, otwartość na nowe wyzwania, świadomość konieczności samodoskonalenia się, odwaga w zadawaniu pytań oraz wypowiadaniu się na forum publicznym.


Rodzaj przedmiotu:

przedmiot fakultatywny

Całkowity nakład pracy studenta:

30 h – zapoznanie się z materiałami dostępnymi na platformie Moodle,

40 h – praca własna: studiowanie literatury, wykonywanie ćwiczeń, rozwiązywanie zadań,

10 h – konsultacje indywidualne z prowadzącym kurs,

10 h – rozwiązywanie testów i zadań zaliczeniowych.

Razem: 90 h (3 pkt. ECTS)


Efekty uczenia się - wiedza:

W1. Rozumie potrzebę pozyskiwania wiedzy z danych. Zna podstawowe problemy eksploracji danych.

W2. Zna wybrane algorytmy eksploracji danych i wie, które z nich stosują się do określonego typu zagadnień z tego zakresu.

W3. Ma wiedzę na temat dostępnego oprogramowania służącego do eksploracji danych.


Efekty uczenia się - umiejętności:

U1. Potrafi znaleźć potrzebne dane w zbiorach danych ogólnie dostępnych, umie pobrać dane i poddać je analizie.

U2. Umie zaproponować odpowiednie algorytmy eksploracji danych do konkretnego zagadnienia, w tym klasyfikacji, grupowania, szacowania i budowania reguł, oraz wyselekcjonować z ich użyciem najlepszy model.

U3. Umie posługiwać się w stopniu podstawowym programem do eksploracji danych PS IMAGO PRO (IBM SPSS Statistics).

U4. Potrafi przygotować raport z wynikami swoich analiz.


Efekty uczenia się - kompetencje społeczne:

K1. Potrafi sformułować problem eksploracji danych w sposób zrozumiały zarówno dla osób, z którymi współpracuje w tym obszarze, jak i ekspertów analityków.

K2. Potrafi poddać krytycznej ocenie pozyskane dane.

K3. Potrafi czerpać wiedzę z danych i na tej podstawie formułować propozycje rozwiązania sytuacji problemowych.


Metody dydaktyczne:

- Pokaz (filmy instruktażowe demonstrujące działanie programu),

- Pogadanka i wykład informacyjny (nagrania krótkich wykładów dotyczących teorii),

- Ćwiczeniowa (testy i zadania zlecone przez prowadzących),

- Studium przypadku, metody odnoszące się do autentycznych lub fikcyjnych sytuacji (zbiory danych rzeczywistych i przykłady ich analiz),

- Metody wymiany i dyskusji (fora dyskusyjne).


Metody dydaktyczne eksponujące:

- pokaz

Metody dydaktyczne podające:

- wykład informacyjny (konwencjonalny)

Metody dydaktyczne poszukujące:

- ćwiczeniowa
- studium przypadku

Metody dydaktyczne w kształceniu online:

- metody wymiany i dyskusji

Skrócony opis:

Duże zbiory danych pojawiają się aktualnie w każdym obszarze, w którym gromadzone są informacje. Oznacza to konieczność wykształcenia powszechniej sprawności w pracy z takimi danymi. Celem przedmiotu jest zapoznanie uczestników zajęć z najważniejszymi algorytmami data-miningu oraz wykształcenie umiejętności analizy danych z wykorzystaniem programu PS IMAGO PRO (IBM SPSS Statistics).

Pełny opis:

W czasie kursu uczestnik zapozna się z programem PS IMAGO PRO oraz jego możliwościami. Realizowane będą następujące zagadnienia: pozyskiwanie danych i ich wstępna obróbka, statystyka opisowa, eksploracyjna analiza danych, klasyfikacja, drzewa klasyfikacyjno-regresyjne, podstawy sieci neuronowych, regresja liniowa, grupowanie i analiza koszykowa.

Każdy temat będzie zawierał krótki wstęp teoretyczny, materiał instruktażowy jak rozwiązać danych problem za pomocą PS IMAGO PRO, przykładowe zbiory danych, ćwiczenia do wykonania i zadania do rozwiązania.

Literatura:

Literatura tradycyjna:

1. Bedyńska S., Książek M. (red.): Statystyczny drogowskaz 1. Praktyczne wprowadzenie do wnioskowania statystycznego. Warszawa, Wydawnictwo Akademickie Sedno, 2012.

2. Górniak J., Wachnicki J.: Pierwsze kroki w analizie danych. Kraków, SPSS Polska, 2004.

3. Daniel T. Larose: Odkrywanie wiedzy z danych, Wydawnictwo Naukowe PWN, Warszawa, 2013.

4. Daniel T. Larose: Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, Warszawa, 2012.

5. Tadeusz Morzy: Eksploracja danych. Metody i algorytmy. Wydawnictwo Naukowe PWN, Warszawa, 2013.

6. Bartosz Saramak: Wykorzystanie otwartych źródeł informacji w działalności wywiadowczej: historia, praktyka, perspektywy. WDiNP UW, Warszawa, 2015 (dostępne on-line: https://wnpism.uw.edu.pl/wp-content/uploads/2019/08/Wykorzystanie-otwartych-zrodel.pdf, dostęp z dn. 22.10.2020).

7. Sobczyk M.: Statystyka, Wydanie piąte uzupełnione. Warszawa, Wydawnictwo Naukowe PWN, 2020, str. 12-16.

8. Stephane Tuffery: Data Mining and Statistics for Decision Making. Wiley, 2011.

9. Xindong Wu, Vipin Kumar: The Top Ten Algorithms in Data Mining. Chapman & Holl/CRC, 2009.

Zasoby on-line:

1. Biecek P.: Odkrywać! Ujawniać! Objaśniać! Zbiór esejów o sztuce prezentowania danych.

http://www.biecek.pl/Eseje/ (dostęp z dn. 23.10.2020).

2. Polska Statystyka Publiczna https://bip.stat.gov.pl/dzialalnosc-statystyki-publicznej/polska-statystyka-publiczna/ (dostęp z dn. 21.10.2020).

3. Strona internetowa Discovering Statistics z tutorialami, filmami i zbiorami danych https://www.discoveringstatistics.com/ (dostęp z dn. 24.08.2020).

4. Strona internetowa IBM Knowledge Center z dokumentacją produktu IBM SPSS Statistics https://www.ibm.com/support/knowledgecenter/pl/SSLVMB_26.0.0/statistics_kc_ddita/spss/product_landing.html (dostęp z dn. 25.08.2020).

5. Predictive Solutions: Samouczek. http://samouczek.predictivesolutions.pl/ (dostęp z dn. 12.09.2020).

6. Predictive Solutions: Blog. https://predictivesolutions.pl/2,blog (dostęp z dn. 29.10.2020).

7. StatSoft: Internetowy Podręcznik Statystyki. https://www.statsoft.pl/textbook/stathome.html

(dostęp z dn. 25.10.2020).

8. Strona internetowa Towards Data Science: https://towardsdatascience.com/ (dostęp z dn. 30.10.2020).

9. Portal Sztuczna Inteligencja https://www.sztucznainteligencja.org.pl/ (dostęp z dn. 29.10.2020).

10. Narzędzia doboru kolorów na wykresach:

- http://paletton.com (dostęp z dn. 23.10.2020),

- https://colorbrewer2.org/ (dostęp z dn. 23.10.2020).

11. Przemysław Biecek: Przewodnik po pakiecie R 4.0 http://pbiecek.github.io/Przewodnik/ (dostęp z dn. 30.10.2020).

12. Strona domowa projektu R https://www.r-project.org/ (dostęp z dn. 27.10.2020).

Metody i kryteria oceniania:

- Krótkie testy po każdym z tematów zweryfikują efekty wiedzy W1-W3 i umiejętności U1-U4.

- Zadania zweryfikują efekt wiedzy W2, efekty umiejętności U1-U4 oraz efekty kompetencji społecznych K1-K3.

Praktyki zawodowe:

Brak

Zajęcia w cyklu "Semestr letni 2021/22" (zakończony)

Okres: 2022-02-21 - 2022-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin, 30 miejsc więcej informacji
Koordynatorzy: Mateusz Topolewski
Prowadzący grup: Mateusz Topolewski
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę
Uwagi:

Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS.

Zajęcia w cyklu "Semestr letni 2022/23" (zakończony)

Okres: 2023-02-20 - 2023-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin, 30 miejsc więcej informacji
Koordynatorzy: Mateusz Topolewski
Prowadzący grup: Mateusz Topolewski
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę
Uwagi:

Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS.

Zajęcia w cyklu "Semestr letni 2023/24" (w trakcie)

Okres: 2024-02-20 - 2024-09-30
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Laboratorium, 30 godzin, 30 miejsc więcej informacji
Koordynatorzy: Agnieszka Goroncy
Prowadzący grup: Agnieszka Goroncy
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę
Uwagi:

Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.
ul. Jurija Gagarina 11, 87-100 Toruń tel: +48 56 611-40-10 https://usosweb.umk.pl/ kontakt deklaracja dostępności USOSweb 7.0.2.0-1 (2024-03-12)