Data mining dla niezaawansowanych
Informacje ogólne
Kod przedmiotu: | 1000-OG-DM |
Kod Erasmus / ISCED: |
(brak danych)
/
(0541) Matematyka
|
Nazwa przedmiotu: | Data mining dla niezaawansowanych |
Jednostka: | Wydział Matematyki i Informatyki |
Grupy: |
Przedmioty ogólnouniwersyteckie |
Punkty ECTS i inne: |
3.00
|
Język prowadzenia: | polski |
Wymagania wstępne: | Znajomość matematyki na poziomie szkoły średniej. Podstawowa umiejętność posługiwania się komputerem z systemem Windows. Samodyscyplina, umiejętność gospodarowania własnym czasem, umiejętność czytania ze zrozumieniem tekstów napisanych językiem formalnym, otwartość na nowe wyzwania, świadomość konieczności samodoskonalenia się, odwaga w zadawaniu pytań oraz wypowiadaniu się na forum publicznym. |
Rodzaj przedmiotu: | przedmiot fakultatywny |
Całkowity nakład pracy studenta: | 30 h – zapoznanie się z materiałami dostępnymi na platformie Moodle, 40 h – praca własna: studiowanie literatury, wykonywanie ćwiczeń, rozwiązywanie zadań, 10 h – konsultacje indywidualne z prowadzącym kurs, 10 h – rozwiązywanie testów i zadań zaliczeniowych. Razem: 90 h (3 pkt. ECTS) |
Efekty uczenia się - wiedza: | W1. Rozumie potrzebę pozyskiwania wiedzy z danych. Zna podstawowe problemy eksploracji danych. W2. Zna wybrane algorytmy eksploracji danych i wie, które z nich stosują się do określonego typu zagadnień z tego zakresu. W3. Ma wiedzę na temat dostępnego oprogramowania służącego do eksploracji danych. |
Efekty uczenia się - umiejętności: | U1. Potrafi znaleźć potrzebne dane w zbiorach danych ogólnie dostępnych, umie pobrać dane i poddać je analizie. U2. Umie zaproponować odpowiednie algorytmy eksploracji danych do konkretnego zagadnienia, w tym klasyfikacji, grupowania, szacowania i budowania reguł, oraz wyselekcjonować z ich użyciem najlepszy model. U3. Umie posługiwać się w stopniu podstawowym programem do eksploracji danych PS IMAGO PRO (IBM SPSS Statistics). U4. Potrafi przygotować raport z wynikami swoich analiz. |
Efekty uczenia się - kompetencje społeczne: | K1. Potrafi sformułować problem eksploracji danych w sposób zrozumiały zarówno dla osób, z którymi współpracuje w tym obszarze, jak i ekspertów analityków. K2. Potrafi poddać krytycznej ocenie pozyskane dane. K3. Potrafi czerpać wiedzę z danych i na tej podstawie formułować propozycje rozwiązania sytuacji problemowych. |
Metody dydaktyczne: | - Pokaz (filmy instruktażowe demonstrujące działanie programu), - Pogadanka i wykład informacyjny (nagrania krótkich wykładów dotyczących teorii), - Ćwiczeniowa (testy i zadania zlecone przez prowadzących), - Studium przypadku, metody odnoszące się do autentycznych lub fikcyjnych sytuacji (zbiory danych rzeczywistych i przykłady ich analiz), - Metody wymiany i dyskusji (fora dyskusyjne). |
Metody dydaktyczne eksponujące: | - pokaz |
Metody dydaktyczne podające: | - wykład informacyjny (konwencjonalny) |
Metody dydaktyczne poszukujące: | - ćwiczeniowa |
Metody dydaktyczne w kształceniu online: | - metody wymiany i dyskusji |
Skrócony opis: |
Duże zbiory danych pojawiają się aktualnie w każdym obszarze, w którym gromadzone są informacje. Oznacza to konieczność wykształcenia powszechniej sprawności w pracy z takimi danymi. Celem przedmiotu jest zapoznanie uczestników zajęć z najważniejszymi algorytmami data-miningu oraz wykształcenie umiejętności analizy danych z wykorzystaniem programu PS IMAGO PRO (IBM SPSS Statistics). |
Pełny opis: |
W czasie kursu uczestnik zapozna się z programem PS IMAGO PRO oraz jego możliwościami. Realizowane będą następujące zagadnienia: pozyskiwanie danych i ich wstępna obróbka, statystyka opisowa, eksploracyjna analiza danych, klasyfikacja, drzewa klasyfikacyjno-regresyjne, podstawy sieci neuronowych, regresja liniowa, grupowanie i analiza koszykowa. Każdy temat będzie zawierał krótki wstęp teoretyczny, materiał instruktażowy jak rozwiązać danych problem za pomocą PS IMAGO PRO, przykładowe zbiory danych, ćwiczenia do wykonania i zadania do rozwiązania. |
Literatura: |
Literatura tradycyjna: 1. Bedyńska S., Książek M. (red.): Statystyczny drogowskaz 1. Praktyczne wprowadzenie do wnioskowania statystycznego. Warszawa, Wydawnictwo Akademickie Sedno, 2012. 2. Górniak J., Wachnicki J.: Pierwsze kroki w analizie danych. Kraków, SPSS Polska, 2004. 3. Daniel T. Larose: Odkrywanie wiedzy z danych, Wydawnictwo Naukowe PWN, Warszawa, 2013. 4. Daniel T. Larose: Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, Warszawa, 2012. 5. Tadeusz Morzy: Eksploracja danych. Metody i algorytmy. Wydawnictwo Naukowe PWN, Warszawa, 2013. 6. Bartosz Saramak: Wykorzystanie otwartych źródeł informacji w działalności wywiadowczej: historia, praktyka, perspektywy. WDiNP UW, Warszawa, 2015 (dostępne on-line: https://wnpism.uw.edu.pl/wp-content/uploads/2019/08/Wykorzystanie-otwartych-zrodel.pdf, dostęp z dn. 22.10.2020). 7. Sobczyk M.: Statystyka, Wydanie piąte uzupełnione. Warszawa, Wydawnictwo Naukowe PWN, 2020, str. 12-16. 8. Stephane Tuffery: Data Mining and Statistics for Decision Making. Wiley, 2011. 9. Xindong Wu, Vipin Kumar: The Top Ten Algorithms in Data Mining. Chapman & Holl/CRC, 2009. Zasoby on-line: 1. Biecek P.: Odkrywać! Ujawniać! Objaśniać! Zbiór esejów o sztuce prezentowania danych. http://www.biecek.pl/Eseje/ (dostęp z dn. 23.10.2020). 2. Polska Statystyka Publiczna https://bip.stat.gov.pl/dzialalnosc-statystyki-publicznej/polska-statystyka-publiczna/ (dostęp z dn. 21.10.2020). 3. Strona internetowa Discovering Statistics z tutorialami, filmami i zbiorami danych https://www.discoveringstatistics.com/ (dostęp z dn. 24.08.2020). 4. Strona internetowa IBM Knowledge Center z dokumentacją produktu IBM SPSS Statistics https://www.ibm.com/support/knowledgecenter/pl/SSLVMB_26.0.0/statistics_kc_ddita/spss/product_landing.html (dostęp z dn. 25.08.2020). 5. Predictive Solutions: Samouczek. http://samouczek.predictivesolutions.pl/ (dostęp z dn. 12.09.2020). 6. Predictive Solutions: Blog. https://predictivesolutions.pl/2,blog (dostęp z dn. 29.10.2020). 7. StatSoft: Internetowy Podręcznik Statystyki. https://www.statsoft.pl/textbook/stathome.html (dostęp z dn. 25.10.2020). 8. Strona internetowa Towards Data Science: https://towardsdatascience.com/ (dostęp z dn. 30.10.2020). 9. Portal Sztuczna Inteligencja https://www.sztucznainteligencja.org.pl/ (dostęp z dn. 29.10.2020). 10. Narzędzia doboru kolorów na wykresach: - http://paletton.com (dostęp z dn. 23.10.2020), - https://colorbrewer2.org/ (dostęp z dn. 23.10.2020). 11. Przemysław Biecek: Przewodnik po pakiecie R 4.0 http://pbiecek.github.io/Przewodnik/ (dostęp z dn. 30.10.2020). 12. Strona domowa projektu R https://www.r-project.org/ (dostęp z dn. 27.10.2020). |
Metody i kryteria oceniania: |
- Krótkie testy po każdym z tematów zweryfikują efekty wiedzy W1-W3 i umiejętności U1-U4. - Zadania zweryfikują efekt wiedzy W2, efekty umiejętności U1-U4 oraz efekty kompetencji społecznych K1-K3. |
Praktyki zawodowe: |
Brak |
Zajęcia w cyklu "Semestr letni 2021/22" (zakończony)
Okres: | 2022-02-21 - 2022-09-30 |
Przejdź do planu
PN WT ŚR LAB
CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin, 30 miejsc
|
|
Koordynatorzy: | Mateusz Topolewski | |
Prowadzący grup: | Mateusz Topolewski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
|
Uwagi: |
Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS. |
Zajęcia w cyklu "Semestr letni 2022/23" (zakończony)
Okres: | 2023-02-20 - 2023-09-30 |
Przejdź do planu
PN LAB
WT ŚR CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin, 30 miejsc
|
|
Koordynatorzy: | Mateusz Topolewski | |
Prowadzący grup: | Mateusz Topolewski | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
|
Uwagi: |
Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS. |
Zajęcia w cyklu "Semestr letni 2023/24" (w trakcie)
Okres: | 2024-02-20 - 2024-09-30 |
Przejdź do planu
PN WT LAB
ŚR CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin, 30 miejsc
|
|
Koordynatorzy: | Agnieszka Goroncy | |
Prowadzący grup: | Agnieszka Goroncy | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
|
Uwagi: |
Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS. |
Zajęcia w cyklu "Semestr letni 2024/25" (jeszcze nie rozpoczęty)
Okres: | 2025-02-17 - 2025-09-30 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin, 30 miejsc
|
|
Koordynatorzy: | (brak danych) | |
Prowadzący grup: | Agnieszka Goroncy | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Laboratorium - Zaliczenie na ocenę |
|
Uwagi: |
Zajęcia będą odbywały się zdalnie za pośrednictwem platformy Moodle. Szczegółowe informacje dotyczące dostępu do kursu zostaną przekazane uczestnikom za pośrednictwem poczty systemu USOS. |
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.