Eksploracja danych
Informacje ogólne
Kod przedmiotu: | 1000-MS1-EksDan |
Kod Erasmus / ISCED: |
(brak danych)
/
(0542) Statystyka
|
Nazwa przedmiotu: | Eksploracja danych |
Jednostka: | Wydział Matematyki i Informatyki |
Grupy: |
Mat., sp. nauczycielskie, II st., stacjonarne, przedmioty do wyboru + uzup. stand. kszt. |
Punkty ECTS i inne: |
6.00
|
Język prowadzenia: | polski |
Wymagania wstępne: | Zaliczenie przedmiotów Narzędzia eksploracji danych oraz Statystyka matematyczna |
Całkowity nakład pracy studenta: | Wykład – 30 godz. Laboratorium – 30 godz. Studiowanie literatury i materiałów zamieszczonych przez prowadzących oraz konsultacje z prowadzącymi zajęcia – 30 godz. Przygotowanie do egzaminu – 15 godz. Wykonanie zadań niezbędnych do zaliczenia przedmiotu a polegających na przeprowadzeniu analiz danych – 45 godz. Razem: 150 godz. - 6 punktów ECTS |
Efekty uczenia się - wiedza: | W01 - Zna najważniejsze zagadnienia eksploracji danych dotyczące klasyfikacji, grupowania i szacowania (K_W01, K_W03). W02 - Dla każdego z podstawowych problemów eksploracji danych zna przynajmniej jeden algorytm stosowany do jego rozwiązania (K_W03, K_W06). W03 - Orientuje się w dostępnym na rynku oprogramowaniu do eksploracji danych, zna w stopniu podstawowym przynajmniej jeden taki program (K_W04, K_W07). |
Efekty uczenia się - umiejętności: | U01 - Potrafi znaleźć potrzebne dane w zbiorach danych ogólnie dostępnych, umie pobrać dane i poddać je analizie (K_U21). U02 - Umie zaproponować odpowiednie algorytmy eksploracji danych do konkretnego zagadnienia, w tym klasyfikacji, grupowania, szacowania i budowania reguł, oraz wyselekcjonować z ich użyciem najlepszy model (K_U02, K_U19). U03 - Umie posługiwać się w stopniu podstawowym przynajmniej jednym programem do eksploracji danych (K_U03). U04 - Potrafi przygotować raport z wynikami swoich analiz oraz zastosować zbudowany model do klasyfikacji, szacowania lub przewidywania w oparciu o nowy zbiór danych (K_U05). |
Efekty uczenia się - kompetencje społeczne: | K01 - Potrafi sformułować problem eksploracji danych w sposób zrozumiały zarówno dla osób, z którymi współpracuje w tym obszarze, jak i ekspertów analityków (K_K03). K02 - Potrafi czerpać wiedzę z danych i na tej podstawie formułować propozycje rozwiązania sytuacji problemowych (K_K04). |
Metody dydaktyczne: | Pokaz, wykład informacyjny (konwencjonalny), laboratoryjna, projektu, studium przypadku, metody dydaktyczne odnoszące się do autentycznych lub fikcyjnych sytuacji, metody rozwijające refleksyjne myślenie. |
Metody dydaktyczne eksponujące: | - pokaz |
Metody dydaktyczne podające: | - wykład informacyjny (konwencjonalny) |
Metody dydaktyczne poszukujące: | - laboratoryjna |
Metody dydaktyczne w kształceniu online: | - metody odnoszące się do autentycznych lub fikcyjnych sytuacji |
Skrócony opis: |
Duże zbiory danych pojawiają się aktualnie w każdym obszarze, w którym gromadzone są informacje. Oznacza to konieczność wykształcenia powszechniej sprawności w pracy z takimi danymi. Celem przedmiotu jest zapoznanie uczestników zajęć z najważniejszymi algorytmami data-miningu oraz wykształcenie umiejętności analizy danych z wykorzystaniem dostępnego oprogramowania. |
Pełny opis: |
W czasie zajęć realizowane będą następujące zagadnienia: pozyskiwanie danych i ich wstępna obróbka, statystyka opisowa, eksploracyjna analiza danych, klasyfikacja i algorytmy klasyfikacyjne (k-nn, drzewa decyzyjne i lasy losowe, sieci neuronowe), regresja i algorytmy szacowania (k-nn, drzewa CRT, sieci neuronowe), grupowanie (metodami k średnich, hierarchiczną, dwustopniową analizą skupień, sieciami Kohonena), analiza koszykowa oraz metody redukcji wymiaru. Wszystkie zagadnienia omówione na wykładzie będą następnie ilustrowane ćwiczeniami praktycznymi na zajęciach laboratoryjnych z użyciem środowiska R, języka programowania Python, programów KNIME i IBM SPSS Statistics. |
Literatura: |
Literatura podstawowa: 1. Daniel T. Larose: ,,Odkrywanie wiedzy z danych''. Wydawnictwo Naukowe PWN, Warszawa, 2006. 2. Daniel T. Larose: ,,Metody i modele eksploracji danych''. Wydawnictwo Naukowe PWN, Warszawa, 2012. 3. Ch. D. Larose, D. T. Larose: ,,Data Science Using Python and R''. Wiley, 2019. 4. Aktualna dokumentacja narzędzi informatycznych wykorzystywanych na laboratoriach. Literatura uzupełniająca: 5. Tadeusz Morzy: ,,Eksploracja danych. Metody i algorytmy’’. Wydawnictwo Naukowe PWN, Warszawa, 2013. 6. Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani: ,,An Introduction to Statistical Learning with Applications in R''. IV Edition. Springer, 2014 (dostępne na stronie http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Fourth%20Printing.pdf). 7. Trevor Hastie, Robert Tibshirani, Jerome Friedman: ,,The Elements of Statistical Learning''. Springer, 2009 (dostępne na stronie http://statweb.stanford.edu/~tibs/ElemStatLearn/). 8. Paweł Cichosz: ,,Data Mining Algorithms Explained Using R’’. Wiley, 2015. |
Metody i kryteria oceniania: |
Egzamin pisemny testowy lub ustny (w zależności od sytuacji pandemicznej) – W01, W02 Zaliczenie laboratorium na podstawie m.in. obecności, testów, zadań domowych oraz projektu końcowego – W03, U01-U04, K01, K02 |
Praktyki zawodowe: |
Nie dotyczy |
Zajęcia w cyklu "Semestr zimowy 2021/22" (zakończony)
Okres: | 2021-10-01 - 2022-02-20 |
Przejdź do planu
PN WT ŚR WYK
CZ LAB
PT LAB
|
Typ zajęć: |
Laboratorium, 30 godzin, 16 miejsc
Wykład, 30 godzin, 50 miejsc
|
|
Koordynatorzy: | Joanna Karłowska-Pik | |
Prowadzący grup: | Krzysztof Jasiński, Joanna Karłowska-Pik | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Egzamin
Laboratorium - Zaliczenie na ocenę Wykład - Egzamin |
Zajęcia w cyklu "Semestr zimowy 2022/23" (zakończony)
Okres: | 2022-10-01 - 2023-02-19 |
Przejdź do planu
PN WT WYK
ŚR CZ LAB
PT LAB
|
Typ zajęć: |
Laboratorium, 30 godzin, 16 miejsc
Wykład, 30 godzin, 50 miejsc
|
|
Koordynatorzy: | Joanna Karłowska-Pik | |
Prowadzący grup: | Krzysztof Jasiński, Joanna Karłowska-Pik | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Egzamin
Laboratorium - Zaliczenie na ocenę Wykład - Egzamin |
Zajęcia w cyklu "Semestr zimowy 2023/24" (zakończony)
Okres: | 2023-10-01 - 2024-02-19 |
Przejdź do planu
PN WT ŚR CZ WYK
LAB
PT LAB
|
Typ zajęć: |
Laboratorium, 30 godzin, 16 miejsc
Wykład, 30 godzin, 60 miejsc
|
|
Koordynatorzy: | Joanna Karłowska-Pik | |
Prowadzący grup: | Krzysztof Jasiński, Joanna Karłowska-Pik | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Egzamin
Laboratorium - Zaliczenie na ocenę Wykład - Egzamin |
Zajęcia w cyklu "Semestr zimowy 2024/25" (jeszcze nie rozpoczęty)
Okres: | 2024-10-01 - 2025-02-16 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Laboratorium, 30 godzin, 16 miejsc
Wykład, 30 godzin, 60 miejsc
|
|
Koordynatorzy: | (brak danych) | |
Prowadzący grup: | (brak danych) | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Egzamin
Laboratorium - Zaliczenie na ocenę Wykład - Egzamin |
Właścicielem praw autorskich jest Uniwersytet Mikołaja Kopernika w Toruniu.